このガイドに従って、Python を使用して PDF ドキュメントを比較してください。ここでは、環境構成、段階的なアルゴリズム、Python を使用して 2 つの PDF ファイルを比較するための実行可能なコード スニペットについて説明します。さらに、アプリケーションでこの機能を使用するために Adobe Acrobat や Microsoft Word をインストールする必要はありません。
Python で PDF ドキュメントを比較する手順
- Python を使用して PDF ドキュメントを比較するには、.NET 経由の Python 用 Aspose.Words をインストールして環境を構成します
- Document クラスを使用して最初の PDF ファイルを読み込みます
- 2 番目の PDF ドキュメントにアクセスして比較します
- 比較に必要なプロパティを指定します
- CompareOptions クラス オブジェクトを指定して両方の PDF ドキュメントを比較します
- Save 類似点と相違点を含む比較結果の PDF ドキュメント
これらの手順では、Python を使用して PDF を比較する全体的なアルゴリズムを正確に説明しています。このプロセスは、ソース PDF ドキュメントをロードすることで開始されます。次に、比較のオプションを設定し、出力ドキュメントをレンダリングしながらプロセスが終了します。
Python を使用して PDF ドキュメントを比較するコード
このサンプル コード スニペットは、Python を使用して PDF ファイルを比較するために開発されています。これは、Document クラスを利用して、さまざまな PDF ファイルをロードします。次に、CompareOptions クラス オブジェクトを使用して、要件に基づいてテキスト ボックス、ヘッダー フッター、書式設定の無視などのさまざまなプロパティを設定します。最後に、compare() メソッドで PDF ファイルを比較し、save() メソッドで出力結果をファイルにエクスポートします。
この記事では、Python を使用して 2 つの PDF を比較して違いを確認する方法について説明します。ただし、Word 文書の類似点または相違点を見つけたい場合は、記事 Python を使用して Word 文書を比較する を参照してください。