このガイドに従って、Python を使用して PDF ドキュメントを比較してください。ここでは、環境構成、段階的なアルゴリズム、Python を使用して 2 つの PDF ファイルを比較するための実行可能なコード スニペットについて説明します。さらに、アプリケーションでこの機能を使用するために Adobe Acrobat や Microsoft Word をインストールする必要はありません。
Python で PDF ドキュメントを比較する手順
- Python を使用して PDF ドキュメントを比較するには、.NET 経由の Python 用 Aspose.Words をインストールして環境を構成します
- Document クラスを使用して最初の PDF ファイルを読み込みます
- 2 番目の PDF ドキュメントにアクセスして比較します
- 比較に必要なプロパティを指定します
- CompareOptions クラス オブジェクトを指定して両方の PDF ドキュメントを比較します
- Save 類似点と相違点を含む比較結果の PDF ドキュメント
これらの手順では、Python を使用して PDF を比較する全体的なアルゴリズムを正確に説明しています。このプロセスは、ソース PDF ドキュメントをロードすることで開始されます。次に、比較のオプションを設定し、出力ドキュメントをレンダリングしながらプロセスが終了します。
Python を使用して PDF ドキュメントを比較するコード
import aspose.words | |
from aspose.words import * | |
from datetime import datetime | |
# Create a Document class object | |
docA = Document("Compare1.pdf") | |
docB = Document("Compare2.pdf") | |
# Create CompareOptions class object | |
options = comparing.CompareOptions() | |
options.target = comparing.ComparisonTargetType.NEW | |
# Compare Word documents | |
docA.compare(docB, "Author", datetime.now(), options) | |
# Save the document | |
docA.save("Comparison_Output.pdf") | |
print ("PDF files compared successfully") |
このサンプル コード スニペットは、Python を使用して PDF ファイルを比較するために開発されています。これは、Document クラスを利用して、さまざまな PDF ファイルをロードします。次に、CompareOptions クラス オブジェクトを使用して、要件に基づいてテキスト ボックス、ヘッダー フッター、書式設定の無視などのさまざまなプロパティを設定します。最後に、compare() メソッドで PDF ファイルを比較し、save() メソッドで出力結果をファイルにエクスポートします。
この記事では、Python を使用して 2 つの PDF を比較して違いを確認する方法について説明します。ただし、Word 文書の類似点または相違点を見つけたい場合は、記事 Python を使用して Word 文書を比較する を参照してください。