この短いガイドでは、Python を使用して PDF からメタデータをクリーンアップする方法について説明します。開発環境の設定に関する詳細、プログラミング タスクのリスト、Python を使用して PDF メタデータを除去するための実行可能なサンプル コードが含まれています。デフォルトのプロパティを 1 つずつ削除し、すべてのカスタム プロパティをまとめて削除する手順が示されます。
Python を使用して PDF からメタデータを削除する手順
- メタデータをクリーンアップするには環境を .NET経由でAspose.PDF for Pythonを使用する に設定します
- メタデータを削除するための Document クラスを使用してソース PDF ファイルをロードします
- 必要に応じてメタデータ表示機能を作成して利用する
- DocumentInfo クラス オブジェクトを使用してメタデータにアクセスする
- Remove() メソッドを使用してデフォルトのメタデータをクリアする
- カスタムメタデータを削除する
- 結果の PDF ファイルを保存します
これらの手順は、Python を使用して PDF からメタデータを削除するプロセスを要約したものです。ソース PDF ファイルを Document クラスにロードし、続いて DocumentInfo を使用してメタデータにアクセスします。デフォルトのプロパティを削除するには、引数としてプロパティ名を指定して Remove() メソッドを呼び出し、clear_custom_data() メソッドを呼び出してすべてのカスタム プロパティを削除します。
Python を使用して PDF メタデータを削除するコード
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("License.lic") | |
def DisplayMetadata(info): | |
print(f"title:{info.title}") | |
print(f"author:{info.author}") | |
try: | |
print(f"creation_date:{info.creation_date}") | |
except: | |
print("creation_date is empty") | |
print(f"creator:{info.creator}") | |
try: | |
print(f"mod_date:{info.mod_date}") | |
except: | |
print("mod_date is empty") | |
print(f"producer:{info.producer}") | |
print(f"subject:{info.subject}") | |
# Open document | |
pdfDocument = pdf.Document("Sample.pdf") | |
# Access the metadata | |
info = pdf.DocumentInfo(pdfDocument) | |
DisplayMetadata(info) | |
# Clear the default metadata | |
info.remove("Title") |
このコードは、Python を使用して PDF からメタデータを消去する方法を示しています。 DisplayMetadata() メソッドを使用して、オプションで削除前後のメタデータを表示しました。 DocumentInfo.remove() メソッドにはデフォルトのプロパティ名が必要ですが、clear_custom_data() メソッドにはカスタム プロパティを削除するための引数は必要ありません。
この記事では、Python* を使用して PDF *メタデータ削除ツールを開発するプロセスを学習しました。 PDF ファイルのさまざまな制限を解除したい場合は、PythonでPDFドキュメントの制限を解除する方法 の記事を参照してください。