この短いガイドでは、Python を使用して PDF からメタデータをクリーンアップする方法について説明します。開発環境の設定に関する詳細、プログラミング タスクのリスト、Python を使用して PDF メタデータを除去するための実行可能なサンプル コードが含まれています。デフォルトのプロパティを 1 つずつ削除し、すべてのカスタム プロパティをまとめて削除する手順が示されます。
Python を使用して PDF からメタデータを削除する手順
- メタデータをクリーンアップするには環境を .NET経由でAspose.PDF for Pythonを使用する に設定します
- メタデータを削除するための Document クラスを使用してソース PDF ファイルをロードします
- 必要に応じてメタデータ表示機能を作成して利用する
- DocumentInfo クラス オブジェクトを使用してメタデータにアクセスする
- Remove() メソッドを使用してデフォルトのメタデータをクリアする
- カスタムメタデータを削除する
- 結果の PDF ファイルを保存します
これらの手順は、Python を使用して PDF からメタデータを削除するプロセスを要約したものです。ソース PDF ファイルを Document クラスにロードし、続いて DocumentInfo を使用してメタデータにアクセスします。デフォルトのプロパティを削除するには、引数としてプロパティ名を指定して Remove() メソッドを呼び出し、clear_custom_data() メソッドを呼び出してすべてのカスタム プロパティを削除します。
Python を使用して PDF メタデータを削除するコード
このコードは、Python を使用して PDF からメタデータを消去する方法を示しています。 DisplayMetadata() メソッドを使用して、オプションで削除前後のメタデータを表示しました。 DocumentInfo.remove() メソッドにはデフォルトのプロパティ名が必要ですが、clear_custom_data() メソッドにはカスタム プロパティを削除するための引数は必要ありません。
この記事では、Python* を使用して PDF *メタデータ削除ツールを開発するプロセスを学習しました。 PDF ファイルのさまざまな制限を解除したい場合は、PythonでPDFドキュメントの制限を解除する方法 の記事を参照してください。