Python を使用して PDF からメタデータをクリーンアップする方法

この短いガイドでは、Python を使用して PDF からメタデータをクリーンアップする方法について説明します。開発環境の設定に関する詳細、プログラミング タスクのリスト、Python を使用して PDF メタデータを除去するための実行可能なサンプル コードが含まれています。デフォルトのプロパティを 1 つずつ削除し、すべてのカスタム プロパティをまとめて削除する手順が示されます。

Python を使用して PDF からメタデータを削除する手順

  1. メタデータをクリーンアップするには環境を .NET経由でAspose.PDF for Pythonを使用する に設定します
  2. メタデータを削除するための Document クラスを使用してソース PDF ファイルをロードします
  3. 必要に応じてメタデータ表示機能を作成して利用する
  4. DocumentInfo クラス オブジェクトを使用してメタデータにアクセスする
  5. Remove() メソッドを使用してデフォルトのメタデータをクリアする
  6. カスタムメタデータを削除する
  7. 結果の PDF ファイルを保存します

これらの手順は、Python を使用して PDF からメタデータを削除するプロセスを要約したものです。ソース PDF ファイルを Document クラスにロードし、続いて DocumentInfo を使用してメタデータにアクセスします。デフォルトのプロパティを削除するには、引数としてプロパティ名を指定して Remove() メソッドを呼び出し、clear_custom_data() メソッドを呼び出してすべてのカスタム プロパティを削除します。

Python を使用して PDF メタデータを削除するコード

このコードは、Python を使用して PDF からメタデータを消去する方法を示しています。 DisplayMetadata() メソッドを使用して、オプションで削除前後のメタデータを表示しました。 DocumentInfo.remove() メソッドにはデフォルトのプロパティ名が必要ですが、clear_custom_data() メソッドにはカスタム プロパティを削除するための引数は必要ありません。

この記事では、Python* を使用して PDF *メタデータ削除ツールを開発するプロセスを学習しました。 PDF ファイルのさまざまな制限を解除したい場合は、PythonでPDFドキュメントの制限を解除する方法 の記事を参照してください。

 日本語