このトピックでは、構成手順と実行可能なサンプル コードを使用して、Python で PDF から画像を取得する方法 について詳しく説明します。 PNG、JPEG などのさまざまな形式で Python で PDF から画像を取得する ために必要なすべてのクラスとメソッドが提供されているため、このアプリケーションの開発に利用できる完全なプログラム コードが共有されています。また、PDF ファイルからアクセスした後、生成された画像をカスタマイズすることで、プロセスを強化するさまざまなオプションも確認できます。
Python で PDF 画像を取得する手順
- .NET 経由の Python 用 Aspose.PDF を使用して PDF から画像を抽出するように IDE を構成する
- Document クラス オブジェクトを使用して、画像を含むソース PDF ファイルにアクセスします。
- XImage クラス オブジェクトを使用して、ページ リソース内の特定の画像にアクセスします
- 目的のイメージの名前を使用して新しいファイル ストリームを生成します
- イメージを JPEG ファイルとしてディスクに保存します。
これらの手順には、Python で PDF から画像を取得する方法 が含まれます。最初にソース PDF ファイルを開き、次に PDF 内の特定のページにアクセスする段階的なアプローチを公開します。各 PDF ページには、インデックスを使用して参照できる画像を含むリソースのコレクションがあります。 XImage クラス オブジェクトのインスタンスを使用して必要な画像参照にアクセスすると、メモリ ストリームのインスタンスを使用してディスク上に画像として保存できます。
Python で PDF から画像を取得するコード
このコードは、Python で PDF から画像を取得する 手順を示しています。これは、Document クラス オブジェクトにアクセスしてから、リソースのリストにアクセスして、特定のページ上の目的の画像にアクセスすることによってロードされます。目的の画像にアクセスしたら、名前を変更したり、ドキュメント内の参照を変更したりできます。名前、幅、高さなどのさまざまなプロパティにアクセスして、画像をディスクにファイルとして保存する前にフィルター処理することもできます。
この例では、PDF ページから画像を抽出する方法を説明しました。 PDF ファイルに透かしを追加するプロセスについて知りたい場合は、PythonでPDFに透かしを追加する方法 の記事を参照してください。