JavaでWordファイルから画像を抽出する方法

この簡単なチュートリアルでは、Java で Word ファイルから画像を抽出する方法を学びます。環境を確立するために必要なすべての情報、アプリケーションを作成するための API 使用法の詳細、およびJava で Word 文書から画像を抽出するプロセスを示す実行可能なサンプル コードが含まれています。また、ソース DOCX ファイルを読み込み、そこから PNG、JPEG などのさまざまな画像を抽出する際に、プロセスをカスタマイズするためのさまざまなオプションについても学習します。

Java で Word から画像を抽出する手順

  1. 画像を抽出するためのAspose.Words for Javaを追加する環境を確立します
  2. 画像を含むソース Word ファイルを Document クラス オブジェクトに読み込みます
  3. Document クラスの getChildNodes() メソッドを使用して形状コレクションを取得します
  4. コレクション内のすべての形状を反復処理します
  5. Shape クラスの hasImage() メソッドを使用して、形状に画像があるかどうかを確認します
  6. 画像を別のファイルとしてディスクに保存します

これらの手順では、Java で Word ファイルから画像を抽出する プロセスについて説明します。最初に、環境確立のためにリソースが共有され、続いて Document クラスを使用してソース Word ファイルをロードし、getChildNodes() メソッドを使用してすべてを抽出するなど、タスクを達成するために必要なクラス、メソッド、およびプロパティが紹介されます。そこからの画像。最後に、コレクションの各要素がイメージを持っているかどうかがテストされ、見つかった場合は個別のイメージ ファイルとしてディスクに保存されます。

Java で Word 文書から画像を抽出するコード

このサンプル コードは、Java で Word 文書からすべての画像を抽出する プロセスを示しています。ソース Word ファイルをロードした後、 getChildNodes() メソッドを使用して NodeType.SHAPE 値を引数として指定します。この値はドキュメント内のすべての形状のセットを返します。これは、Shape クラスに画像の存在を確認する hasImage() メソッドがあるためです。 .画像が検出されると、その拡張子が shape.getImageData().getImageType() を使用して取得され、タイプに基づいて画像をフィルタリングするオプションと共に出力画像名で使用されます。

このチュートリアルでは、Java を使用して MS Word に画像を挿入する方法を学びました。 Word 文書をゼロから作成する方法を知りたい場合は、Javaを使用してWord文書を作成する方法 の記事を参照してください。

 日本語