JavaでPDFをWordに変換する方法

この簡単なチュートリアルは、ソースPDFファイルをロードしてWordファイルとして保存することにより、PDFをJavaでWordに変換する方法をガイドするように設計されています。 ** JavaでPDFからWordへのコンバーター**を記述している間、ソースPDFファイルの読み取りを制御できます。同様に、出力されるWord DOCファイルも、その特性を設定することでカスタマイズできます。

Javaを使用してPDFをWordに変換する手順

  1. MavenリポジトリからAspose.PDFを追加してプロジェクトを構成し、PDFをWordファイルに変換します
  2. ソースPDFファイルをDocumentクラスオブジェクトにロードして、Wordファイルに変換します
  3. DocSaveOptionsクラスオブジェクトをインスタンス化して、出力Wordファイルを構成します
  4. 出力Wordファイルタイプと認識モードを定義して、将来の編集モードを設定します
  5. 水平近接や弾丸認識フラグなどのソースPDFファイル読み取りパラメータを設定します
  6. DocSaveOptionsオブジェクトで指定された構成を使用して、出力Wordファイルを保存します

上記の手順では、Mavenリポジトリから必要なライブラリを特定し、操作シーケンスを段階的に実行することにより、Javaを使用してPDFからWordへのコンバーターを設計するプロセスについて説明します。ソースPDFファイルがDocumentクラスオブジェクトにロードされ、DocSaveOptionsクラスオブジェクトが初期化されて、ソースPDFファイルからの読み取り操作を制御し、出力Wordファイルのパラメータを設定します。出力Wordファイルは、DocSaveOptionsクラスオブジェクトで構成されているMSWordでサポートされている任意のファイル形式で保存できます。

Javaを使用してPDFをWordに変換するコード

package AsposePdf;
import com.aspose.pdf.DocSaveOptions;
import com.aspose.pdf.Document;
import com.aspose.pdf.ExcelSaveOptions;
import com.aspose.pdf.License;
public class ConvertPdfToWordInJava {
public static void main(String[] args) throws Exception { // main method to convert a PDF document to Word file format
// Instantiate the license to avoid trial limitations while converting the PDF to word file
License asposePdfLicenseDoc = new License();
asposePdfLicenseDoc.setLicense("Aspose.pdf.lic");
// Load the source PDF file that is to be converted to Word file
Document convertPDFDocumentToWord = new Document("input.pdf");
// Initialize the DocSaveOptions class object to configure output word file
DocSaveOptions docSaveOptions = new DocSaveOptions();
// Define the type of output Word file
docSaveOptions.setFormat(DocSaveOptions.DocFormat.Doc);
// Set the recognition mode to Flow for enabling it for editing in future
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// Set the Horizontal proximity that defines width of space between text elements as 2.5
docSaveOptions.setRelativeHorizontalProximity(2.5f);
// Switch on the recognition of bullets from the source PDF
docSaveOptions.setRecognizeBullets(true);
// Convert PDF to Word using the Document class function save
convertPDFDocumentToWord.save("output.doc", docSaveOptions);
System.out.println("Done");
}
}

PDFをWordJavaコードに変換するには、プログラムで使用される必要なクラスをインポートし、ディスクからソースPDFファイルをロードします。 DocSaveOptionsクラスは、DOCまたはDOCXのいずれかである出力Wordファイルタイプの定義、編集可能な出力Wordファイルを作成するためのフラグの設定、箇条書きを認識するためのフラグの設定、変換された変換の水平および垂直解像度の設定など、多くのパラメーターの設定をサポートします。画像、その他多数。

ここでは、サンプルコードを使用して、JavaでPDFをWordに変換する方法を学びました。 PDFをExcelに変換するプロセスを学びたい場合は、JavaでPDFをExcelに変換する方法の記事を参照してください。

 日本語