この簡単なチュートリアルは、ソースPDFファイルをロードしてWordファイルとして保存することにより、PDFをJavaでWordに変換する方法をガイドするように設計されています。 ** JavaでPDFからWordへのコンバーター**を記述している間、ソースPDFファイルの読み取りを制御できます。同様に、出力されるWord DOCファイルも、その特性を設定することでカスタマイズできます。
Javaを使用してPDFをWordに変換する手順
- MavenリポジトリからAspose.PDFを追加してプロジェクトを構成し、PDFをWordファイルに変換します
- ソースPDFファイルをDocumentクラスオブジェクトにロードして、Wordファイルに変換します
- DocSaveOptionsクラスオブジェクトをインスタンス化して、出力Wordファイルを構成します
- 出力Wordファイルタイプと認識モードを定義して、将来の編集モードを設定します
- 水平近接や弾丸認識フラグなどのソースPDFファイル読み取りパラメータを設定します
- DocSaveOptionsオブジェクトで指定された構成を使用して、出力Wordファイルを保存します
上記の手順では、Mavenリポジトリから必要なライブラリを特定し、操作シーケンスを段階的に実行することにより、Javaを使用してPDFからWordへのコンバーターを設計するプロセスについて説明します。ソースPDFファイルがDocumentクラスオブジェクトにロードされ、DocSaveOptionsクラスオブジェクトが初期化されて、ソースPDFファイルからの読み取り操作を制御し、出力Wordファイルのパラメータを設定します。出力Wordファイルは、DocSaveOptionsクラスオブジェクトで構成されているMSWordでサポートされている任意のファイル形式で保存できます。
Javaを使用してPDFをWordに変換するコード
package AsposePdf; | |
import com.aspose.pdf.DocSaveOptions; | |
import com.aspose.pdf.Document; | |
import com.aspose.pdf.ExcelSaveOptions; | |
import com.aspose.pdf.License; | |
public class ConvertPdfToWordInJava { | |
public static void main(String[] args) throws Exception { // main method to convert a PDF document to Word file format | |
// Instantiate the license to avoid trial limitations while converting the PDF to word file | |
License asposePdfLicenseDoc = new License(); | |
asposePdfLicenseDoc.setLicense("Aspose.pdf.lic"); | |
// Load the source PDF file that is to be converted to Word file | |
Document convertPDFDocumentToWord = new Document("input.pdf"); | |
// Initialize the DocSaveOptions class object to configure output word file | |
DocSaveOptions docSaveOptions = new DocSaveOptions(); | |
// Define the type of output Word file | |
docSaveOptions.setFormat(DocSaveOptions.DocFormat.Doc); | |
// Set the recognition mode to Flow for enabling it for editing in future | |
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow); | |
// Set the Horizontal proximity that defines width of space between text elements as 2.5 | |
docSaveOptions.setRelativeHorizontalProximity(2.5f); | |
// Switch on the recognition of bullets from the source PDF | |
docSaveOptions.setRecognizeBullets(true); | |
// Convert PDF to Word using the Document class function save | |
convertPDFDocumentToWord.save("output.doc", docSaveOptions); | |
System.out.println("Done"); | |
} | |
} |
PDFをWordJavaコードに変換するには、プログラムで使用される必要なクラスをインポートし、ディスクからソースPDFファイルをロードします。 DocSaveOptionsクラスは、DOCまたはDOCXのいずれかである出力Wordファイルタイプの定義、編集可能な出力Wordファイルを作成するためのフラグの設定、箇条書きを認識するためのフラグの設定、変換された変換の水平および垂直解像度の設定など、多くのパラメーターの設定をサポートします。画像、その他多数。
ここでは、サンプルコードを使用して、JavaでPDFをWordに変換する方法を学びました。 PDFをExcelに変換するプロセスを学びたい場合は、JavaでPDFをExcelに変換する方法の記事を参照してください。