Javaを使用してPDFフォームからExcelにデータをエクスポートする

このチュートリアルでは、Javaを使用してPDFフォームからExcelにデータをエクスポートする方法を説明します。IDEの設定、手順のリスト、およびJavaを使用して入力可能なPDFからデータを抽出しExcelにエクスポートするサンプルコードが含まれています。PDFフォームデータをXMLファイルにエクスポートし、そのXMLファイルをWorkbookにロードしてXLSXファイルとして保存する方法についての詳細を確認できます。

Javaを使用してPDFフィールドをExcelにエクスポートする手順

  1. Aspose.PDFおよびAspose.Cells for Javaを使用してPDFフォームデータをエクスポートするためにIDEを設定する
  2. Aspose.PDFのFormオブジェクトを使用して、フォームフィールドを含むPDFファイルをロードする
  3. Form.bindPdf()メソッドを使用して、PDFをFormオブジェクトにリンクする
  4. 出力XMLファイルのFileOutputStreamを作成する
  5. Form.exportXml()メソッドを呼び出して、フォームデータを取得しXMLファイルに保存する
  6. Aspose.Cells APIのXmlLoadOptionsオブジェクトを使用してXMLファイルをロードする
  7. WorkbookクラスオブジェクトをロードしてXMLファイルを読み込み、XLSXファイルとして保存する

上記の手順は、Javaを使用してPDFフィールドをExcelに抽出する方法をまとめたものです。最初に、Aspose.PDF APIを使用してPDFフォームデータをXMLファイルに転送します。このAPIには、Form.exportXml()メソッドが用意されています。最後に、Aspose.Cells APIを使用してこのXMLファイルをWorkbookオブジェクトにロードし、Excelファイル形式のXLSXとして保存します。

Javaを使用してPDFフォームからデータを抽出しExcelにエクスポートするコード

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

上記のコードは、Javaを使用して入力可能なPDFからデータをExcelにエクスポートする方法を示しています。XmlLoadOptionsオブジェクトのさまざまなメソッドとプロパティを使用して、出力XMLファイルのロードをカスタマイズできます。また、setLoadFilter(LoadFilter value)メソッドを使用して、XMLファイルからデータをロードする際にフィルタリングすることもできます。

この記事では、PDFフォームデータをExcelファイルに変換するプロセスを学びました。特定のページから選択したフォームフィールドを抽出するには、Javaを使用してPDFフォームからデータを抽出するの記事を参照してください。

 日本語