このチュートリアルでは、Javaを使用してPDFフォームからExcelにデータをエクスポートする方法を説明します。IDEの設定、手順のリスト、およびJavaを使用して入力可能なPDFからデータを抽出しExcelにエクスポートするサンプルコードが含まれています。PDFフォームデータをXMLファイルにエクスポートし、そのXMLファイルをWorkbookにロードしてXLSXファイルとして保存する方法についての詳細を確認できます。
Javaを使用してPDFフィールドをExcelにエクスポートする手順
- Aspose.PDFおよびAspose.Cells for Javaを使用してPDFフォームデータをエクスポートするためにIDEを設定する
- Aspose.PDFのFormオブジェクトを使用して、フォームフィールドを含むPDFファイルをロードする
- Form.bindPdf()メソッドを使用して、PDFをFormオブジェクトにリンクする
- 出力XMLファイルのFileOutputStreamを作成する
- Form.exportXml()メソッドを呼び出して、フォームデータを取得しXMLファイルに保存する
- Aspose.Cells APIのXmlLoadOptionsオブジェクトを使用してXMLファイルをロードする
- WorkbookクラスオブジェクトをロードしてXMLファイルを読み込み、XLSXファイルとして保存する
上記の手順は、Javaを使用してPDFフィールドをExcelに抽出する方法をまとめたものです。最初に、Aspose.PDF APIを使用してPDFフォームデータをXMLファイルに転送します。このAPIには、Form.exportXml()メソッドが用意されています。最後に、Aspose.Cells APIを使用してこのXMLファイルをWorkbookオブジェクトにロードし、Excelファイル形式のXLSXとして保存します。
Javaを使用してPDFフォームからデータを抽出しExcelにエクスポートするコード
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
上記のコードは、Javaを使用して入力可能なPDFからデータをExcelにエクスポートする方法を示しています。XmlLoadOptionsオブジェクトのさまざまなメソッドとプロパティを使用して、出力XMLファイルのロードをカスタマイズできます。また、setLoadFilter(LoadFilter value)メソッドを使用して、XMLファイルからデータをロードする際にフィルタリングすることもできます。
この記事では、PDFフォームデータをExcelファイルに変換するプロセスを学びました。特定のページから選択したフォームフィールドを抽出するには、Javaを使用してPDFフォームからデータを抽出するの記事を参照してください。