Exportera data från ett PDF-formulär till Excel med Java

Den här guiden beskriver hur du exporterar data från ett PDF-formulär till Excel med Java. Den innehåller information om hur du konfigurerar IDE, en steg-för-steg-guide och ett kodexempel för att extrahera data från ett ifyllbart PDF-formulär till Excel med Java. Du får lära dig att exportera PDF-formulärdata till en XML-fil och sedan ladda XML-filen i en Workbook-instans för att spara den som en XLSX-fil.

Steg för att exportera PDF-fält till Excel med Java

  1. Konfigurera IDE för att använda Aspose.PDF och Aspose.Cells för Java för att exportera PDF-formulärdata.
  2. Använd Form-objektet från Aspose.PDF för att ladda PDF-filen med formulärfält.
  3. Anropa metoden Form.bindPdf() för att länka PDF-filen till Form-objektet.
  4. Skapa en FileOutputStream för XML-utdatafilen.
  5. Anropa metoden Form.exportXml() för att hämta formulärdata och fylla i XML-filen.
  6. Använd XmlLoadOptions-objektet från Aspose.Cells API för att ladda XML-filen.
  7. Ladda Workbook-klassen för att öppna XML-filen och spara den som en XLSX-fil.

Dessa steg sammanfattar hur du extraherar PDF-fält och konverterar dem till Excel med Java. Först exporteras PDF-formulärdata till en XML-fil med metoden Form.exportXml() från Aspose.PDF. Därefter används Aspose.Cells API för att ladda XML-filen i en Workbook-instans och spara den i Excel-formatet XLSX.

Kod för att extrahera data från ett PDF-formulär till Excel med Java

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

Koden ovan demonstrerar hur du exporterar data från ett ifyllbart PDF-formulär till Excel med Java. Utvecklare kan anpassa inläsningen av XML-utdatafilen med olika metoder och egenskaper i XmlLoadOptions-objektet. Du kan också använda metoden setLoadFilter(LoadFilter value) för att filtrera data när den laddas från XML-filen.

Den här artikeln har beskrivit processen för att konvertera PDF-formulärdata till en Excel-fil. Om du vill extrahera ett specifikt formulärfält från en viss sida, se artikeln om hur du extraherar data från ett PDF-formulär med Java.

 Svenska