Gegevens exporteren van een PDF-formulier naar Excel met Java

Deze tutorial beschrijft hoe u gegevens van een PDF-formulier naar Excel kunt exporteren met Java. Het bevat informatie over het instellen van de IDE, een stappenplan en een voorbeeldcode om gegevens uit een invulbaar PDF-formulier naar Excel te extraheren met Java. U krijgt details over het exporteren van PDF-formuliergegevens naar een XML-bestand en het vervolgens laden van het XML-bestand in een Workbook om het op te slaan als een XLSX-bestand.

Stappen om PDF-velden naar Excel te exporteren met Java

  1. Stel de IDE in voor het gebruik van Aspose.PDF en Aspose.Cells voor Java om PDF-formuliergegevens te exporteren
  2. Gebruik het Form-object van Aspose.PDF om het PDF-bestand met formuliervelden te laden
  3. Roep de Form.bindPdf()-methode aan om de PDF aan het Form-object te koppelen
  4. Maak de FileOutputStream voor het uitvoer-XML-bestand
  5. Roep de Form.exportXml()-methode aan om formuliergegevens op te halen en in het XML-bestand te plaatsen
  6. Gebruik het XmlLoadOptions-object van Aspose.Cells API om het XML-bestand te laden
  7. Laad het Workbook-klasseobject om het XML-bestand te laden en op te slaan als een XLSX-bestand

De bovenstaande stappen vatten samen hoe u PDF-velden naar Excel kunt extraheren met Java. Eerst worden de PDF-formuliergegevens overgebracht naar een XML-bestand met behulp van de Aspose.PDF API, die een Form.exportXml()-methode heeft voor dit doel. Ten slotte wordt de Aspose.Cells API gebruikt om dit XML-bestand in een Workbook-object te laden en op te slaan als een Excel-bestand in XLSX-formaat.

Code om gegevens van een PDF-formulier naar Excel te extraheren met Java

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

De bovenstaande code laat zien hoe u gegevens van een invulbaar PDF-formulier naar Excel kunt exporteren met Java. Het stelt ontwikkelaars in staat om het laden van het uitvoer-XML-bestand aan te passen met behulp van verschillende methoden en eigenschappen in het XmlLoadOptions-object. U kunt ook de setLoadFilter(LoadFilter value)-methode gebruiken om gegevens te filteren tijdens het laden vanuit het XML-bestand.

Dit artikel heeft ons het proces geleerd om PDF-formuliergegevens naar een Excel-bestand te converteren. Raadpleeg het artikel over het Extraheren van gegevens uit een PDF-formulier met Java om een geselecteerd formulierveld van een specifieke pagina te extraheren.

 Nederlands