Deze tutorial beschrijft hoe u gegevens van een PDF-formulier naar Excel kunt exporteren met Java. Het bevat informatie over het instellen van de IDE, een stappenplan en een voorbeeldcode om gegevens uit een invulbaar PDF-formulier naar Excel te extraheren met Java. U krijgt details over het exporteren van PDF-formuliergegevens naar een XML-bestand en het vervolgens laden van het XML-bestand in een Workbook om het op te slaan als een XLSX-bestand.
Stappen om PDF-velden naar Excel te exporteren met Java
- Stel de IDE in voor het gebruik van Aspose.PDF en Aspose.Cells voor Java om PDF-formuliergegevens te exporteren
- Gebruik het Form-object van Aspose.PDF om het PDF-bestand met formuliervelden te laden
- Roep de Form.bindPdf()-methode aan om de PDF aan het Form-object te koppelen
- Maak de FileOutputStream voor het uitvoer-XML-bestand
- Roep de Form.exportXml()-methode aan om formuliergegevens op te halen en in het XML-bestand te plaatsen
- Gebruik het XmlLoadOptions-object van Aspose.Cells API om het XML-bestand te laden
- Laad het Workbook-klasseobject om het XML-bestand te laden en op te slaan als een XLSX-bestand
De bovenstaande stappen vatten samen hoe u PDF-velden naar Excel kunt extraheren met Java. Eerst worden de PDF-formuliergegevens overgebracht naar een XML-bestand met behulp van de Aspose.PDF API, die een Form.exportXml()-methode heeft voor dit doel. Ten slotte wordt de Aspose.Cells API gebruikt om dit XML-bestand in een Workbook-object te laden en op te slaan als een Excel-bestand in XLSX-formaat.
Code om gegevens van een PDF-formulier naar Excel te extraheren met Java
import com.aspose.pdf.Document; | |
import com.aspose.pdf.Field; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.WidgetAnnotation; | |
import com.aspose.pdf.facades.Form; | |
import com.aspose.cells.Workbook; | |
import com.aspose.cells.XmlLoadOptions; | |
import com.aspose.cells.SaveFormat; | |
import java.io.File; | |
import java.io.FileOutputStream; | |
import java.io.FileInputStream; | |
import java.io.IOException; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Set license for Aspose.PDF | |
License pdfLic = new License(); | |
try { | |
pdfLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
// Set license for Aspose.Cells | |
com.aspose.cells.License cellsLic = new com.aspose.cells.License(); | |
try { | |
cellsLic.setLicense("license.lic"); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
ExportDataToXml(); | |
ConvertXmlToXlsx(); | |
} | |
public static void ExportDataToXml() { | |
try { | |
Form pdfForm = new Form(); | |
pdfForm.bindPdf("TextBox_out.pdf"); | |
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml")); | |
pdfForm.exportXml(xmlOutputStream); | |
xmlOutputStream.close(); | |
} catch (IOException e) { | |
e.printStackTrace(); | |
} | |
} | |
public static void ConvertXmlToXlsx() { | |
try { | |
XmlLoadOptions options = new XmlLoadOptions(); | |
options.setCheckDataValid(true); | |
Workbook wb = new Workbook("input.xml", options); | |
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX); | |
} catch (Exception e) { | |
e.printStackTrace(); | |
} | |
} | |
} |
De bovenstaande code laat zien hoe u gegevens van een invulbaar PDF-formulier naar Excel kunt exporteren met Java. Het stelt ontwikkelaars in staat om het laden van het uitvoer-XML-bestand aan te passen met behulp van verschillende methoden en eigenschappen in het XmlLoadOptions-object. U kunt ook de setLoadFilter(LoadFilter value)-methode gebruiken om gegevens te filteren tijdens het laden vanuit het XML-bestand.
Dit artikel heeft ons het proces geleerd om PDF-formuliergegevens naar een Excel-bestand te converteren. Raadpleeg het artikel over het Extraheren van gegevens uit een PDF-formulier met Java om een geselecteerd formulierveld van een specifieke pagina te extraheren.