Exporter des données d’un formulaire PDF vers Excel avec Java

Ce tutoriel explique comment exporter des données d’un PDF vers Excel avec Java. Il détaille la configuration de l’IDE, la liste des étapes et un exemple de code permettant d’extraire des données d’un formulaire PDF remplissable vers Excel avec Java. Vous découvrirez comment exporter les données d’un formulaire PDF vers un fichier XML, puis charger ce fichier XML dans un Workbook pour l’enregistrer en tant que fichier XLSX.

Étapes pour exporter des champs PDF vers Excel avec Java

  1. Configurer l’IDE pour utiliser Aspose.PDF et Aspose.Cells pour Java afin d’exporter les données du formulaire PDF
  2. Utiliser l’objet Form d’Aspose.PDF pour charger le fichier PDF contenant les champs du formulaire
  3. Appeler la méthode Form.bindPdf() pour lier le PDF à l’objet Form
  4. Créer un FileOutputStream pour le fichier XML de sortie
  5. Appeler la méthode Form.exportXml() pour récupérer les données du formulaire et les enregistrer dans le fichier XML
  6. Utiliser l’objet XmlLoadOptions de l’API Aspose.Cells pour charger le fichier XML
  7. Charger l’objet Workbook pour ouvrir le fichier XML et l’enregistrer sous forme de fichier XLSX

Ces étapes résument comment extraire des champs PDF vers Excel avec Java. Tout d’abord, exportez les données du formulaire PDF vers un fichier XML à l’aide de l’API Aspose.PDF et de la méthode Form.exportXml(). Ensuite, utilisez l’API Aspose.Cells pour charger ce fichier XML dans un objet Workbook et l’enregistrer au format Excel (XLSX).

Code pour extraire des données d’un formulaire PDF vers Excel avec Java

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

Le code ci-dessus démontre comment exporter des données d’un formulaire PDF remplissable vers Excel avec Java. Il permet aux développeurs de personnaliser le chargement du fichier XML de sortie grâce aux différentes méthodes et propriétés de l’objet XmlLoadOptions. Vous pouvez également utiliser la méthode setLoadFilter(LoadFilter value) pour filtrer les données lors du chargement du fichier XML.

Cet article nous a montré comment convertir les données d’un formulaire PDF en fichier Excel. Pour extraire un champ spécifique d’un formulaire à partir d’une page particulière, consultez l’article sur l’extraction de données d’un formulaire PDF avec Java.

 Français