Exportar datos de un formulario PDF a Excel usando Java

Este tutorial describe cómo exportar datos de un formulario PDF a Excel usando Java. Contiene información para configurar el IDE, una lista de pasos y un código de ejemplo para extraer datos de un PDF rellenable a Excel usando Java. Obtendrás detalles para exportar los datos del formulario PDF a un archivo XML y luego cargar el archivo XML en un Workbook para guardarlo como un archivo XLSX.

Pasos para exportar campos de PDF a Excel usando Java

  1. Configura el IDE para usar Aspose.PDF y Aspose.Cells para Java y exportar datos de un formulario PDF
  2. Usa el objeto Form de Aspose.PDF para cargar el archivo PDF con campos de formulario
  3. Invoca el método Form.bindPdf() para vincular el PDF con el objeto Form
  4. Crea el FileOutputStream para el archivo XML de salida
  5. Llama al método Form.exportXml() para obtener los datos del formulario y guardarlos en el archivo XML
  6. Usa el objeto XmlLoadOptions de Aspose.Cells API para cargar el archivo XML
  7. Carga el objeto de la clase Workbook para cargar el archivo XML y guardarlo como un archivo XLSX

Los pasos anteriores resumen cómo extraer campos de PDF a Excel usando Java. Inicialmente, transfiere los datos del formulario PDF a un archivo XML usando Aspose.PDF API, que tiene un método Form.exportXml() para este propósito. Finalmente, usa Aspose.Cells API para cargar este archivo XML en un objeto Workbook y guardarlo en formato de archivo Excel XLSX.

Código para extraer datos de un formulario PDF a Excel usando Java

import com.aspose.pdf.Document;
import com.aspose.pdf.Field;
import com.aspose.pdf.License;
import com.aspose.pdf.WidgetAnnotation;
import com.aspose.pdf.facades.Form;
import com.aspose.cells.Workbook;
import com.aspose.cells.XmlLoadOptions;
import com.aspose.cells.SaveFormat;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws Exception {
// Set license for Aspose.PDF
License pdfLic = new License();
try {
pdfLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
// Set license for Aspose.Cells
com.aspose.cells.License cellsLic = new com.aspose.cells.License();
try {
cellsLic.setLicense("license.lic");
} catch (Exception e) {
e.printStackTrace();
}
ExportDataToXml();
ConvertXmlToXlsx();
}
public static void ExportDataToXml() {
try {
Form pdfForm = new Form();
pdfForm.bindPdf("TextBox_out.pdf");
FileOutputStream xmlOutputStream = new FileOutputStream(new File("input.xml"));
pdfForm.exportXml(xmlOutputStream);
xmlOutputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void ConvertXmlToXlsx() {
try {
XmlLoadOptions options = new XmlLoadOptions();
options.setCheckDataValid(true);
Workbook wb = new Workbook("input.xml", options);
wb.save("XmlToXlsx.xlsx", SaveFormat.XLSX);
} catch (Exception e) {
e.printStackTrace();
}
}
}

El código anterior demuestra cómo exportar datos de un PDF rellenable a Excel usando Java. Permite al desarrollador personalizar la carga del archivo XML de salida usando varios métodos y propiedades en el objeto XmlLoadOptions. También puedes usar el método setLoadFilter(LoadFilter value) para filtrar los datos al cargar desde el archivo XML.

Este artículo nos ha enseñado el proceso de convertir datos de un formulario PDF a un archivo Excel. Para extraer un campo de formulario específico de una página en particular, consulta el artículo sobre cómo Extraer datos de un formulario PDF usando Java.

 Español