Extraer datos de un formulario PDF usando Java

Este breve tutorial describe el proceso para extraer datos de un formulario PDF usando Java. Proporciona detalles sobre la configuración del IDE, una lista de pasos para escribir el programa y un código de ejemplo que demuestra cómo exportar datos de un formulario PDF usando Java. Se presentan detalles sobre cómo acceder a todos o algunos campos del formulario y procesarlos según sea necesario.

Pasos para extraer datos de campos de formulario PDF usando Java

  1. Configurar el IDE para usar Aspose.PDF para Java y extraer datos del formulario.
  2. Crear un archivo PDF con campos de texto y datos de ejemplo.
  3. Cargar el archivo PDF con el formulario y los campos de entrada en el objeto Document.
  4. Acceder a la colección de campos en el objeto Form desde el documento cargado.
  5. Recorrer todos los campos y mostrar el nombre completo y el valor en la consola.

Estos pasos explican cómo extraer campos de formulario de un PDF usando Java. Puede crear un archivo PDF con campos de formulario y datos de ejemplo o cargar un archivo existente con datos de formulario. Acceda a la colección de campos mediante la propiedad Form del documento, recorra todos los campos y muestre las propiedades deseadas.

Código para extraer datos de un formulario PDF rellenable usando Java

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

Este código ha demostrado cómo extraer datos de un formulario PDF usando Java. Puede acceder a varias propiedades del formulario, como el nombre alternativo del campo, el nombre de asignación, el contenido, el nombre parcial, el estado activo, el nombre del estado marcado, el índice de la página, etc. Para acceder solo a campos específicos, use el índice del campo, como formFields[1].getValue() para obtener el valor del primer campo.

En este artículo, hemos procesado formularios en un archivo PDF. Para extraer fuentes de un archivo PDF, consulte el artículo Extraer fuente de un PDF usando Java.

 Español