Este breve tutorial describe el proceso para extraer datos de un formulario PDF usando Java. Proporciona detalles sobre la configuración del IDE, una lista de pasos para escribir el programa y un código de ejemplo que demuestra cómo exportar datos de un formulario PDF usando Java. Se presentan detalles sobre cómo acceder a todos o algunos campos del formulario y procesarlos según sea necesario.
Pasos para extraer datos de campos de formulario PDF usando Java
- Configurar el IDE para usar Aspose.PDF para Java y extraer datos del formulario.
- Crear un archivo PDF con campos de texto y datos de ejemplo.
- Cargar el archivo PDF con el formulario y los campos de entrada en el objeto Document.
- Acceder a la colección de campos en el objeto Form desde el documento cargado.
- Recorrer todos los campos y mostrar el nombre completo y el valor en la consola.
Estos pasos explican cómo extraer campos de formulario de un PDF usando Java. Puede crear un archivo PDF con campos de formulario y datos de ejemplo o cargar un archivo existente con datos de formulario. Acceda a la colección de campos mediante la propiedad Form del documento, recorra todos los campos y muestre las propiedades deseadas.
Código para extraer datos de un formulario PDF rellenable usando Java
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
Este código ha demostrado cómo extraer datos de un formulario PDF usando Java. Puede acceder a varias propiedades del formulario, como el nombre alternativo del campo, el nombre de asignación, el contenido, el nombre parcial, el estado activo, el nombre del estado marcado, el índice de la página, etc. Para acceder solo a campos específicos, use el índice del campo, como formFields[1].getValue()
para obtener el valor del primer campo.
En este artículo, hemos procesado formularios en un archivo PDF. Para extraer fuentes de un archivo PDF, consulte el artículo Extraer fuente de un PDF usando Java.