Extrair dados de formulários PDF usando Java

Este breve tutorial descreve o processo de extrair dados de formulários PDF usando Java. Ele contém detalhes sobre como configurar o IDE, uma lista de etapas para escrever o programa e um exemplo de código que demonstra como exportar dados de formulários PDF usando Java. Detalhes são fornecidos para acessar todos ou campos selecionados no formulário e processá-los conforme necessário.

Passos para extrair dados de campos de formulários PDF usando Java

  1. Configure o IDE para usar Aspose.PDF for Java para extrair dados de formulários
  2. Crie um arquivo PDF com campos de texto e dados de exemplo
  3. Carregue o arquivo PDF com formulário e campos de entrada no objeto Document
  4. Acesse a coleção de campos no formulário a partir do documento carregado
  5. Percorra todos os campos e obtenha o nome completo e o valor para exibir no console

Essas etapas explicam como extrair campos de formulários de PDF usando Java. Crie um arquivo PDF com campos de formulário e dados de exemplo ou carregue um arquivo existente com dados de formulário. Acesse a coleção de campos a partir da propriedade Form do documento, percorra todos os campos e exiba as propriedades desejadas.

Código de exemplo para extrair dados de formulários PDF preenchíveis usando Java

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

Este código demonstra como extrair dados de formulários PDF usando Java. Você pode acessar várias propriedades do formulário, como nome alternativo do campo, nome de mapeamento, conteúdo, nome parcial, estado ativo, nome do estado selecionado, índice da página, etc. Para acessar apenas campos selecionados, use o índice do campo, por exemplo, formFields[1].getValue() para acessar o valor do primeiro campo.

Neste artigo, processamos formulários em um arquivo PDF. Para extrair fontes de um arquivo PDF, consulte o artigo Extrair fontes de PDF usando Java.

 Português