Gegevens uit PDF-formulieren extraheren met Java

Deze korte handleiding beschrijft het proces van het extraheren van gegevens uit PDF-formulieren met Java. Het bevat details over het instellen van de IDE, een stappenplan voor het schrijven van het programma en een voorbeeldcode die laat zien hoe u gegevens uit PDF-formulieren kunt exporteren met Java. Details worden gepresenteerd voor het openen van alle of geselecteerde velden in het formulier en het verwerken ervan naar behoefte.

Stappen om gegevens uit PDF-formuliervelden te extraheren met Java

  1. Stel de IDE in om Aspose.PDF for Java te gebruiken voor het extraheren van formuliergegevens
  2. Maak een PDF-bestand met tekstvelden en voorbeeldgegevens
  3. Laad het PDF-bestad met formulier en invoervelden in het Document-object
  4. Toegang tot de verzameling velden in het formulier vanuit het geladen document
  5. Loop door alle velden en verkrijg de volledige naam en waarde om weer te geven op de console

Deze stappen leggen uit hoe u formuliervelden uit PDF kunt extraheren met Java. Maak een PDF-bestand met formuliervelden en voorbeeldgegevens of laad een bestaand bestand met formuliergegevens. Toegang tot de veldverzameling vanuit de Form-eigenschap van het document, loop door alle velden en geef de gewenste eigenschappen weer.

Voorbeeldcode om gegevens uit invulbare PDF-formulieren te extraheren met Java

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

Deze code demonstreert hoe u gegevens uit PDF-formulieren kunt extraheren met Java. U kunt toegang krijgen tot verschillende eigenschappen van het formulier, zoals de alternatieve naam van het veld, de weergavenaam, de inhoud, de gedeeltelijke naam, de actieve status, de naam van de geselecteerde status, de pagina-index, enz. Om alleen toegang te krijgen tot geselecteerde velden, gebruikt u de veldindex, bijvoorbeeld formFields[1].getValue() om de waarde van het eerste veld te verkrijgen.

In dit artikel hebben we formulieren in een PDF-bestand verwerkt. Raadpleeg het artikel Lettertypen uit PDF extraheren met Java om lettertypen uit een PDF-bestand te extraheren.

 Nederlands