Deze korte handleiding beschrijft het proces van het extraheren van gegevens uit PDF-formulieren met Java. Het bevat details over het instellen van de IDE, een stappenplan voor het schrijven van het programma en een voorbeeldcode die laat zien hoe u gegevens uit PDF-formulieren kunt exporteren met Java. Details worden gepresenteerd voor het openen van alle of geselecteerde velden in het formulier en het verwerken ervan naar behoefte.
Stappen om gegevens uit PDF-formuliervelden te extraheren met Java
- Stel de IDE in om Aspose.PDF for Java te gebruiken voor het extraheren van formuliergegevens
- Maak een PDF-bestand met tekstvelden en voorbeeldgegevens
- Laad het PDF-bestad met formulier en invoervelden in het Document-object
- Toegang tot de verzameling velden in het formulier vanuit het geladen document
- Loop door alle velden en verkrijg de volledige naam en waarde om weer te geven op de console
Deze stappen leggen uit hoe u formuliervelden uit PDF kunt extraheren met Java. Maak een PDF-bestand met formuliervelden en voorbeeldgegevens of laad een bestaand bestand met formuliergegevens. Toegang tot de veldverzameling vanuit de Form-eigenschap van het document, loop door alle velden en geef de gewenste eigenschappen weer.
Voorbeeldcode om gegevens uit invulbare PDF-formulieren te extraheren met Java
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
Deze code demonstreert hoe u gegevens uit PDF-formulieren kunt extraheren met Java. U kunt toegang krijgen tot verschillende eigenschappen van het formulier, zoals de alternatieve naam van het veld, de weergavenaam, de inhoud, de gedeeltelijke naam, de actieve status, de naam van de geselecteerde status, de pagina-index, enz. Om alleen toegang te krijgen tot geselecteerde velden, gebruikt u de veldindex, bijvoorbeeld formFields[1].getValue()
om de waarde van het eerste veld te verkrijgen.
In dit artikel hebben we formulieren in een PDF-bestand verwerkt. Raadpleeg het artikel Lettertypen uit PDF extraheren met Java om lettertypen uit een PDF-bestand te extraheren.