Εξαγωγή δεδομένων από φόρμα PDF χρησιμοποιώντας Java

Αυτός ο σύντομος οδηγός περιγράφει τη διαδικασία εξαγωγής δεδομένων από φόρμα PDF χρησιμοποιώντας Java. Παρέχει λεπτομέρειες για τη ρύθμιση του IDE, μια λίστα βημάτων για τη συγγραφή του προγράμματος και ένα δείγμα κώδικα που επιδεικνύει πώς να εξάγετε δεδομένα από φόρμα PDF χρησιμοποιώντας Java. Περιλαμβάνει οδηγίες για την πρόσβαση σε όλα ή επιλεγμένα πεδία της φόρμας και την επεξεργασία τους σύμφωνα με τις απαιτήσεις.

Βήματα για εξαγωγή δεδομένων από πεδία φόρμας PDF χρησιμοποιώντας Java

  1. Ρυθμίστε το IDE για τη χρήση του Aspose.PDF for Java για εξαγωγή δεδομένων φόρμας.
  2. Δημιουργήστε ένα αρχείο PDF με πεδία κειμένου και δείγματα δεδομένων.
  3. Φορτώστε το αρχείο PDF με φόρμα και πεδία εισαγωγής στο αντικείμενο Document.
  4. Αποκτήστε πρόσβαση στη συλλογή πεδίων στη φόρμα από το φορτωμένο έγγραφο.
  5. Διατρέξτε όλα τα πεδία και εμφανίστε το πλήρες όνομα και την τιμή στην κονσόλα.

Αυτά τα βήματα εξηγούν πώς να εξάγετε πεδία φόρμας από PDF χρησιμοποιώντας Java. Μπορείτε να δημιουργήσετε ένα αρχείο PDF με πεδία φόρμας και δείγματα δεδομένων ή να φορτώσετε ένα υπάρχον αρχείο με δεδομένα φόρμας. Αποκτήστε πρόσβαση στη συλλογή πεδίων μέσω της ιδιότητας Form του εγγράφου, διατρέξτε όλα τα πεδία και εμφανίστε τις επιθυμητές ιδιότητες.

Κώδικας για εξαγωγή δεδομένων από συμπληρώσιμη φόρμα PDF χρησιμοποιώντας Java

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

Αυτός ο κώδικας επιδεικνύει πώς να εξάγετε δεδομένα από φόρμα PDF χρησιμοποιώντας Java. Μπορείτε να αποκτήσετε πρόσβαση σε διάφορες ιδιότητες της φόρμας, όπως το εναλλακτικό όνομα πεδίου, το όνομα αντιστοίχισης, το περιεχόμενο, το μερικό όνομα, την ενεργή κατάσταση, το όνομα της επιλεγμένης κατάστασης, τον δείκτη σελίδας κ.λπ. Για να αποκτήσετε πρόσβαση μόνο σε επιλεγμένα πεδία, χρησιμοποιήστε τον δείκτη πεδίου, όπως formFields[1].getValue() για να λάβετε την τιμή του πρώτου πεδίου.

Σε αυτό το άρθρο, επεξεργαστήκαμε φόρμες σε ένα αρχείο PDF. Για εξαγωγή γραμματοσειρών από ένα αρχείο PDF, ανατρέξτε στο άρθρο Εξαγωγή γραμματοσειράς από PDF χρησιμοποιώντας Java.

 Ελληνικά