Izdvajanje podataka iz PDF obrasca pomoću Jave

Ovaj kratki vodič opisuje postupak izdvajanja podataka iz PDF obrasca pomoću Jave. Objašnjava postavke IDE-a, pruža popis koraka za pisanje programa i primjer koda koji demonstrira kako izvesti podatke iz PDF obrasca pomoću Jave. Također pokazuje kako pristupiti svim ili odabranim poljima obrasca i obraditi ih prema potrebi.

Koraci za izdvajanje podataka iz polja PDF obrasca pomoću Jave

  1. Postavite IDE za korištenje Aspose.PDF za Javu kako biste izdvojili podatke iz obrasca.
  2. Kreirajte PDF datoteku s tekstualnim poljima i testnim podacima.
  3. Učitajte PDF datoteku s obrascem i unosnim poljima u objekt Document.
  4. Pristupite zbirci polja u Form iz učitanog dokumenta.
  5. Prođite kroz sva polja i dohvatite njihova puna imena i vrijednosti za prikaz na konzoli.

Ovi koraci objašnjavaju kako izdvojiti polja obrasca iz PDF-a pomoću Jave. Možete kreirati PDF datoteku s poljima obrasca i testnim podacima ili učitati postojeću datoteku s obrascem. Pristupite zbirci polja pomoću svojstva Form dokumenta, prođite kroz sva polja i prikažite željene podatke.

Kod za izdvajanje podataka iz ispunjivog PDF obrasca pomoću Jave

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

Ovaj kod prikazuje kako izdvojiti podatke iz PDF obrasca pomoću Jave. Možete pristupiti raznim svojstvima obrasca, poput alternativnog imena polja, imena mapiranja, sadržaja, djelomičnog imena, aktivnog stanja, naziva označenog stanja, indeksa stranice itd. Ako želite pristupiti samo određenim poljima, koristite indeks polja, npr. formFields[1].getValue() za dohvaćanje vrijednosti prvog polja.

U ovom članku smo obradili obrasce u PDF datotekama. Za izdvajanje fontova iz PDF datoteke pogledajte članak Izdvajanje fonta iz PDF-a pomoću Jave.

 Hrvatski