Adatok kinyerése PDF űrlapból Java segítségével

Ez a rövid útmutató bemutatja a PDF űrlapadatok kinyerésének folyamatát Java segítségével. Ismerteti az IDE beállításait, lépésről lépésre bemutatja a program megírásának módját, és tartalmaz egy példakódot is, amely bemutatja, hogyan lehet adatokat exportálni egy PDF űrlapból Java segítségével. A leírásból megtudhatja, hogyan érheti el az összes vagy csak bizonyos mezőket, és hogyan dolgozhatja fel őket az igényeinek megfelelően.

Lépések a PDF űrlapmezők adatainak kinyerésére Java segítségével

  1. Állítsa be az IDE-t az Aspose.PDF for Java használatához az űrlapadatok kinyerésére.
  2. Hozzon létre egy PDF fájlt szövegdoboz mezőkkel és mintaadatokkal.
  3. Töltse be a PDF fájlt az űrlap és beviteli mezőkkel a Document objektumba.
  4. Hozzáférés az űrlap mezőgyűjteményéhez a Form objektumon keresztül a betöltött dokumentumban.
  5. Iteráljon végig az összes mezőn, és jelenítse meg azok teljes nevét és értékét a konzolon.

Ezek a lépések bemutatják, hogyan lehet PDF űrlapmezőket kinyerni Java segítségével. Létrehozhat egy PDF fájlt űrlapmezőkkel és mintaadatokkal, vagy betölthet egy már meglévő PDF fájlt. Hozzáférhet a mezőgyűjteményhez a Document objektum Form tulajdonságán keresztül, majd végigiterálhat az összes mezőn, és megjelenítheti a kívánt adatokat.

Kód a kitölthető PDF űrlapból történő adatkinyeréshez Java segítségével

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

Ez a kód bemutatja, hogyan lehet adatokat kinyerni egy PDF űrlapból Java segítségével. Hozzáférhet az űrlap különböző tulajdonságaihoz, például a mező alternatív nevéhez, térképezési nevéhez, tartalmához, részleges nevéhez, aktív állapotához, kiválasztott állapot nevéhez, oldalindexéhez stb. Ha csak bizonyos mezőkhöz szeretne hozzáférni, használhatja a mező indexét, például formFields[1].getValue() az első mező értékének lekéréséhez.

Ebben a cikkben a PDF fájlokban található űrlapokat dolgoztuk fel. Ha szeretne betűtípusokat kinyerni egy PDF fájlból, olvassa el a Betűtípus kinyerése PDF-ből Java segítségével című cikket.

 Magyar