Ez a rövid útmutató bemutatja a PDF űrlapadatok kinyerésének folyamatát Java segítségével. Ismerteti az IDE beállításait, lépésről lépésre bemutatja a program megírásának módját, és tartalmaz egy példakódot is, amely bemutatja, hogyan lehet adatokat exportálni egy PDF űrlapból Java segítségével. A leírásból megtudhatja, hogyan érheti el az összes vagy csak bizonyos mezőket, és hogyan dolgozhatja fel őket az igényeinek megfelelően.
Lépések a PDF űrlapmezők adatainak kinyerésére Java segítségével
- Állítsa be az IDE-t az Aspose.PDF for Java használatához az űrlapadatok kinyerésére.
- Hozzon létre egy PDF fájlt szövegdoboz mezőkkel és mintaadatokkal.
- Töltse be a PDF fájlt az űrlap és beviteli mezőkkel a Document objektumba.
- Hozzáférés az űrlap mezőgyűjteményéhez a Form objektumon keresztül a betöltött dokumentumban.
- Iteráljon végig az összes mezőn, és jelenítse meg azok teljes nevét és értékét a konzolon.
Ezek a lépések bemutatják, hogyan lehet PDF űrlapmezőket kinyerni Java segítségével. Létrehozhat egy PDF fájlt űrlapmezőkkel és mintaadatokkal, vagy betölthet egy már meglévő PDF fájlt. Hozzáférhet a mezőgyűjteményhez a Document objektum Form tulajdonságán keresztül, majd végigiterálhat az összes mezőn, és megjelenítheti a kívánt adatokat.
Kód a kitölthető PDF űrlapból történő adatkinyeréshez Java segítségével
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
Ez a kód bemutatja, hogyan lehet adatokat kinyerni egy PDF űrlapból Java segítségével. Hozzáférhet az űrlap különböző tulajdonságaihoz, például a mező alternatív nevéhez, térképezési nevéhez, tartalmához, részleges nevéhez, aktív állapotához, kiválasztott állapot nevéhez, oldalindexéhez stb. Ha csak bizonyos mezőkhöz szeretne hozzáférni, használhatja a mező indexét, például formFields[1].getValue()
az első mező értékének lekéréséhez.
Ebben a cikkben a PDF fájlokban található űrlapokat dolgoztuk fel. Ha szeretne betűtípusokat kinyerni egy PDF fájlból, olvassa el a Betűtípus kinyerése PDF-ből Java segítségével című cikket.