استخراج البيانات من نموذج PDF باستخدام Java

يصف هذا الدليل المختصر عملية استخراج البيانات من PDF باستخدام Java. يتضمن تفاصيل إعداد بيئة التطوير، ويوفر قائمة بالخطوات اللازمة لكتابة البرنامج، بالإضافة إلى كود نموذجي يوضح كيفية تصدير البيانات من نموذج PDF باستخدام Java. يتم توضيح كيفية الوصول إلى جميع الحقول أو الحقول المحددة داخل النموذج ومعالجتها حسب الحاجة.

خطوات استخراج البيانات من حقول نموذج PDF باستخدام Java

  1. تهيئة بيئة التطوير (IDE) لاستخدام Aspose.PDF for Java لاستخراج بيانات النموذج
  2. إنشاء ملف PDF يحتوي على حقول نصية وبيانات تجريبية
  3. تحميل ملف PDF مع النموذج وحقول الإدخال إلى كائن Document
  4. الوصول إلى مجموعة الحقول في النموذج من المستند المحمل
  5. التكرار عبر جميع الحقول والحصول على الاسم الكامل والقيمة لعرضها على وحدة التحكم

توضح هذه الخطوات كيفية استخراج حقول النموذج من PDF باستخدام Java. قم بإنشاء ملف PDF يحتوي على حقول نموذج وبيانات تجريبية أو تحميل ملف موجود يحتوي على بيانات نموذج. استخدم خاصية Form من المستند للوصول إلى مجموعة الحقول، ثم قم بالتكرار عبر جميع الحقول وعرض الخصائص المطلوبة.

كود استخراج البيانات من نموذج PDF القابل للتعبئة باستخدام Java

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

يوضح هذا الكود كيفية استخراج البيانات من نموذج PDF باستخدام Java. يمكنك الوصول إلى خصائص مختلفة من النموذج، مثل الاسم البديل للحقل، اسم التعيين، المحتويات، الاسم الجزئي، الحالة النشطة، اسم الحالة المحددة، رقم الصفحة، وغيرها. لاستخراج بيانات حقل معين فقط، يمكنك استخدام فهرس الحقل مثل formFields[1].getValue() للوصول إلى قيمة الحقل الأول.

في هذا المقال، قمنا بمعالجة النماذج داخل ملف PDF. لاستخراج الخطوط من ملف PDF، يمكنك الرجوع إلى المقال: استخراج الخطوط من PDF باستخدام Java.

 عربي