يصف هذا الدليل المختصر عملية استخراج البيانات من PDF باستخدام Java. يتضمن تفاصيل إعداد بيئة التطوير، ويوفر قائمة بالخطوات اللازمة لكتابة البرنامج، بالإضافة إلى كود نموذجي يوضح كيفية تصدير البيانات من نموذج PDF باستخدام Java. يتم توضيح كيفية الوصول إلى جميع الحقول أو الحقول المحددة داخل النموذج ومعالجتها حسب الحاجة.
خطوات استخراج البيانات من حقول نموذج PDF باستخدام Java
- تهيئة بيئة التطوير (IDE) لاستخدام Aspose.PDF for Java لاستخراج بيانات النموذج
- إنشاء ملف PDF يحتوي على حقول نصية وبيانات تجريبية
- تحميل ملف PDF مع النموذج وحقول الإدخال إلى كائن Document
- الوصول إلى مجموعة الحقول في النموذج من المستند المحمل
- التكرار عبر جميع الحقول والحصول على الاسم الكامل والقيمة لعرضها على وحدة التحكم
توضح هذه الخطوات كيفية استخراج حقول النموذج من PDF باستخدام Java. قم بإنشاء ملف PDF يحتوي على حقول نموذج وبيانات تجريبية أو تحميل ملف موجود يحتوي على بيانات نموذج. استخدم خاصية Form من المستند للوصول إلى مجموعة الحقول، ثم قم بالتكرار عبر جميع الحقول وعرض الخصائص المطلوبة.
كود استخراج البيانات من نموذج PDF القابل للتعبئة باستخدام Java
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
يوضح هذا الكود كيفية استخراج البيانات من نموذج PDF باستخدام Java. يمكنك الوصول إلى خصائص مختلفة من النموذج، مثل الاسم البديل للحقل، اسم التعيين، المحتويات، الاسم الجزئي، الحالة النشطة، اسم الحالة المحددة، رقم الصفحة، وغيرها. لاستخراج بيانات حقل معين فقط، يمكنك استخدام فهرس الحقل مثل formFields[1].getValue()
للوصول إلى قيمة الحقل الأول.
في هذا المقال، قمنا بمعالجة النماذج داخل ملف PDF. لاستخراج الخطوط من ملف PDF، يمكنك الرجوع إلى المقال: استخراج الخطوط من PDF باستخدام Java.