استخراج داده‌ها از فرم PDF با استفاده از Java

این آموزش کوتاه روند استخراج داده‌ها از فرم PDF با استفاده از Java را توضیح می‌دهد. این مقاله شامل جزئیاتی درباره تنظیم IDE، لیستی از مراحل برای نوشتن برنامه و نمونه کدی است که نشان می‌دهد چگونه داده‌ها را از فرم PDF با استفاده از Java استخراج کنید. این مقاله همچنین جزئیات مربوط به دسترسی به تمام یا برخی از فیلدهای فرم و پردازش آن‌ها را بر اساس نیاز ارائه می‌دهد.

مراحل استخراج داده‌ها از فیلدهای فرم PDF با استفاده از Java

  1. IDE را برای استفاده از Aspose.PDF برای Java و استخراج داده‌های فرم تنظیم کنید.
  2. یک فایل PDF با فیلدهای متن و داده‌های نمونه ایجاد کنید.
  3. فایل PDF را که حاوی فرم و فیلدهای ورودی است در شیء Document بارگذاری کنید.
  4. به مجموعه فیلدها در Form از سند بارگذاری‌شده دسترسی پیدا کنید.
  5. تمام فیلدها را مرور کرده و نام کامل و مقدار آن‌ها را در کنسول نمایش دهید.

این مراحل نحوه استخراج فیلدهای فرم از PDF با استفاده از Java را توضیح می‌دهند. شما می‌توانید یک فایل PDF با فیلدهای فرم و داده‌های نمونه ایجاد کنید یا یک فایل موجود با داده‌های فرم را بارگذاری کنید. از طریق ویژگی Form در شیء Document به مجموعه فیلدها دسترسی پیدا کنید، تمام فیلدها را مرور کرده و ویژگی‌های موردنظر را نمایش دهید.

کد برای استخراج داده‌ها از فرم قابل پر کردن PDF با استفاده از Java

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

این کد نشان می‌دهد چگونه داده‌ها را از فرم PDF با استفاده از Java استخراج کنیم. شما می‌توانید به ویژگی‌های مختلف فرم، مانند نام جایگزین فیلد، نام نگاشت، محتوا، نام جزئی، وضعیت فعال، نام وضعیت انتخاب‌شده، شماره صفحه و غیره دسترسی داشته باشید. برای دسترسی به فیلدهای خاص، از ایندکس فیلد استفاده کنید، مانند formFields[1].getValue() برای دریافت مقدار اولین فیلد.

در این مقاله، نحوه پردازش فرم‌ها در یک فایل PDF را بررسی کردیم. برای استخراج فونت‌ها از یک فایل PDF، به مقاله استخراج فونت از PDF با استفاده از Java مراجعه کنید.

 فارسی