این آموزش کوتاه روند استخراج دادهها از فرم PDF با استفاده از Java را توضیح میدهد. این مقاله شامل جزئیاتی درباره تنظیم IDE، لیستی از مراحل برای نوشتن برنامه و نمونه کدی است که نشان میدهد چگونه دادهها را از فرم PDF با استفاده از Java استخراج کنید. این مقاله همچنین جزئیات مربوط به دسترسی به تمام یا برخی از فیلدهای فرم و پردازش آنها را بر اساس نیاز ارائه میدهد.
مراحل استخراج دادهها از فیلدهای فرم PDF با استفاده از Java
- IDE را برای استفاده از Aspose.PDF برای Java و استخراج دادههای فرم تنظیم کنید.
- یک فایل PDF با فیلدهای متن و دادههای نمونه ایجاد کنید.
- فایل PDF را که حاوی فرم و فیلدهای ورودی است در شیء Document بارگذاری کنید.
- به مجموعه فیلدها در Form از سند بارگذاریشده دسترسی پیدا کنید.
- تمام فیلدها را مرور کرده و نام کامل و مقدار آنها را در کنسول نمایش دهید.
این مراحل نحوه استخراج فیلدهای فرم از PDF با استفاده از Java را توضیح میدهند. شما میتوانید یک فایل PDF با فیلدهای فرم و دادههای نمونه ایجاد کنید یا یک فایل موجود با دادههای فرم را بارگذاری کنید. از طریق ویژگی Form در شیء Document به مجموعه فیلدها دسترسی پیدا کنید، تمام فیلدها را مرور کرده و ویژگیهای موردنظر را نمایش دهید.
کد برای استخراج دادهها از فرم قابل پر کردن PDF با استفاده از Java
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
این کد نشان میدهد چگونه دادهها را از فرم PDF با استفاده از Java استخراج کنیم. شما میتوانید به ویژگیهای مختلف فرم، مانند نام جایگزین فیلد، نام نگاشت، محتوا، نام جزئی، وضعیت فعال، نام وضعیت انتخابشده، شماره صفحه و غیره دسترسی داشته باشید. برای دسترسی به فیلدهای خاص، از ایندکس فیلد استفاده کنید، مانند formFields[1].getValue()
برای دریافت مقدار اولین فیلد.
در این مقاله، نحوه پردازش فرمها در یک فایل PDF را بررسی کردیم. برای استخراج فونتها از یک فایل PDF، به مقاله استخراج فونت از PDF با استفاده از Java مراجعه کنید.