แยกข้อมูลจากแบบฟอร์ม PDF โดยใช้ Java

บทความสั้นๆ นี้อธิบายกระบวนการ แยกข้อมูลจากแบบฟอร์ม PDF โดยใช้ Java โดยมีรายละเอียดเกี่ยวกับการตั้งค่า IDE รายการขั้นตอนสำหรับการเขียนโปรแกรม และตัวอย่างโค้ดที่แสดงวิธีการ ส่งออกข้อมูลจากแบบฟอร์ม PDF โดยใช้ Java นอกจากนี้ยังมีรายละเอียดเกี่ยวกับการเข้าถึงฟิลด์ทั้งหมดหรือฟิลด์ที่เลือกในแบบฟอร์มและประมวลผลตามความต้องการ

ขั้นตอนการแยกข้อมูลจากฟิลด์แบบฟอร์ม PDF โดยใช้ Java

  1. ตั้งค่า IDE เพื่อใช้ Aspose.PDF for Java ในการแยกข้อมูลแบบฟอร์ม
  2. สร้างไฟล์ PDF ที่มีฟิลด์ Textbox และข้อมูลตัวอย่าง
  3. โหลดไฟล์ PDF ที่มีแบบฟอร์มและฟิลด์ข้อมูลเข้าไปในออบเจ็กต์ Document
  4. เข้าถึงคอลเลกชันของฟิลด์ใน แบบฟอร์ม จากเอกสารที่โหลดไว้
  5. วนลูปผ่านทุกฟิลด์และรับชื่อเต็มและค่าของฟิลด์เพื่อแสดงผลบนคอนโซล

ขั้นตอนเหล่านี้จะอธิบายวิธีการ แยกฟิลด์แบบฟอร์มจาก PDF โดยใช้ Java สร้างไฟล์ PDF ที่มีฟิลด์แบบฟอร์มและข้อมูลตัวอย่าง หรือโหลดไฟล์ที่มีข้อมูลแบบฟอร์มอยู่แล้ว เข้าถึงคอลเลกชันของฟิลด์จากคุณสมบัติ Form ของเอกสาร วนลูปผ่านทุกฟิลด์และแสดงคุณสมบัติที่ต้องการ

ตัวอย่างโค้ดสำหรับการแยกข้อมูลจากแบบฟอร์ม PDF ที่สามารถกรอกได้โดยใช้ Java

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

โค้ดนี้แสดงให้เห็นถึงวิธีการ แยกข้อมูลจากแบบฟอร์ม PDF โดยใช้ Java คุณสามารถเข้าถึงคุณสมบัติต่างๆ ของแบบฟอร์มได้ เช่น ชื่ออื่นของฟิลด์ ชื่อการแมป เนื้อหา ชื่อบางส่วน สถานะการใช้งาน ชื่อสถานะที่เลือก ดัชนีหน้า เป็นต้น หากต้องการเข้าถึงเฉพาะฟิลด์ที่เลือก ให้ใช้ดัชนีฟิลด์ เช่น formFields[1].getValue() เพื่อเข้าถึงค่าของฟิลด์แรก

ในบทความนี้ เราได้ประมวลผลแบบฟอร์มในไฟล์ PDF หากต้องการแยกฟอนต์จากไฟล์ PDF สามารถดูบทความ แยกฟอนต์จาก PDF โดยใช้ Java ได้

 ไทย