บทความสั้นๆ นี้อธิบายกระบวนการ แยกข้อมูลจากแบบฟอร์ม PDF โดยใช้ Java โดยมีรายละเอียดเกี่ยวกับการตั้งค่า IDE รายการขั้นตอนสำหรับการเขียนโปรแกรม และตัวอย่างโค้ดที่แสดงวิธีการ ส่งออกข้อมูลจากแบบฟอร์ม PDF โดยใช้ Java นอกจากนี้ยังมีรายละเอียดเกี่ยวกับการเข้าถึงฟิลด์ทั้งหมดหรือฟิลด์ที่เลือกในแบบฟอร์มและประมวลผลตามความต้องการ
ขั้นตอนการแยกข้อมูลจากฟิลด์แบบฟอร์ม PDF โดยใช้ Java
- ตั้งค่า IDE เพื่อใช้ Aspose.PDF for Java ในการแยกข้อมูลแบบฟอร์ม
- สร้างไฟล์ PDF ที่มีฟิลด์ Textbox และข้อมูลตัวอย่าง
- โหลดไฟล์ PDF ที่มีแบบฟอร์มและฟิลด์ข้อมูลเข้าไปในออบเจ็กต์ Document
- เข้าถึงคอลเลกชันของฟิลด์ใน แบบฟอร์ม จากเอกสารที่โหลดไว้
- วนลูปผ่านทุกฟิลด์และรับชื่อเต็มและค่าของฟิลด์เพื่อแสดงผลบนคอนโซล
ขั้นตอนเหล่านี้จะอธิบายวิธีการ แยกฟิลด์แบบฟอร์มจาก PDF โดยใช้ Java สร้างไฟล์ PDF ที่มีฟิลด์แบบฟอร์มและข้อมูลตัวอย่าง หรือโหลดไฟล์ที่มีข้อมูลแบบฟอร์มอยู่แล้ว เข้าถึงคอลเลกชันของฟิลด์จากคุณสมบัติ Form ของเอกสาร วนลูปผ่านทุกฟิลด์และแสดงคุณสมบัติที่ต้องการ
ตัวอย่างโค้ดสำหรับการแยกข้อมูลจากแบบฟอร์ม PDF ที่สามารถกรอกได้โดยใช้ Java
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
โค้ดนี้แสดงให้เห็นถึงวิธีการ แยกข้อมูลจากแบบฟอร์ม PDF โดยใช้ Java คุณสามารถเข้าถึงคุณสมบัติต่างๆ ของแบบฟอร์มได้ เช่น ชื่ออื่นของฟิลด์ ชื่อการแมป เนื้อหา ชื่อบางส่วน สถานะการใช้งาน ชื่อสถานะที่เลือก ดัชนีหน้า เป็นต้น หากต้องการเข้าถึงเฉพาะฟิลด์ที่เลือก ให้ใช้ดัชนีฟิลด์ เช่น formFields[1].getValue()
เพื่อเข้าถึงค่าของฟิลด์แรก
ในบทความนี้ เราได้ประมวลผลแบบฟอร์มในไฟล์ PDF หากต้องการแยกฟอนต์จากไฟล์ PDF สามารถดูบทความ แยกฟอนต์จาก PDF โดยใช้ Java ได้