Tutorial singkat ini menjelaskan proses untuk mengekstrak data dari PDF formulir menggunakan Java. Artikel ini mencakup pengaturan IDE, daftar langkah-langkah penulisan program, dan contoh kode yang menunjukkan cara mengekspor data dari formulir PDF menggunakan Java. Informasi disajikan untuk mengakses semua atau bidang tertentu dari formulir dan memprosesnya sesuai kebutuhan.
Langkah-langkah Mengekstrak Data dari Bidang Formulir PDF menggunakan Java
- Konfigurasikan IDE untuk menggunakan Aspose.PDF untuk Java dalam mengekstrak data formulir.
- Buat file PDF dengan bidang teks dan data sampel.
- Muat file PDF dengan formulir dan bidang input ke dalam objek Document.
- Akses kumpulan bidang dalam Form dari dokumen yang dimuat.
- Iterasi melalui semua bidang dan dapatkan nama lengkap serta nilainya untuk ditampilkan di konsol.
Langkah-langkah ini menjelaskan cara mengekstrak bidang formulir dari PDF menggunakan Java. Buat file PDF dengan bidang formulir dan data sampel atau muat file yang sudah ada dengan data formulir. Akses kumpulan bidang menggunakan properti Form dari objek Document, iterasi melalui semua bidang, dan tampilkan properti yang diinginkan.
Kode untuk Mengekstrak Data dari Formulir PDF yang Dapat Diisi menggunakan Java
import com.aspose.pdf.*; | |
public class Main { | |
public static void main(String[] args) throws Exception { | |
// Load Aspose PDF license | |
License license = new License(); | |
license.setLicense("license.lic"); | |
// Generate PDF with input fields | |
createPdfWithFields(); | |
// Open and process the generated PDF file | |
Document pdfDocument = new Document("UserForm.pdf"); | |
// Retrieve and display form fields | |
Field[] formFields = pdfDocument.getForm().getFields(); | |
for (Field formField : formFields) { | |
System.out.println("Field Name: " + formField.getFullName()); | |
System.out.println("Field Content: " + formField.getValue()); | |
} | |
// Release resources | |
pdfDocument.close(); | |
} | |
private static void createPdfWithFields() { | |
// Instantiate new PDF document | |
Document pdfFile = new Document(); | |
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) { | |
Page newPage = pdfFile.getPages().add(); | |
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) { | |
// Define a text input field | |
TextBoxField inputField = new TextBoxField(newPage, | |
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90)); | |
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex); | |
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex); | |
// Attach field to the document form | |
pdfFile.getForm().add(inputField, pageIndex); | |
} | |
} | |
// Save document to disk | |
pdfFile.save("UserForm.pdf"); | |
// Free resources | |
pdfFile.close(); | |
} | |
} |
Kode ini telah menunjukkan cara mengekstrak data dari formulir PDF menggunakan Java. Anda dapat mengakses berbagai properti dari formulir, seperti nama alternatif bidang, nama pemetaan, konten, nama parsial, status aktif, nama status yang dipilih, indeks halaman, dan lainnya. Untuk mengakses hanya bidang tertentu, gunakan indeks bidang, misalnya formFields[1].getValue()
untuk mendapatkan nilai dari bidang pertama.
Dalam artikel ini, kita telah memproses formulir dalam file PDF. Untuk mengekstrak font dari file PDF, silakan baca artikel Ekstrak Font dari PDF dengan Java.