Ekstrak Data dari Formulir PDF menggunakan Java

Tutorial singkat ini menjelaskan proses untuk mengekstrak data dari PDF formulir menggunakan Java. Artikel ini mencakup pengaturan IDE, daftar langkah-langkah penulisan program, dan contoh kode yang menunjukkan cara mengekspor data dari formulir PDF menggunakan Java. Informasi disajikan untuk mengakses semua atau bidang tertentu dari formulir dan memprosesnya sesuai kebutuhan.

Langkah-langkah Mengekstrak Data dari Bidang Formulir PDF menggunakan Java

  1. Konfigurasikan IDE untuk menggunakan Aspose.PDF untuk Java dalam mengekstrak data formulir.
  2. Buat file PDF dengan bidang teks dan data sampel.
  3. Muat file PDF dengan formulir dan bidang input ke dalam objek Document.
  4. Akses kumpulan bidang dalam Form dari dokumen yang dimuat.
  5. Iterasi melalui semua bidang dan dapatkan nama lengkap serta nilainya untuk ditampilkan di konsol.

Langkah-langkah ini menjelaskan cara mengekstrak bidang formulir dari PDF menggunakan Java. Buat file PDF dengan bidang formulir dan data sampel atau muat file yang sudah ada dengan data formulir. Akses kumpulan bidang menggunakan properti Form dari objek Document, iterasi melalui semua bidang, dan tampilkan properti yang diinginkan.

Kode untuk Mengekstrak Data dari Formulir PDF yang Dapat Diisi menggunakan Java

import com.aspose.pdf.*;
public class Main {
public static void main(String[] args) throws Exception {
// Load Aspose PDF license
License license = new License();
license.setLicense("license.lic");
// Generate PDF with input fields
createPdfWithFields();
// Open and process the generated PDF file
Document pdfDocument = new Document("UserForm.pdf");
// Retrieve and display form fields
Field[] formFields = pdfDocument.getForm().getFields();
for (Field formField : formFields) {
System.out.println("Field Name: " + formField.getFullName());
System.out.println("Field Content: " + formField.getValue());
}
// Release resources
pdfDocument.close();
}
private static void createPdfWithFields() {
// Instantiate new PDF document
Document pdfFile = new Document();
for (int pageIndex = 1; pageIndex <= 3; pageIndex++) {
Page newPage = pdfFile.getPages().add();
for (int fieldIndex = 1; fieldIndex <= 4; fieldIndex++) {
// Define a text input field
TextBoxField inputField = new TextBoxField(newPage,
new Rectangle(120, fieldIndex * 90, 320, (fieldIndex + 1) * 90));
inputField.setPartialName("inputField_" + pageIndex + "_" + fieldIndex);
inputField.setValue("Data Entry " + pageIndex + "-" + fieldIndex);
// Attach field to the document form
pdfFile.getForm().add(inputField, pageIndex);
}
}
// Save document to disk
pdfFile.save("UserForm.pdf");
// Free resources
pdfFile.close();
}
}

Kode ini telah menunjukkan cara mengekstrak data dari formulir PDF menggunakan Java. Anda dapat mengakses berbagai properti dari formulir, seperti nama alternatif bidang, nama pemetaan, konten, nama parsial, status aktif, nama status yang dipilih, indeks halaman, dan lainnya. Untuk mengakses hanya bidang tertentu, gunakan indeks bidang, misalnya formFields[1].getValue() untuk mendapatkan nilai dari bidang pertama.

Dalam artikel ini, kita telah memproses formulir dalam file PDF. Untuk mengekstrak font dari file PDF, silakan baca artikel Ekstrak Font dari PDF dengan Java.

 Indonesian