Artikel ini memberikan panduan tentang cara mengekstrak data dari PDF formulir menggunakan C#. Artikel ini mencakup detail pengaturan IDE, daftar langkah-langkah, dan contoh kode yang menunjukkan cara mengekstrak bidang formulir dari PDF menggunakan C#. Anda akan belajar bagaimana mendapatkan nama dan nilai bidang dari PDF yang dimuat.
Langkah-langkah untuk Mengekstrak Data dari Bidang Formulir PDF menggunakan C#
- Siapkan lingkungan untuk menggunakan Aspose.PDF for .NET untuk membaca data formulir
- Buat dokumen PDF kosong, tambahkan beberapa halaman dan beberapa bidang dengan data untuk pengujian
- Muat file PDF dengan bidang ke dalam objek Document
- Akses objek Form dari Document yang dimuat
- Telusuri setiap bidang dalam Formulir dan akses informasinya
- Tampilkan nama dan nilai bidang
Langkah-langkah ini merangkum proses mengekspor data dari formulir PDF menggunakan C#. Anda dapat membuat file PDF baru, menambahkan bidang dengan nilai, atau memuat file PDF yang sudah ada dengan bidang formulir. Dengan menggunakan objek Document.Form, Anda dapat mengakses koleksi bidang dan menampilkan nama serta nilainya.
Kode untuk Mengekstrak Data dari Formulir PDF yang Dapat Diisi menggunakan C#
using Aspose.Pdf; | |
License lic = new License(); | |
lic.SetLicense("license.lic"); | |
AddTextBoxFieldToPdf(); | |
// Open PDF document | |
using (var pdfDoc = new Document("TextBox_out.pdf")) | |
{ | |
// Get values from all fields | |
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form) | |
{ | |
Console.WriteLine("Field Title : {0} ", field.PartialName); | |
Console.WriteLine("Field Data : {0} ", field.Value); | |
} | |
} | |
void AddTextBoxFieldToPdf() | |
{ | |
// Open PDF document | |
using (var document = new Aspose.Pdf.Document()) | |
{ | |
for(int iPage = 1; iPage < 5; iPage++) | |
{ | |
var page = document.Pages.Add(); | |
for(int i = 1; i <= 5; i++) | |
{ | |
// Create a field | |
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page, | |
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100)); | |
textBoxField.PartialName = $"textbox{iPage}{i}"; | |
textBoxField.Value = $"Text Box {iPage}{i} Value"; | |
document.Form.Add(textBoxField, iPage); | |
} | |
} | |
// Save PDF document | |
document.Save("TextBox_out.pdf"); | |
} | |
} |
Kode ini menunjukkan cara mengekstrak data dari formulir PDF menggunakan C#. Anda dapat mengakses semua kontrol dalam Formulir, termasuk kotak teks, tombol radio, dan kotak kombo. Perlu dicatat bahwa objek Form berisi semua bidang dalam PDF dan memberikan akses ke bidang pada semua halaman dalam file PDF yang dimuat.
Artikel ini telah menjelaskan proses mengakses semua bidang dalam file PDF. Jika Anda ingin mengekstrak font dari file PDF, silakan lihat artikel Ekstrak Font dari PDF menggunakan C#.