استخراج داده‌ها از فرم PDF با استفاده از C#

این مقاله توضیح می‌دهد که چگونه داده‌ها را از یک فرم PDF با استفاده از C# استخراج کنیم. این مقاله شامل جزئیات تنظیم محیط توسعه، لیستی از مراحل و نمونه کدی است که روند استخراج فیلدهای فرم از PDF با C# را نشان می‌دهد. همچنین، فرآیند استخراج نام‌ها و مقادیر فیلدهای یک فایل PDF بارگذاری‌شده توضیح داده خواهد شد.

مراحل استخراج داده‌ها از فیلدهای فرم PDF با استفاده از C#

  1. محیط را برای استفاده از Aspose.PDF برای .NET جهت خواندن داده‌های فرم تنظیم کنید
  2. یک سند PDF خالی ایجاد کنید، چندین صفحه و فیلدهای مختلف با داده‌های آزمایشی اضافه کنید
  3. فایل PDF را با فیلدهای فرم در یک شیء Document بارگذاری کنید
  4. به شیء Form از سند بارگذاری‌شده دسترسی پیدا کنید
  5. هر فیلد را در فرم پیمایش کنید و اطلاعات آن را دریافت کنید
  6. نام جزئی فیلد و مقدار آن را نمایش دهید

این مراحل روند استخراج داده‌ها از فرم PDF با C# را خلاصه می‌کنند. شما می‌توانید یک فایل PDF ایجاد کنید و فیلدهایی با مقادیر مختلف به آن اضافه کنید یا یک فایل PDF موجود را که شامل فیلدهای فرم است، بارگذاری کنید. سپس، مجموعه فیلدها را با استفاده از شیء Document.Form فراخوانی کرده و نام‌ها و مقادیر فیلدها را نمایش دهید.

کد برای استخراج داده‌ها از فرم PDF قابل پر کردن با استفاده از C#

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

این کد نشان می‌دهد که چگونه داده‌ها را از فرم PDF با استفاده از C# استخراج کنیم. شما می‌توانید به تمام کنترل‌های فرم، از جمله جعبه‌های متن، دکمه‌های رادیویی و لیست‌های کشویی دسترسی داشته باشید. توجه داشته باشید که شیء Form شامل تمامی فیلدهای موجود در PDF است و به شما امکان دسترسی به فیلدهای تمامی صفحات فایل PDF بارگذاری‌شده را می‌دهد.

در این مقاله، ما فرآیند دسترسی به تمامی فیلدهای یک فایل PDF را یاد گرفتیم. برای استخراج فونت‌ها از یک فایل PDF، به مقاله استخراج فونت از PDF با C# مراجعه کنید.

 فارسی