Извличане на данни от PDF формуляр с C#

Тази статия обяснява как да извлечем данни от PDF формуляр с C#. В нея ще намерите инструкции за настройка на средата, списък със стъпки и примерен код, демонстриращ процеса на извличане на полета от PDF с C#. Ще обясним как да извлечем имената и стойностите на полетата от зареден PDF.

Стъпки за извличане на данни от полета на PDF формуляр с C#

  1. Настройте средата за използване на Aspose.PDF for .NET за четене на данни от формуляри
  2. Създайте празен PDF документ, добавете няколко страници и няколко полета с данни за тестване
  3. Заредете PDF файла с полета в обект Document
  4. Достъпете обекта Form от заредения документ
  5. Обходете всяко поле във формуляра и достъпете информацията
  6. Показване на частичното име на полето и неговата стойност

Тези стъпки обобщават процеса на експортиране на данни от PDF формуляр с C#. Можете да създадете PDF файл с полета и стойности или да заредите съществуващ файл с формулярни полета. След това достъпете колекцията от полета чрез обекта Document.Form и извлечете имената и стойностите им.

Код за извличане на данни от попълваем PDF с C#

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

Този код демонстрира как да извлечем данни от PDF формуляр с C#. Можете да получите достъп до всички контроли във формуляра, включително текстови полета, радио бутони и падащи списъци. Обърнете внимание, че формулярът съдържа всички полета в PDF документа и осигурява достъп до полетата на всички страници.

В тази статия научихме как да достъпваме всички полета в PDF файл. За извличане на шрифтове от PDF, вижте статията Извличане на шрифтове от PDF с C#.

 Български