Витягнення даних з PDF-форми за допомогою C#

Ця стаття пояснює, як витягнути дані з PDF форми за допомогою C#. У ній наведено деталі для налаштування IDE, список кроків та зразок коду, який демонструє процес витягнення полів форми з PDF за допомогою C#. Стаття пояснює процес витягнення назв полів та їх значень із завантаженого PDF-файлу.

Кроки для витягнення даних з полів PDF-форми за допомогою C#

  1. Налаштуйте середовище для використання Aspose.PDF for .NET для читання даних форми
  2. Створіть порожній PDF-документ, додайте кілька сторінок і полів з даними для тестування
  3. Завантажте PDF-файл із полями в об’єкт Document
  4. Отримайте доступ до об’єкта форми з завантаженого Document
  5. Перегляньте кожне поле у формі та отримайте доступ до інформації
  6. Відобразіть часткову назву поля та його значення

Ці кроки підсумовують процес експортування даних з PDF-форми за допомогою C#. Створіть PDF-файл і додайте до нього поля зі значеннями або завантажте існуючий PDF-файл із полями форми. Отримайте доступ до колекції полів за допомогою об’єкта Document.Form та відобразіть назву поля та його значення.

Код для витягнення даних із заповнюваної PDF-форми за допомогою C#

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

Цей код демонструє, як витягнути дані з PDF-форми за допомогою C#. Ви можете отримати доступ до всіх елементів керування на формі, включаючи текстове поле, радіокнопку та комбіноване поле. Зауважте, що форма містить усі поля в PDF-файлі та забезпечує доступ до полів на всіх сторінках завантаженого PDF-файлу.

Ця стаття навчила нас процесу доступу до всіх полів із PDF-файлу. Щоб дізнатися, як витягнути шрифти з PDF-файлу, зверніться до статті Витягнення шрифтів з PDF за допомогою C#.

 Українська