Extraer datos de un formulario PDF usando C#

Este artículo explica cómo extraer datos de un PDF usando C#. Contiene detalles sobre la configuración del entorno de desarrollo, una lista de pasos y un código de ejemplo que demuestra el proceso para extraer campos de formulario de un PDF usando C#. Se explicará cómo obtener los nombres y valores de los campos del PDF cargado.

Pasos para extraer datos de los campos de un formulario PDF usando C#

  1. Configurar el entorno para usar Aspose.PDF para .NET y leer datos de formularios
  2. Crear un documento PDF vacío, agregar varias páginas y múltiples campos con datos de prueba
  3. Cargar el archivo PDF con campos en el objeto Document
  4. Acceder al objeto Form del documento cargado
  5. Recorrer cada campo en el formulario y obtener la información
  6. Mostrar el nombre parcial del campo y su valor

Estos pasos resumen el proceso para exportar datos de un formulario PDF usando C#. Puede crear un archivo PDF con campos y valores o cargar un archivo PDF existente con formularios. Luego, acceda a la colección de campos usando el objeto Document.Form y muestre los nombres y valores de los campos.

Código para extraer datos de un formulario PDF rellenable usando C#

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

Este código demuestra cómo extraer datos de un formulario PDF usando C#. Puede acceder a todos los controles en el formulario, incluidos cuadros de texto, botones de opción y listas desplegables. Tenga en cuenta que el objeto Form contiene todos los campos del PDF y permite acceder a los campos de todas las páginas del documento cargado.

En este artículo hemos aprendido el proceso para acceder a todos los campos de un archivo PDF. Para extraer fuentes de un archivo PDF, consulte el artículo Extraer fuente de PDF usando C#.

 Español