Este artículo explica cómo extraer datos de un PDF usando C#. Contiene detalles sobre la configuración del entorno de desarrollo, una lista de pasos y un código de ejemplo que demuestra el proceso para extraer campos de formulario de un PDF usando C#. Se explicará cómo obtener los nombres y valores de los campos del PDF cargado.
Pasos para extraer datos de los campos de un formulario PDF usando C#
- Configurar el entorno para usar Aspose.PDF para .NET y leer datos de formularios
- Crear un documento PDF vacío, agregar varias páginas y múltiples campos con datos de prueba
- Cargar el archivo PDF con campos en el objeto Document
- Acceder al objeto Form del documento cargado
- Recorrer cada campo en el formulario y obtener la información
- Mostrar el nombre parcial del campo y su valor
Estos pasos resumen el proceso para exportar datos de un formulario PDF usando C#. Puede crear un archivo PDF con campos y valores o cargar un archivo PDF existente con formularios. Luego, acceda a la colección de campos usando el objeto Document.Form y muestre los nombres y valores de los campos.
Código para extraer datos de un formulario PDF rellenable usando C#
using Aspose.Pdf; | |
License lic = new License(); | |
lic.SetLicense("license.lic"); | |
AddTextBoxFieldToPdf(); | |
// Open PDF document | |
using (var pdfDoc = new Document("TextBox_out.pdf")) | |
{ | |
// Get values from all fields | |
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form) | |
{ | |
Console.WriteLine("Field Title : {0} ", field.PartialName); | |
Console.WriteLine("Field Data : {0} ", field.Value); | |
} | |
} | |
void AddTextBoxFieldToPdf() | |
{ | |
// Open PDF document | |
using (var document = new Aspose.Pdf.Document()) | |
{ | |
for(int iPage = 1; iPage < 5; iPage++) | |
{ | |
var page = document.Pages.Add(); | |
for(int i = 1; i <= 5; i++) | |
{ | |
// Create a field | |
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page, | |
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100)); | |
textBoxField.PartialName = $"textbox{iPage}{i}"; | |
textBoxField.Value = $"Text Box {iPage}{i} Value"; | |
document.Form.Add(textBoxField, iPage); | |
} | |
} | |
// Save PDF document | |
document.Save("TextBox_out.pdf"); | |
} | |
} |
Este código demuestra cómo extraer datos de un formulario PDF usando C#. Puede acceder a todos los controles en el formulario, incluidos cuadros de texto, botones de opción y listas desplegables. Tenga en cuenta que el objeto Form contiene todos los campos del PDF y permite acceder a los campos de todas las páginas del documento cargado.
En este artículo hemos aprendido el proceso para acceder a todos los campos de un archivo PDF. Para extraer fuentes de un archivo PDF, consulte el artículo Extraer fuente de PDF usando C#.