Extrair dados de formulários PDF usando C#

Este artigo explica como extrair dados de formulários PDF usando C#. Ele contém detalhes sobre como configurar o IDE, uma lista de etapas e um exemplo de código que demonstra o processo de extrair campos de formulários de PDF usando C#. O artigo explica o processo de extração dos nomes e valores dos campos do PDF carregado.

Passos para extrair dados de campos de formulários PDF usando C#

  1. Configure o ambiente para usar Aspose.PDF for .NET para ler dados de formulários
  2. Crie um documento PDF vazio, adicione várias páginas e campos com dados para teste
  3. Carregue o arquivo PDF com campos no objeto Document
  4. Acesse o objeto de formulário do Document carregado
  5. Percorra cada campo no formulário e acesse as informações
  6. Exiba o nome parcial do campo e seu valor

Essas etapas resumem o processo de exportar dados de formulários PDF usando C#. Crie um arquivo PDF e adicione campos com valores ou carregue um arquivo PDF existente que contenha campos de formulário. Acesse a coleção de campos usando o objeto Document.Form e exiba o nome e o valor do campo.

Código de exemplo para extrair dados de formulários PDF preenchíveis usando C#

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

Este código demonstra como extrair dados de formulários PDF usando C#. Você pode acessar todos os controles no formulário, incluindo caixas de texto, botões de opção e listas suspensas. Observe que o formulário contém todos os campos no PDF e fornece acesso aos campos em todas as páginas do arquivo PDF carregado.

Este artigo nos ensinou o processo de acessar todos os campos de um arquivo PDF. Para extrair fontes de um arquivo PDF, consulte o artigo Extrair fontes de PDF usando C#.

 Português