Este artigo explica como extrair dados de formulários PDF usando C#. Ele contém detalhes sobre como configurar o IDE, uma lista de etapas e um exemplo de código que demonstra o processo de extrair campos de formulários de PDF usando C#. O artigo explica o processo de extração dos nomes e valores dos campos do PDF carregado.
Passos para extrair dados de campos de formulários PDF usando C#
- Configure o ambiente para usar Aspose.PDF for .NET para ler dados de formulários
- Crie um documento PDF vazio, adicione várias páginas e campos com dados para teste
- Carregue o arquivo PDF com campos no objeto Document
- Acesse o objeto de formulário do Document carregado
- Percorra cada campo no formulário e acesse as informações
- Exiba o nome parcial do campo e seu valor
Essas etapas resumem o processo de exportar dados de formulários PDF usando C#. Crie um arquivo PDF e adicione campos com valores ou carregue um arquivo PDF existente que contenha campos de formulário. Acesse a coleção de campos usando o objeto Document.Form e exiba o nome e o valor do campo.
Código de exemplo para extrair dados de formulários PDF preenchíveis usando C#
using Aspose.Pdf; | |
License lic = new License(); | |
lic.SetLicense("license.lic"); | |
AddTextBoxFieldToPdf(); | |
// Open PDF document | |
using (var pdfDoc = new Document("TextBox_out.pdf")) | |
{ | |
// Get values from all fields | |
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form) | |
{ | |
Console.WriteLine("Field Title : {0} ", field.PartialName); | |
Console.WriteLine("Field Data : {0} ", field.Value); | |
} | |
} | |
void AddTextBoxFieldToPdf() | |
{ | |
// Open PDF document | |
using (var document = new Aspose.Pdf.Document()) | |
{ | |
for(int iPage = 1; iPage < 5; iPage++) | |
{ | |
var page = document.Pages.Add(); | |
for(int i = 1; i <= 5; i++) | |
{ | |
// Create a field | |
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page, | |
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100)); | |
textBoxField.PartialName = $"textbox{iPage}{i}"; | |
textBoxField.Value = $"Text Box {iPage}{i} Value"; | |
document.Form.Add(textBoxField, iPage); | |
} | |
} | |
// Save PDF document | |
document.Save("TextBox_out.pdf"); | |
} | |
} |
Este código demonstra como extrair dados de formulários PDF usando C#. Você pode acessar todos os controles no formulário, incluindo caixas de texto, botões de opção e listas suspensas. Observe que o formulário contém todos os campos no PDF e fornece acesso aos campos em todas as páginas do arquivo PDF carregado.
Este artigo nos ensinou o processo de acessar todos os campos de um arquivo PDF. Para extrair fontes de um arquivo PDF, consulte o artigo Extrair fontes de PDF usando C#.