Extrahera data från PDF-formulär med C#

Den här artikeln guidar dig genom hur du extraherar data från PDF-formulär med C#. Den innehåller detaljerad information om hur du konfigurerar IDE, en steg-för-steg-lista och ett exempel på kod som visar hur du extraherar formulärfält från PDF med C#. Artikeln förklarar processen för att extrahera fältnamn och värden från den laddade PDF-filen.

Steg för att extrahera data från PDF-formulärfält med C#

  1. Konfigurera miljön för att använda Aspose.PDF for .NET för att läsa formulärdata
  2. Skapa ett tomt PDF-dokument, lägg till flera sidor och fält med data för testning
  3. Ladda PDF-filen med fält in i Document-objektet
  4. Få tillgång till formulär-objektet från det laddade Document
  5. Gå igenom varje fält i formuläret och hämta informationen
  6. Visa fältets delnamn och värde

Dessa steg sammanfattar processen för att exportera data från PDF-formulär med C#. Skapa en PDF-fil och lägg till fält med värden, eller ladda en befintlig PDF-fil som innehåller formulärfält. Få tillgång till fältsamlingen med Document.Form-objektet och visa fältnamnet och dess värde.

Exempelkod för att extrahera data från ifyllningsbara PDF-formulär med C#

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

Den här koden demonstrerar hur du extraherar data från PDF-formulär med C#. Du kan komma åt alla kontroller i formuläret, inklusive textrutor, alternativknappar och kombinationsrutor. Observera att formuläret innehåller alla fält i PDF-filen och ger tillgång till fält på alla sidor i den laddade PDF-filen.

Den här artikeln har lärt oss processen för att komma åt alla fält från en PDF-fil. För att extrahera teckensnitt från en PDF-fil, se artikeln Extrahera teckensnitt från PDF med C#.

 Svenska