Gegevens uit PDF-formulieren extraheren met C#

Dit artikel legt uit hoe u gegevens uit PDF-formulieren kunt extraheren met C#. Het bevat gedetailleerde informatie over het instellen van de IDE, een stappenplan en een voorbeeldcode die laat zien hoe u formuliervelden uit PDF kunt extraheren met C#. Het artikel beschrijft het proces van het extraheren van veldnamen en hun waarden uit het geladen PDF-bestand.

Stappen om gegevens uit PDF-formuliervelden te extraheren met C#

  1. Stel de omgeving in om Aspose.PDF for .NET te gebruiken voor het lezen van formuliergegevens
  2. Maak een leeg PDF-document aan, voeg meerdere pagina’s en velden met gegevens toe voor testdoeleinden
  3. Laad het PDF-bestand met velden in het Document-object
  4. Toegang tot het formulier-object vanuit het geladen Document
  5. Loop door elk veld in het formulier en krijg toegang tot de informatie
  6. Toon de gedeeltelijke naam en waarde van het veld

Deze stappen vatten het proces samen om gegevens uit PDF-formulieren te exporteren met C#. Maak een PDF-bestand en voeg velden met waarden toe, of laad een bestaand PDF-bestand met formuliervelden. Toegang tot de veldcollectie met behulp van het Document.Form-object en toon de veldnaam en waarde.

Voorbeeldcode om gegevens uit invulbare PDF-formulieren te extraheren met C#

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

Deze code demonstreert hoe u gegevens uit PDF-formulieren kunt extraheren met C#. U kunt toegang krijgen tot alle besturingselementen in het formulier, inclusief tekstvakken, keuzerondjes en vervolgkeuzelijsten. Merk op dat het formulier alle velden in het PDF-bestand bevat en toegang biedt tot velden op alle pagina’s van het geladen PDF-bestand.

Dit artikel heeft ons geleerd hoe we toegang kunnen krijgen tot alle velden van een PDF-bestand. Raadpleeg het artikel Lettertypen uit PDF extraheren met C# om lettertypen uit een PDF-bestand te extraheren.

 Nederlands