Dit artikel legt uit hoe u gegevens uit PDF-formulieren kunt extraheren met C#. Het bevat gedetailleerde informatie over het instellen van de IDE, een stappenplan en een voorbeeldcode die laat zien hoe u formuliervelden uit PDF kunt extraheren met C#. Het artikel beschrijft het proces van het extraheren van veldnamen en hun waarden uit het geladen PDF-bestand.
Stappen om gegevens uit PDF-formuliervelden te extraheren met C#
- Stel de omgeving in om Aspose.PDF for .NET te gebruiken voor het lezen van formuliergegevens
- Maak een leeg PDF-document aan, voeg meerdere pagina’s en velden met gegevens toe voor testdoeleinden
- Laad het PDF-bestand met velden in het Document-object
- Toegang tot het formulier-object vanuit het geladen Document
- Loop door elk veld in het formulier en krijg toegang tot de informatie
- Toon de gedeeltelijke naam en waarde van het veld
Deze stappen vatten het proces samen om gegevens uit PDF-formulieren te exporteren met C#. Maak een PDF-bestand en voeg velden met waarden toe, of laad een bestaand PDF-bestand met formuliervelden. Toegang tot de veldcollectie met behulp van het Document.Form-object en toon de veldnaam en waarde.
Voorbeeldcode om gegevens uit invulbare PDF-formulieren te extraheren met C#
using Aspose.Pdf; | |
License lic = new License(); | |
lic.SetLicense("license.lic"); | |
AddTextBoxFieldToPdf(); | |
// Open PDF document | |
using (var pdfDoc = new Document("TextBox_out.pdf")) | |
{ | |
// Get values from all fields | |
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form) | |
{ | |
Console.WriteLine("Field Title : {0} ", field.PartialName); | |
Console.WriteLine("Field Data : {0} ", field.Value); | |
} | |
} | |
void AddTextBoxFieldToPdf() | |
{ | |
// Open PDF document | |
using (var document = new Aspose.Pdf.Document()) | |
{ | |
for(int iPage = 1; iPage < 5; iPage++) | |
{ | |
var page = document.Pages.Add(); | |
for(int i = 1; i <= 5; i++) | |
{ | |
// Create a field | |
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page, | |
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100)); | |
textBoxField.PartialName = $"textbox{iPage}{i}"; | |
textBoxField.Value = $"Text Box {iPage}{i} Value"; | |
document.Form.Add(textBoxField, iPage); | |
} | |
} | |
// Save PDF document | |
document.Save("TextBox_out.pdf"); | |
} | |
} |
Deze code demonstreert hoe u gegevens uit PDF-formulieren kunt extraheren met C#. U kunt toegang krijgen tot alle besturingselementen in het formulier, inclusief tekstvakken, keuzerondjes en vervolgkeuzelijsten. Merk op dat het formulier alle velden in het PDF-bestand bevat en toegang biedt tot velden op alle pagina’s van het geladen PDF-bestand.
Dit artikel heeft ons geleerd hoe we toegang kunnen krijgen tot alle velden van een PDF-bestand. Raadpleeg het artikel Lettertypen uit PDF extraheren met C# om lettertypen uit een PDF-bestand te extraheren.