Den här artikeln guidar dig genom hur du extraherar data från PDF-formulär med C#. Den innehåller detaljerad information om hur du konfigurerar IDE, en steg-för-steg-lista och ett exempel på kod som visar hur du extraherar formulärfält från PDF med C#. Artikeln förklarar processen för att extrahera fältnamn och värden från den laddade PDF-filen.
Steg för att extrahera data från PDF-formulärfält med C#
- Konfigurera miljön för att använda Aspose.PDF for .NET för att läsa formulärdata
- Skapa ett tomt PDF-dokument, lägg till flera sidor och fält med data för testning
- Ladda PDF-filen med fält in i Document-objektet
- Få tillgång till formulär-objektet från det laddade Document
- Gå igenom varje fält i formuläret och hämta informationen
- Visa fältets delnamn och värde
Dessa steg sammanfattar processen för att exportera data från PDF-formulär med C#. Skapa en PDF-fil och lägg till fält med värden, eller ladda en befintlig PDF-fil som innehåller formulärfält. Få tillgång till fältsamlingen med Document.Form-objektet och visa fältnamnet och dess värde.
Exempelkod för att extrahera data från ifyllningsbara PDF-formulär med C#
using Aspose.Pdf; | |
License lic = new License(); | |
lic.SetLicense("license.lic"); | |
AddTextBoxFieldToPdf(); | |
// Open PDF document | |
using (var pdfDoc = new Document("TextBox_out.pdf")) | |
{ | |
// Get values from all fields | |
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form) | |
{ | |
Console.WriteLine("Field Title : {0} ", field.PartialName); | |
Console.WriteLine("Field Data : {0} ", field.Value); | |
} | |
} | |
void AddTextBoxFieldToPdf() | |
{ | |
// Open PDF document | |
using (var document = new Aspose.Pdf.Document()) | |
{ | |
for(int iPage = 1; iPage < 5; iPage++) | |
{ | |
var page = document.Pages.Add(); | |
for(int i = 1; i <= 5; i++) | |
{ | |
// Create a field | |
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page, | |
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100)); | |
textBoxField.PartialName = $"textbox{iPage}{i}"; | |
textBoxField.Value = $"Text Box {iPage}{i} Value"; | |
document.Form.Add(textBoxField, iPage); | |
} | |
} | |
// Save PDF document | |
document.Save("TextBox_out.pdf"); | |
} | |
} |
Den här koden demonstrerar hur du extraherar data från PDF-formulär med C#. Du kan komma åt alla kontroller i formuläret, inklusive textrutor, alternativknappar och kombinationsrutor. Observera att formuläret innehåller alla fält i PDF-filen och ger tillgång till fält på alla sidor i den laddade PDF-filen.
Den här artikeln har lärt oss processen för att komma åt alla fält från en PDF-fil. För att extrahera teckensnitt från en PDF-fil, se artikeln Extrahera teckensnitt från PDF med C#.