Dieser Artikel erklärt, wie man Daten aus einem PDF-Formular mit C# extrahiert. Er enthält Anleitungen zur Einrichtung der Entwicklungsumgebung, eine Schritt-für-Schritt-Anleitung und Beispielcode, der zeigt, wie man Formularfelder aus einem PDF mit C# extrahiert. Wir erläutern den Prozess zur Extraktion von Feldnamen und -werten aus einem geladenen PDF.
Schritte zum Extrahieren von Daten aus PDF-Formularfeldern mit C#
- Richten Sie die Umgebung ein, um Aspose.PDF für .NET zur Formular-Datenextraktion zu verwenden
- Erstellen Sie ein leeres PDF-Dokument, fügen Sie mehrere Seiten und Formularfelder mit Testdaten hinzu
- Laden Sie die PDF-Datei mit den Feldern in ein Document-Objekt
- Greifen Sie auf das Form-Objekt aus dem geladenen Dokument zu
- Durchlaufen Sie jedes Feld im Formular und greifen Sie auf die Informationen zu
- Zeigen Sie den Teilnamen des Feldes und seinen Wert an
Diese Schritte fassen den Prozess des Exports von Daten aus einem PDF-Formular mit C# zusammen. Sie können eine PDF-Datei mit Formularfeldern und Werten erstellen oder eine bestehende PDF-Datei mit Formularfeldern laden. Greifen Sie dann mit dem Document.Form-Objekt auf die Feldsammlung zu und zeigen Sie die Namen und Werte der Felder an.
Code zum Extrahieren von Daten aus einem ausfüllbaren PDF mit C#
using Aspose.Pdf; | |
License lic = new License(); | |
lic.SetLicense("license.lic"); | |
AddTextBoxFieldToPdf(); | |
// Open PDF document | |
using (var pdfDoc = new Document("TextBox_out.pdf")) | |
{ | |
// Get values from all fields | |
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form) | |
{ | |
Console.WriteLine("Field Title : {0} ", field.PartialName); | |
Console.WriteLine("Field Data : {0} ", field.Value); | |
} | |
} | |
void AddTextBoxFieldToPdf() | |
{ | |
// Open PDF document | |
using (var document = new Aspose.Pdf.Document()) | |
{ | |
for(int iPage = 1; iPage < 5; iPage++) | |
{ | |
var page = document.Pages.Add(); | |
for(int i = 1; i <= 5; i++) | |
{ | |
// Create a field | |
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page, | |
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100)); | |
textBoxField.PartialName = $"textbox{iPage}{i}"; | |
textBoxField.Value = $"Text Box {iPage}{i} Value"; | |
document.Form.Add(textBoxField, iPage); | |
} | |
} | |
// Save PDF document | |
document.Save("TextBox_out.pdf"); | |
} | |
} |
Dieser Code demonstriert, wie man Daten aus einem PDF-Formular mit C# extrahiert. Sie können auf alle Steuerelemente im Formular zugreifen, einschließlich Textfelder, Optionsfelder und Dropdown-Listen. Beachten Sie, dass das Form-Objekt alle Felder im PDF enthält und Zugriff auf die Felder auf allen Seiten der geladenen PDF-Datei bietet.
In diesem Artikel haben wir gelernt, wie man alle Felder einer PDF-Datei ausliest. Um Schriftarten aus einer PDF-Datei zu extrahieren, lesen Sie den Artikel Schriftarten aus PDF mit C# extrahieren.