Daten aus einem PDF-Formular mit C# extrahieren

Dieser Artikel erklärt, wie man Daten aus einem PDF-Formular mit C# extrahiert. Er enthält Anleitungen zur Einrichtung der Entwicklungsumgebung, eine Schritt-für-Schritt-Anleitung und Beispielcode, der zeigt, wie man Formularfelder aus einem PDF mit C# extrahiert. Wir erläutern den Prozess zur Extraktion von Feldnamen und -werten aus einem geladenen PDF.

Schritte zum Extrahieren von Daten aus PDF-Formularfeldern mit C#

  1. Richten Sie die Umgebung ein, um Aspose.PDF für .NET zur Formular-Datenextraktion zu verwenden
  2. Erstellen Sie ein leeres PDF-Dokument, fügen Sie mehrere Seiten und Formularfelder mit Testdaten hinzu
  3. Laden Sie die PDF-Datei mit den Feldern in ein Document-Objekt
  4. Greifen Sie auf das Form-Objekt aus dem geladenen Dokument zu
  5. Durchlaufen Sie jedes Feld im Formular und greifen Sie auf die Informationen zu
  6. Zeigen Sie den Teilnamen des Feldes und seinen Wert an

Diese Schritte fassen den Prozess des Exports von Daten aus einem PDF-Formular mit C# zusammen. Sie können eine PDF-Datei mit Formularfeldern und Werten erstellen oder eine bestehende PDF-Datei mit Formularfeldern laden. Greifen Sie dann mit dem Document.Form-Objekt auf die Feldsammlung zu und zeigen Sie die Namen und Werte der Felder an.

Code zum Extrahieren von Daten aus einem ausfüllbaren PDF mit C#

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

Dieser Code demonstriert, wie man Daten aus einem PDF-Formular mit C# extrahiert. Sie können auf alle Steuerelemente im Formular zugreifen, einschließlich Textfelder, Optionsfelder und Dropdown-Listen. Beachten Sie, dass das Form-Objekt alle Felder im PDF enthält und Zugriff auf die Felder auf allen Seiten der geladenen PDF-Datei bietet.

In diesem Artikel haben wir gelernt, wie man alle Felder einer PDF-Datei ausliest. Um Schriftarten aus einer PDF-Datei zu extrahieren, lesen Sie den Artikel Schriftarten aus PDF mit C# extrahieren.

 Deutsch