Ekstrakcija podataka iz PDF obrasca pomoću C#

Ovaj članak objašnjava kako ekstrahirati podatke iz PDF obrasca pomoću C#. Sadrži upute za postavljanje razvojnog okruženja, popis koraka i uzorak koda koji pokazuje proces ekstrakcije polja iz PDF obrasca pomoću C#. Objasnit će se kako dohvatiti nazive polja i njihove vrijednosti iz učitanog PDF-a.

Koraci za ekstrakciju podataka iz polja PDF obrasca pomoću C#

  1. Postavite okruženje za korištenje Aspose.PDF za .NET za čitanje podataka iz obrasca
  2. Kreirajte prazan PDF dokument, dodajte više stranica i više polja s testnim podacima
  3. Učitajte PDF datoteku s poljima u objekt Document
  4. Pristupite objektu Form iz učitanog dokumenta
  5. Prođite kroz svako polje u obrascu i dohvatite podatke
  6. Prikaz imena polja i njegove vrijednosti

Ovi koraci sažimaju proces izvoza podataka iz PDF obrasca pomoću C#. Možete kreirati PDF datoteku i dodati polja s vrijednostima ili učitati postojeći PDF s obrascem. Pristupite kolekciji polja pomoću objekta Document.Form i prikažite nazive i vrijednosti polja.

Kod za ekstrakciju podataka iz ispunjivog PDF-a pomoću C#

using Aspose.Pdf;
License lic = new License();
lic.SetLicense("license.lic");
AddTextBoxFieldToPdf();
// Open PDF document
using (var pdfDoc = new Document("TextBox_out.pdf"))
{
// Get values from all fields
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form)
{
Console.WriteLine("Field Title : {0} ", field.PartialName);
Console.WriteLine("Field Data : {0} ", field.Value);
}
}
void AddTextBoxFieldToPdf()
{
// Open PDF document
using (var document = new Aspose.Pdf.Document())
{
for(int iPage = 1; iPage < 5; iPage++)
{
var page = document.Pages.Add();
for(int i = 1; i <= 5; i++)
{
// Create a field
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page,
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100));
textBoxField.PartialName = $"textbox{iPage}{i}";
textBoxField.Value = $"Text Box {iPage}{i} Value";
document.Form.Add(textBoxField, iPage);
}
}
// Save PDF document
document.Save("TextBox_out.pdf");
}
}

Ovaj kod demonstrira kako ekstrahirati podatke iz PDF obrasca pomoću C#. Možete pristupiti svim kontrolama u obrascu, uključujući tekstualna polja, radio gumbe i padajuće liste. Napominjemo da objekt Form sadrži sva polja u PDF-u i omogućuje pristup poljima na svim stranicama učitanog PDF dokumenta.

U ovom smo članku naučili kako pristupiti svim poljima iz PDF datoteke. Za ekstrakciju fontova iz PDF-a pogledajte članak Ekstrakcija fontova iz PDF-a pomoću C#.

 Hrvatski