Ovaj članak objašnjava kako ekstrahirati podatke iz PDF obrasca pomoću C#. Sadrži upute za postavljanje razvojnog okruženja, popis koraka i uzorak koda koji pokazuje proces ekstrakcije polja iz PDF obrasca pomoću C#. Objasnit će se kako dohvatiti nazive polja i njihove vrijednosti iz učitanog PDF-a.
Koraci za ekstrakciju podataka iz polja PDF obrasca pomoću C#
- Postavite okruženje za korištenje Aspose.PDF za .NET za čitanje podataka iz obrasca
- Kreirajte prazan PDF dokument, dodajte više stranica i više polja s testnim podacima
- Učitajte PDF datoteku s poljima u objekt Document
- Pristupite objektu Form iz učitanog dokumenta
- Prođite kroz svako polje u obrascu i dohvatite podatke
- Prikaz imena polja i njegove vrijednosti
Ovi koraci sažimaju proces izvoza podataka iz PDF obrasca pomoću C#. Možete kreirati PDF datoteku i dodati polja s vrijednostima ili učitati postojeći PDF s obrascem. Pristupite kolekciji polja pomoću objekta Document.Form i prikažite nazive i vrijednosti polja.
Kod za ekstrakciju podataka iz ispunjivog PDF-a pomoću C#
using Aspose.Pdf; | |
License lic = new License(); | |
lic.SetLicense("license.lic"); | |
AddTextBoxFieldToPdf(); | |
// Open PDF document | |
using (var pdfDoc = new Document("TextBox_out.pdf")) | |
{ | |
// Get values from all fields | |
foreach (Aspose.Pdf.Forms.Field field in pdfDoc.Form) | |
{ | |
Console.WriteLine("Field Title : {0} ", field.PartialName); | |
Console.WriteLine("Field Data : {0} ", field.Value); | |
} | |
} | |
void AddTextBoxFieldToPdf() | |
{ | |
// Open PDF document | |
using (var document = new Aspose.Pdf.Document()) | |
{ | |
for(int iPage = 1; iPage < 5; iPage++) | |
{ | |
var page = document.Pages.Add(); | |
for(int i = 1; i <= 5; i++) | |
{ | |
// Create a field | |
var textBoxField = new Aspose.Pdf.Forms.TextBoxField(page, | |
new Aspose.Pdf.Rectangle(100, i * 100, 300, (i + 1) *100)); | |
textBoxField.PartialName = $"textbox{iPage}{i}"; | |
textBoxField.Value = $"Text Box {iPage}{i} Value"; | |
document.Form.Add(textBoxField, iPage); | |
} | |
} | |
// Save PDF document | |
document.Save("TextBox_out.pdf"); | |
} | |
} |
Ovaj kod demonstrira kako ekstrahirati podatke iz PDF obrasca pomoću C#. Možete pristupiti svim kontrolama u obrascu, uključujući tekstualna polja, radio gumbe i padajuće liste. Napominjemo da objekt Form sadrži sva polja u PDF-u i omogućuje pristup poljima na svim stranicama učitanog PDF dokumenta.
U ovom smo članku naučili kako pristupiti svim poljima iz PDF datoteke. Za ekstrakciju fontova iz PDF-a pogledajte članak Ekstrakcija fontova iz PDF-a pomoću C#.