Ovaj kratki vodič s uputama vodi o kako čitati PDF tablicu u C# i čitati sav sadržaj unutar nje. Pruža detaljan opis za analizu svih tablica u PDF datoteci i zatim pristup svakom pojedinačnom retku i ćeliji određene tablice. Za čitanje tablice iz PDF-a C# kod se sastoji od nekoliko redaka pri čemu se učitava izvorna PDF datoteka, a zatim se sve tablice analiziraju za čitanje sadržaja.
Koraci za čitanje PDF tablice u C#
- Dodajte referencu na Aspose.PDF for .NET za čitanje podataka tablice u PDF-u
- Učitajte izvornu PDF datoteku pomoću objekta klase Document
- Instancirajte objekt klase TableAbsorber i pročitajte sve tablice sa željene PDF stranice
- Iterirajte kroz sve retke u ciljnoj PDF tablici
- Iterirajte sve ćelije u svakom retku i dohvatite sve fragmente teksta
- Prikažite ili obradite svaki fragment teksta u ćeliji
U ovim se koracima slijedi sustavni pristup za čitanje PDF tablice u C#, gdje se prvo učitava PDF datoteka, a zatim se sve tablice analiziraju pomoću objekta klase TableAbsorber. Nakon što se posjećuju sve tablice u PDF datoteci, možete dobiti referencu na bilo koju tablicu u raščlanjenoj zbirci. Možete pristupiti bilo kojoj tablici, retku, ćeliji i fragmentu teksta u PDF datoteci kako biste ih obradili ili prikazali.
Kod za čitanje PDF tablice u C#
using System; | |
using Aspose.Pdf; | |
using Aspose.Pdf.Text; | |
namespace ReadPDFTableInCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Instantiate the license to avoid trial limitations while reading table data from PDF | |
License asposePdfLicense = new License(); | |
asposePdfLicense.SetLicense("Aspose.pdf.lic"); | |
// Load source PDF document having a table in it | |
Aspose.Pdf.Document pdfDocument = new Aspose.Pdf.Document(@"PdfWithTable.pdf"); | |
// Declare and initialize TableAbsorber class object for reading table from the PDF | |
Aspose.Pdf.Text.TableAbsorber tableAbsorber = new Aspose.Pdf.Text.TableAbsorber(); | |
// Parse all the tables from the desired page in the PDF | |
tableAbsorber.Visit(pdfDocument.Pages[1]); | |
// Get reference to the first table in the parsed collection | |
AbsorbedTable absorbedTable = tableAbsorber.TableList[0]; | |
// Iterate through all the rows in the PDF table | |
foreach (AbsorbedRow pdfTableRow in absorbedTable.RowList) | |
{ | |
// Iterate through all the cells in the pdf table row | |
foreach (AbsorbedCell pdfTableCell in pdfTableRow.CellList) | |
{ | |
// Fetch all the text fragments in the cell | |
TextFragmentCollection textFragmentCollection = pdfTableCell.TextFragments; | |
// Iterate through all the text fragments | |
foreach (TextFragment textFragment in textFragmentCollection) | |
{ | |
// Display the text | |
Console.WriteLine(textFragment.Text); | |
} | |
} | |
} | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
U ovom oglednom kodu korištenje C# analize PDF tablice omogućeno je pomoću klase TableAbsorber koja se koristi za čitanje tablica. Međutim, također možete koristiti druge opcije kao što su TextAbsorber, ParagraphAbsorber, FontAbsorber i TextFragmentAbsorber za pristup različitim elementima dokumenta. Možete iterirati kroz cijelu kolekciju ili pristupiti pojedinačnim elementima pomoću indeksa polja.
Naučili smo kako čitati PDF tablicu u C# u ovoj temi. Međutim, ako želite čitati PDF knjižne oznake, pogledajte članak na kako čitati oznake u PDF-u koristeći C#.