C# ile PDF Tablosu Nasıl Okunur

Bu kısa nasıl yapılır öğreticisi, C#’ta PDF tablosunun nasıl okunacağı ve içindeki tüm içeriğin nasıl okunacağı hakkında kılavuzlar. Bir PDF dosyasındaki tüm tabloları ayrıştırmak ve ardından belirli bir tablonun her bir satırına ve hücresine erişmek için ayrıntılı bir açıklama sağlar. PDF’den tablo okumak için C# kodu, kaynak PDF dosyasının yüklendiği birkaç satırdan oluşur ve ardından içeriği okumak için tüm tablolar ayrıştırılır.

C# ile PDF Tablosu Okuma Adımları

  1. PDF’deki tablo verilerini okumak için Aspose.PDF for .NET öğesine bir referans ekleyin
  2. Document sınıf nesnesini kullanarak kaynak PDF dosyasını yükleyin
  3. TableAbsorber sınıf nesnesini örnekleyin ve istediğiniz PDF sayfasından tüm tabloları okuyun
  4. Hedef PDF tablosundaki tüm satırları yineleyin
  5. Her satırdaki tüm hücreleri yineleyin ve tüm metin parçalarını getirin
  6. Bir hücredeki her metin parçasını görüntüleyin veya işleyin

Bu adımlarda PDF tablosunu C#‘da okumak için sistematik bir yaklaşım izlenir, burada ilk olarak PDF dosyası yüklenir ve ardından tüm tablolar TableAbsorber sınıf nesnesi kullanılarak ayrıştırılır. PDF dosyasındaki tüm tablolar ziyaret edildiğinde, ayrıştırılmış koleksiyondaki tablolardan herhangi birinin referansını alabilirsiniz. Bir PDF dosyasındaki herhangi bir tabloya, satıra, hücreye ve metin parçasına onu işlemek veya görüntülemek için erişebilirsiniz.

C# ile PDF Tablosunu Okumak İçin Kod

using System;
using Aspose.Pdf;
using Aspose.Pdf.Text;
namespace ReadPDFTableInCSharp
{
class Program
{
static void Main(string[] args)
{
// Instantiate the license to avoid trial limitations while reading table data from PDF
License asposePdfLicense = new License();
asposePdfLicense.SetLicense("Aspose.pdf.lic");
// Load source PDF document having a table in it
Aspose.Pdf.Document pdfDocument = new Aspose.Pdf.Document(@"PdfWithTable.pdf");
// Declare and initialize TableAbsorber class object for reading table from the PDF
Aspose.Pdf.Text.TableAbsorber tableAbsorber = new Aspose.Pdf.Text.TableAbsorber();
// Parse all the tables from the desired page in the PDF
tableAbsorber.Visit(pdfDocument.Pages[1]);
// Get reference to the first table in the parsed collection
AbsorbedTable absorbedTable = tableAbsorber.TableList[0];
// Iterate through all the rows in the PDF table
foreach (AbsorbedRow pdfTableRow in absorbedTable.RowList)
{
// Iterate through all the cells in the pdf table row
foreach (AbsorbedCell pdfTableCell in pdfTableRow.CellList)
{
// Fetch all the text fragments in the cell
TextFragmentCollection textFragmentCollection = pdfTableCell.TextFragments;
// Iterate through all the text fragments
foreach (TextFragment textFragment in textFragmentCollection)
{
// Display the text
Console.WriteLine(textFragment.Text);
}
}
}
System.Console.WriteLine("Done");
}
}
}

Bu örnek kodda C# ayrıştırma PDF tablosu kullanımı, tabloları okumak için kullanılan TableAbsorber sınıfı kullanılarak mümkün hale getirilmiştir. Ancak, belgenin farklı öğelerine erişmek için TextAbsorber, ParagraphAbsorber, FontAbsorber ve TextFragmentAbsorber gibi diğer seçenekleri de kullanabilirsiniz. Tüm koleksiyonu yineleyebilir veya dizi dizinini kullanarak tek tek öğelere erişebilirsiniz.

Bu konuda C#* ile *PDF tablosunun nasıl okunacağını öğrendik. Ancak, PDF yer imlerini okumak istiyorsanız C# kullanarak PDF’deki yer imleri nasıl okunur makalesine bakın.

 Türkçe