يوجه هذا البرنامج التعليمي الإرشادي المختصر حول ** كيفية قراءة جدول PDF في C# ** وقراءة جميع المحتويات بداخله. يوفر وصفًا تفصيليًا لتحليل جميع الجداول في ملف PDF ثم الوصول إلى كل صف فردي وخلية في جدول معين. من أجل * قراءة الجدول من كود PDF C# * يتكون من بضعة أسطر حيث يتم تحميل ملف PDF المصدر ثم يتم تحليل جميع الجداول لمحتويات القراءة.
خطوات قراءة جدول PDF في C#
- أضف مرجعًا إلى Aspose.PDF for .NET لقراءة بيانات الجدول في ملف PDF
- قم بتحميل ملف PDF المصدر باستخدام كائن فئة Document
- قم بإنشاء كائن فئة TableAbsorber واقرأ جميع الجداول من صفحة PDF المطلوبة
- كرر خلال جميع الصفوف في جدول PDF الهدف
- كرر كل الخلايا في كل صف وجلب كل أجزاء النص
- عرض أو معالجة كل جزء نصي في خلية
يتم اتباع نهج منظم في هذه الخطوات * لقراءة جدول PDF في C# * ، حيث يتم تحميل ملف PDF مبدئيًا ثم يتم تحليل جميع الجداول باستخدام كائن فئة TableAbsorber. بمجرد زيارة جميع الجداول في ملف PDF ، يمكنك الحصول على مرجع لأي من الجداول في المجموعة المحللة. يمكنك الوصول إلى أي جدول أو صف أو خلية أو جزء نصي في ملف PDF لمعالجته أو عرضه.
كود لقراءة جدول PDF في C#
using System; | |
using Aspose.Pdf; | |
using Aspose.Pdf.Text; | |
namespace ReadPDFTableInCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Instantiate the license to avoid trial limitations while reading table data from PDF | |
License asposePdfLicense = new License(); | |
asposePdfLicense.SetLicense("Aspose.pdf.lic"); | |
// Load source PDF document having a table in it | |
Aspose.Pdf.Document pdfDocument = new Aspose.Pdf.Document(@"PdfWithTable.pdf"); | |
// Declare and initialize TableAbsorber class object for reading table from the PDF | |
Aspose.Pdf.Text.TableAbsorber tableAbsorber = new Aspose.Pdf.Text.TableAbsorber(); | |
// Parse all the tables from the desired page in the PDF | |
tableAbsorber.Visit(pdfDocument.Pages[1]); | |
// Get reference to the first table in the parsed collection | |
AbsorbedTable absorbedTable = tableAbsorber.TableList[0]; | |
// Iterate through all the rows in the PDF table | |
foreach (AbsorbedRow pdfTableRow in absorbedTable.RowList) | |
{ | |
// Iterate through all the cells in the pdf table row | |
foreach (AbsorbedCell pdfTableCell in pdfTableRow.CellList) | |
{ | |
// Fetch all the text fragments in the cell | |
TextFragmentCollection textFragmentCollection = pdfTableCell.TextFragments; | |
// Iterate through all the text fragments | |
foreach (TextFragment textFragment in textFragmentCollection) | |
{ | |
// Display the text | |
Console.WriteLine(textFragment.Text); | |
} | |
} | |
} | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
في نموذج التعليمات البرمجية هذا باستخدام * C# parse PDF table * أصبح ممكنًا باستخدام فئة TableAbsorber التي تُستخدم لقراءة الجداول. ومع ذلك ، يمكنك أيضًا استخدام خيارات أخرى مثل TextAbsorber و ParagraphAbsorber و FontAbsorber و TextFragmentAbsorber للوصول إلى عناصر مختلفة من المستند. يمكنك إما التكرار خلال المجموعة بأكملها أو الوصول إلى العناصر الفردية باستخدام فهرس الصفيف.
لقد تعلمنا كيفية قراءة * جدول PDF في C# * في هذا الموضوع. ومع ذلك ، إذا كنت تريد قراءة إشارات مرجعية بتنسيق PDF ، فارجع إلى المقالة الموجودة على كيفية قراءة الإشارات المرجعية في PDF باستخدام C#.