यह संक्षिप्त ‘कैसे करें’ ट्यूटोरियल C# में PDF तालिका को कैसे पढ़ें और इसके अंदर की सभी सामग्री को कैसे पढ़ें, इस पर मार्गदर्शन करता है। यह एक पीडीएफ फाइल में सभी तालिकाओं को पार्स करने और फिर किसी विशेष तालिका की प्रत्येक व्यक्तिगत पंक्ति और सेल तक पहुँचने के लिए एक विस्तृत विवरण प्रदान करता है। पीडीएफ से तालिका को पढ़ने के लिए सी# कोड में कुछ पंक्तियां होती हैं जिससे स्रोत पीडीएफ फाइल लोड होती है और फिर सभी तालिकाओं को सामग्री पढ़ने के लिए पार्स किया जाता है।
सी # में पीडीएफ टेबल पढ़ने के लिए कदम
- PDF में तालिका डेटा पढ़ने के लिए Aspose.PDF for .NET का संदर्भ जोड़ें
- Document क्लास ऑब्जेक्ट का उपयोग करके स्रोत PDF फ़ाइल लोड करें
- TableAbsorber क्लास ऑब्जेक्ट को इंस्टेंट करें और वांछित पीडीएफ पेज से सभी टेबल पढ़ें
- लक्ष्य PDF तालिका में सभी पंक्तियों के माध्यम से पुनरावृति करें
- प्रत्येक पंक्ति में सभी कक्षों को पुनरावृत्त करें और सभी पाठ अंश प्राप्त करें
- सेल में प्रत्येक टेक्स्ट फ़्रैगमेंट को प्रदर्शित या संसाधित करें
इन चरणों में सी#* में पीडीएफ तालिका को पढ़ने के लिए एक व्यवस्थित दृष्टिकोण का पालन किया जाता है, जहां प्रारंभ में पीडीएफ फाइल लोड की जाती है और फिर टेबलएब्जॉर्बर क्लास ऑब्जेक्ट का उपयोग करके सभी तालिकाओं को पार्स किया जाता है। एक बार पीडीएफ फाइल में सभी तालिकाओं का दौरा करने के बाद, आपको पार्स किए गए संग्रह में किसी भी तालिका का संदर्भ मिल सकता है। आप किसी भी टेबल, रो, सेल और टेक्स्ट के टुकड़े को पीडीएफ फाइल में प्रोसेस या प्रदर्शित करने के लिए एक्सेस कर सकते हैं।
सी # में पीडीएफ टेबल पढ़ने के लिए कोड
using System; | |
using Aspose.Pdf; | |
using Aspose.Pdf.Text; | |
namespace ReadPDFTableInCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Instantiate the license to avoid trial limitations while reading table data from PDF | |
License asposePdfLicense = new License(); | |
asposePdfLicense.SetLicense("Aspose.pdf.lic"); | |
// Load source PDF document having a table in it | |
Aspose.Pdf.Document pdfDocument = new Aspose.Pdf.Document(@"PdfWithTable.pdf"); | |
// Declare and initialize TableAbsorber class object for reading table from the PDF | |
Aspose.Pdf.Text.TableAbsorber tableAbsorber = new Aspose.Pdf.Text.TableAbsorber(); | |
// Parse all the tables from the desired page in the PDF | |
tableAbsorber.Visit(pdfDocument.Pages[1]); | |
// Get reference to the first table in the parsed collection | |
AbsorbedTable absorbedTable = tableAbsorber.TableList[0]; | |
// Iterate through all the rows in the PDF table | |
foreach (AbsorbedRow pdfTableRow in absorbedTable.RowList) | |
{ | |
// Iterate through all the cells in the pdf table row | |
foreach (AbsorbedCell pdfTableCell in pdfTableRow.CellList) | |
{ | |
// Fetch all the text fragments in the cell | |
TextFragmentCollection textFragmentCollection = pdfTableCell.TextFragments; | |
// Iterate through all the text fragments | |
foreach (TextFragment textFragment in textFragmentCollection) | |
{ | |
// Display the text | |
Console.WriteLine(textFragment.Text); | |
} | |
} | |
} | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
इस नमूना कोड में सी# पार्स पीडीएफ टेबल का उपयोग टेबलएब्सॉर्बर क्लास का उपयोग करके संभव बनाया गया है जिसका उपयोग टेबल पढ़ने के लिए किया जाता है। हालाँकि, आप दस्तावेज़ के विभिन्न तत्वों तक पहुँचने के लिए TextAbsorber, ParagraphAbsorber, FontAbsorber और TextFragmentAbsorber जैसे अन्य विकल्पों का भी उपयोग कर सकते हैं। आप या तो पूरे संग्रह के माध्यम से पुनरावृति कर सकते हैं या सरणी अनुक्रमणिका का उपयोग करके अलग-अलग तत्वों तक पहुंच सकते हैं।
हमने इस विषय में *सी#में PDF तालिका को *पढ़ने का तरीका सीखा है। हालांकि, यदि आप पीडीएफ बुकमार्क पढ़ना चाहते हैं तो सी # का उपयोग कर पीडीएफ में बुकमार्क कैसे पढ़ा जाए पर लेख देखें।