सी # का उपयोग कर पीडीएफ को टेक्स्ट फाइल में कैसे बदलें

यह बुनियादी ट्यूटोरियल आपको कॉन्फ़िगरेशन सेटिंग्स और एक रन करने योग्य कोड स्निपेट सहित C#** का उपयोग करके **पीडीएफ को टेक्स्ट फ़ाइल में कनवर्ट करने के तरीके के बारे में मार्गदर्शन करता है। यह दर्शाता है कि कैसे कुछ एपीआई कॉल के साथ सी# पीडीएफ से टेक्स्ट कनवर्टर का उपयोग किया जा सकता है। आपको केवल स्रोत PDF दस्तावेज़ लोड करने और आउटपुट Text फ़ाइल सहेजने की आवश्यकता है।

सी#का उपयोग करके पीडीएफ को टेक्स्ट फाइल में बदलने के लिए कदम

  1. PDF को टेक्स्ट फ़ाइल में बदलने के लिए अपने आवेदन में Aspose.PDF for .NET का संदर्भ जोड़ें
  2. टेक्स्ट फ़ाइल बनाने के लिए Document क्लास इंस्टेंस का उपयोग करके स्रोत PDF फ़ाइल लोड करें
  3. TextAbsorber कक्षा का एक उदाहरण बनाएं और सभी पृष्ठों से टेक्स्ट निकालें
  4. आउटपुट टेक्स्ट फ़ाइल सहेजें

.NET ढांचे में पीडीएफ टू टेक्स्ट कन्वर्टर सी# आधारित एप्लिकेशन कॉन्फ़िगरेशन लिखने के लिए और एक चरण-दर-चरण प्रक्रिया यहां प्रदान की गई है। पहले चरण के रूप में, जल्दी से एपीआई को कॉन्फ़िगर करें और इनपुट पीडीएफ फाइल को लोड करें। इसके बाद, हम इसके सभी पृष्ठों से टेक्स्ट निकालने के लिए आगे बढ़ते हैं और निकाले गए टेक्स्ट को आवश्यकता के अनुसार फ़ाइल या स्ट्रीम में लिखते हैं।

सी # का उपयोग कर पीडीएफ को टेक्स्ट में कनवर्ट करने के लिए कोड स्निपेट

using System.IO;
using Aspose.Pdf;
using Aspose.Pdf.Text;
namespace ConvertPdfToTextUsingCSharp
{
class Program
{
static void Main(string[] args)
{
// Instantiate the license to avoid evaluation limitations while converting a PDF to Text
License PdfToTextLicense = new License();
PdfToTextLicense.SetLicense("Aspose.pdf.lic");
// Open document
Document pdfDocument = new Document("PDFtoText.pdf");
// Instantiate a TextAbsorber class object for extracting the text
TextAbsorber textAbsorber = new TextAbsorber(new TextExtractionOptions(TextExtractionOptions.TextFormattingMode.Pure),new TextSearchOptions(new Rectangle(5,5,50,50)));
// Call the Accept() function to parse all the pages for reading text
pdfDocument.Pages.Accept(textAbsorber);
// Get extracted text as string
string ExtractedText = textAbsorber.Text;
// Save the text file
File.WriteAllText("PDFtoText.txt" , ExtractedText);
System.Console.WriteLine("Done");
}
}
}

सी# का उपयोग करके पीडीएफ को टेक्स्ट में बदलें फीचर को आपके एप्लिकेशन में सोर्स पीडीएफ से टेक्स्ट पढ़ने पर नियंत्रण के साथ एकीकृत किया जा सकता है जैसे आप सभी पेजों से या किसी निर्दिष्ट पेज से टेक्स्ट पढ़ सकते हैं। इसी तरह, यदि आप पीडीएफ पेज पर किसी विशेष आयत क्षेत्र से पाठ पढ़ना चाहते हैं, तो आपको उस आयताकार क्षेत्र को भी परिभाषित करने की स्वतंत्रता है। पीडीएफ को प्योर, रॉ और मेमोरी सेविंग जैसे टेक्स्ट में बदलने के लिए अलग-अलग मोड भी परिभाषित किए जा सकते हैं।

इस लेख में, हमने सीखा है कि आपके .NET अनुप्रयोगों में PDF to Text C# कोड का उपयोग कैसे किया जा सकता है। हालांकि, अगर आप पीडीएफ को एचटीएमएल दस्तावेज़ों में बदलना चाहते हैं, तो सी # का उपयोग कर पीडीएफ को एचटीएमएल में कैसे परिवर्तित करें पर लेख देखें।

 हिन्दी