पायथन में पीडीएफ सामग्री कैसे पढ़ें

यह त्वरित ट्यूटोरियल पायथन में PDF सामग्री कैसे पढ़ें पर आपका मार्गदर्शन करता है। यह एप्लिकेशन में उपयोग किए जाने वाले सभी संसाधनों, आवश्यक वर्गों और विधियों का परिचय देता है। इसमें केवल किसी अन्य तृतीय-पक्ष टूल का उपयोग किए बिना कोड की बहुत कम पंक्तियों की सहायता से **पायथन का उपयोग करके पीडीएफ पढ़ने के लिए एक रननेबल नमूना कोड भी शामिल है।

पायथन के साथ पीडीएफ पढ़ने के चरण

  1. PDF टेक्स्ट पढ़ने के लिए IDE को .NET के माध्यम से पायथन के लिए Aspose.PDF का उपयोग करें पर सेट करें
  2. Document ऑब्जेक्ट का उपयोग करके स्रोत PDF फ़ाइल लोड करें जिसका डेटा पढ़ा जाना है
  3. PDF से टेक्स्ट निकालने के लिए TextAbsorber ऑब्जेक्ट को इंस्टेंट करें
  4. लोड की गई पीडीएफ फाइल में पूरे पाठ को पढ़ने के लिए स्वीकार () विधि को कॉल करें
  5. टेक्स्टएब्जॉर्बर ऑब्जेक्ट के टेक्स्ट गुण का उपयोग करके निकाले गए टेक्स्ट को प्रदर्शित करें

ये कदम पीडीएफ फाइल को लोड करने के लिए डॉक्यूमेंट क्लास, पीडीएफ से टेक्स्ट लाने के लिए टेक्स्टएब्जॉर्बर क्लास ऑब्जेक्ट, और स्वीकार () विधि जो वास्तव में टेक्स्ट की संपत्ति को भरता है, को प्रस्तुत करके * पायथन में एक पीडीएफ फाइल को पढ़ने की प्रक्रिया को सारांशित करता है। पाठ अवशोषक वस्तु। एक बार स्वीकार () विधि को कॉल करने के बाद, पाठ संपत्ति में स्ट्रिंग डेटा को आगे की प्रक्रिया के लिए मुद्रित या पार्स किया जा सकता है।

पायथन में पीडीएफ फाइल पढ़ने के लिए कोड

import aspose.pdf as pdf
# Load License
license = pdf.License()
license.set_license("Aspose.Total.lic")
# Load the PDF file
pdfFile = pdf.Document("ImageAndText.pdf")
# Initialize TextAbsorber object
textAbsorber = pdf.text.TextAbsorber()
# Call Page.Accept() method to fetch text
pdfFile.pages.accept(textAbsorber)
# Display the text
print(textAbsorber.text)
print("Process completed")

उपरोक्त कोड खंड Python का उपयोग करके PDF फ़ाइल से डेटा निकालने की प्रक्रिया को प्रदर्शित करता है। टेक्स्टएब्जॉर्बर वर्ग शुद्ध, कच्चे, चपटे या मेमोरी सेविंग मोड में टेक्स्ट निकालने के लिए टेक्स्टफॉर्मेटिंगमोड का समर्थन करता है। इसके अलावा, टेक्स्टएब्जॉर्बर वर्ग पीडीएफ से डेटा लाने के दौरान एक त्रुटि सूची देता है और एक आयत को परिभाषित करने का समर्थन करता है जिसके भीतर पीडीएफ पेज से पाठ प्राप्त किया जाता है।

इस लेख ने हमें Python में PDF पढ़ना सिखाया है। यदि आप PDF से बुकमार्क पढ़ने की प्रक्रिया सीखना चाहते हैं, तो पायथन का उपयोग करके पीडीएफ में बुकमार्क कैसे पढ़ें पर लेख देखें।

 हिन्दी