पायथन में पीडीएफ सामग्री कैसे पढ़ें

यह त्वरित ट्यूटोरियल पायथन में PDF सामग्री कैसे पढ़ें पर आपका मार्गदर्शन करता है। यह एप्लिकेशन में उपयोग किए जाने वाले सभी संसाधनों, आवश्यक वर्गों और विधियों का परिचय देता है। इसमें केवल किसी अन्य तृतीय-पक्ष टूल का उपयोग किए बिना कोड की बहुत कम पंक्तियों की सहायता से **पायथन का उपयोग करके पीडीएफ पढ़ने के लिए एक रननेबल नमूना कोड भी शामिल है।

पायथन के साथ पीडीएफ पढ़ने के चरण

  1. PDF टेक्स्ट पढ़ने के लिए IDE को .NET के माध्यम से पायथन के लिए Aspose.PDF का उपयोग करें पर सेट करें
  2. Document ऑब्जेक्ट का उपयोग करके स्रोत PDF फ़ाइल लोड करें जिसका डेटा पढ़ा जाना है
  3. PDF से टेक्स्ट निकालने के लिए TextAbsorber ऑब्जेक्ट को इंस्टेंट करें
  4. लोड की गई पीडीएफ फाइल में पूरे पाठ को पढ़ने के लिए स्वीकार () विधि को कॉल करें
  5. टेक्स्टएब्जॉर्बर ऑब्जेक्ट के टेक्स्ट गुण का उपयोग करके निकाले गए टेक्स्ट को प्रदर्शित करें

ये कदम पीडीएफ फाइल को लोड करने के लिए डॉक्यूमेंट क्लास, पीडीएफ से टेक्स्ट लाने के लिए टेक्स्टएब्जॉर्बर क्लास ऑब्जेक्ट, और स्वीकार () विधि जो वास्तव में टेक्स्ट की संपत्ति को भरता है, को प्रस्तुत करके * पायथन में एक पीडीएफ फाइल को पढ़ने की प्रक्रिया को सारांशित करता है। पाठ अवशोषक वस्तु। एक बार स्वीकार () विधि को कॉल करने के बाद, पाठ संपत्ति में स्ट्रिंग डेटा को आगे की प्रक्रिया के लिए मुद्रित या पार्स किया जा सकता है।

पायथन में पीडीएफ फाइल पढ़ने के लिए कोड

उपरोक्त कोड खंड Python का उपयोग करके PDF फ़ाइल से डेटा निकालने की प्रक्रिया को प्रदर्शित करता है। टेक्स्टएब्जॉर्बर वर्ग शुद्ध, कच्चे, चपटे या मेमोरी सेविंग मोड में टेक्स्ट निकालने के लिए टेक्स्टफॉर्मेटिंगमोड का समर्थन करता है। इसके अलावा, टेक्स्टएब्जॉर्बर वर्ग पीडीएफ से डेटा लाने के दौरान एक त्रुटि सूची देता है और एक आयत को परिभाषित करने का समर्थन करता है जिसके भीतर पीडीएफ पेज से पाठ प्राप्त किया जाता है।

इस लेख ने हमें Python में PDF पढ़ना सिखाया है। यदि आप PDF से बुकमार्क पढ़ने की प्रक्रिया सीखना चाहते हैं, तो पायथन का उपयोग करके पीडीएफ में बुकमार्क कैसे पढ़ें पर लेख देखें।

 हिन्दी