यह त्वरित ट्यूटोरियल पायथन में PDF सामग्री कैसे पढ़ें पर आपका मार्गदर्शन करता है। यह एप्लिकेशन में उपयोग किए जाने वाले सभी संसाधनों, आवश्यक वर्गों और विधियों का परिचय देता है। इसमें केवल किसी अन्य तृतीय-पक्ष टूल का उपयोग किए बिना कोड की बहुत कम पंक्तियों की सहायता से **पायथन का उपयोग करके पीडीएफ पढ़ने के लिए एक रननेबल नमूना कोड भी शामिल है।
पायथन के साथ पीडीएफ पढ़ने के चरण
- PDF टेक्स्ट पढ़ने के लिए IDE को .NET के माध्यम से पायथन के लिए Aspose.PDF का उपयोग करें पर सेट करें
- Document ऑब्जेक्ट का उपयोग करके स्रोत PDF फ़ाइल लोड करें जिसका डेटा पढ़ा जाना है
- PDF से टेक्स्ट निकालने के लिए TextAbsorber ऑब्जेक्ट को इंस्टेंट करें
- लोड की गई पीडीएफ फाइल में पूरे पाठ को पढ़ने के लिए स्वीकार () विधि को कॉल करें
- टेक्स्टएब्जॉर्बर ऑब्जेक्ट के टेक्स्ट गुण का उपयोग करके निकाले गए टेक्स्ट को प्रदर्शित करें
ये कदम पीडीएफ फाइल को लोड करने के लिए डॉक्यूमेंट क्लास, पीडीएफ से टेक्स्ट लाने के लिए टेक्स्टएब्जॉर्बर क्लास ऑब्जेक्ट, और स्वीकार () विधि जो वास्तव में टेक्स्ट की संपत्ति को भरता है, को प्रस्तुत करके * पायथन में एक पीडीएफ फाइल को पढ़ने की प्रक्रिया को सारांशित करता है। पाठ अवशोषक वस्तु। एक बार स्वीकार () विधि को कॉल करने के बाद, पाठ संपत्ति में स्ट्रिंग डेटा को आगे की प्रक्रिया के लिए मुद्रित या पार्स किया जा सकता है।
पायथन में पीडीएफ फाइल पढ़ने के लिए कोड
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Load the PDF file | |
pdfFile = pdf.Document("ImageAndText.pdf") | |
# Initialize TextAbsorber object | |
textAbsorber = pdf.text.TextAbsorber() | |
# Call Page.Accept() method to fetch text | |
pdfFile.pages.accept(textAbsorber) | |
# Display the text | |
print(textAbsorber.text) | |
print("Process completed") |
उपरोक्त कोड खंड Python का उपयोग करके PDF फ़ाइल से डेटा निकालने की प्रक्रिया को प्रदर्शित करता है। टेक्स्टएब्जॉर्बर वर्ग शुद्ध, कच्चे, चपटे या मेमोरी सेविंग मोड में टेक्स्ट निकालने के लिए टेक्स्टफॉर्मेटिंगमोड का समर्थन करता है। इसके अलावा, टेक्स्टएब्जॉर्बर वर्ग पीडीएफ से डेटा लाने के दौरान एक त्रुटि सूची देता है और एक आयत को परिभाषित करने का समर्थन करता है जिसके भीतर पीडीएफ पेज से पाठ प्राप्त किया जाता है।
इस लेख ने हमें Python में PDF पढ़ना सिखाया है। यदि आप PDF से बुकमार्क पढ़ने की प्रक्रिया सीखना चाहते हैं, तो पायथन का उपयोग करके पीडीएफ में बुकमार्क कैसे पढ़ें पर लेख देखें।