पायथन का उपयोग करके पीडीएफ मेटाडेटा कैसे पढ़ें

यह त्वरित ट्यूटोरियल बताता है पायथन का उपयोग करके पीडीएफ मेटाडेटा कैसे पढ़ें। इसमें एप्लिकेशन को विकसित करने के लिए पर्यावरण सेट करने के लिए विस्तृत जानकारी, एक चरणबद्ध प्रक्रिया, और Python का उपयोग करके PDF से मेटाडेटा निकालने के लिए एक रन करने योग्य नमूना कोड शामिल है। आप सीखेंगे कि किसी भी पायथन-समर्थित वातावरण में किसी भी तृतीय-पक्ष उपकरण को स्थापित किए बिना बहुत कम एपीआई कॉल का उपयोग करके एप्लिकेशन लिखना और PDF से मेटाडेटा जानकारी तक पहुंचना कितना आसान है।

पायथन का उपयोग करके पीडीएफ मेटाडेटा पढ़ने के चरण

  1. मेटाडेटा पढ़ने के लिए .NET के माध्यम से पायथन के लिए Aspose.PDF का उपयोग करें के लिए वातावरण स्थापित करें
  2. मेटाडेटा लाने के लिए Document क्लास ऑब्जेक्ट का उपयोग करके स्रोत PDF फ़ाइल लोड करें
  3. PDF मेटाडेटा वाले DocumentInfo क्लास ऑब्जेक्ट तक पहुंच प्राप्त करें
  4. कुछ सूचना गुणों तक पहुँचें और उन्हें कंसोल पर प्रदर्शित करें

ये चरण प्रक्रिया का वर्णन करते हैं Python का उपयोग करके PDF मेटाडेटा देखें। सबसे पहले, आपको लक्ष्य पीडीएफ फाइल को लोड करना होगा और फिर डॉक्यूमेंट क्लास में ‘इन्फो’ नाम की डॉक्यूमेंटइन्फो प्रॉपर्टी को एक्सेस करना होगा। इस ऑब्जेक्ट में पीडीएफ में निर्माता, संशोधन समय क्षेत्र, निर्माता, निर्माण तिथि और संशोधन तिथि जैसे सभी मेटाडेटा हैं।

पायथन का उपयोग करके पीडीएफ मेटाडेटा प्राप्त करने के लिए कोड

यह कोड केवल पायथन * का उपयोग करके पीडीएफ मेटाडेटा लाने की प्रक्रिया को प्रदर्शित करता है। DocumentInfo क्लास ऑब्जेक्ट को लोड किए गए दस्तावेज़ से एक्सेस किया जाता है जिसमें ट्रैप किए गए फ़्लैग, शीर्षक, विषय, दस्तावेज़ के कीवर्ड और लेखक जैसी कई मेटाडेटा जानकारी होती है। यदि आप इन गुणों को जोड़ना चाहते हैं तो आप DocumentInfo.add () विधि का उपयोग कर सकते हैं, मेटाडेटा को साफ़ करने के लिए स्पष्ट () विधि का उपयोग कर सकते हैं और केवल निर्दिष्ट मेटाडेटा को हटाने के लिए निकालें () विधि का उपयोग कर सकते हैं।

इस लेख में पीडीएफ से मेटाडेटा को पुनः प्राप्त करने की प्रक्रिया का वर्णन किया गया है। यदि आप PDF सामग्री को पढ़ने की प्रक्रिया सीखना चाहते हैं, तो पायथन में पीडीएफ सामग्री कैसे पढ़ें पर लेख देखें।

 हिन्दी