पायथन का उपयोग करके पीडीएफ मेटाडेटा कैसे पढ़ें

यह त्वरित ट्यूटोरियल बताता है पायथन का उपयोग करके पीडीएफ मेटाडेटा कैसे पढ़ें। इसमें एप्लिकेशन को विकसित करने के लिए पर्यावरण सेट करने के लिए विस्तृत जानकारी, एक चरणबद्ध प्रक्रिया, और Python का उपयोग करके PDF से मेटाडेटा निकालने के लिए एक रन करने योग्य नमूना कोड शामिल है। आप सीखेंगे कि किसी भी पायथन-समर्थित वातावरण में किसी भी तृतीय-पक्ष उपकरण को स्थापित किए बिना बहुत कम एपीआई कॉल का उपयोग करके एप्लिकेशन लिखना और PDF से मेटाडेटा जानकारी तक पहुंचना कितना आसान है।

पायथन का उपयोग करके पीडीएफ मेटाडेटा पढ़ने के चरण

  1. मेटाडेटा पढ़ने के लिए .NET के माध्यम से पायथन के लिए Aspose.PDF का उपयोग करें के लिए वातावरण स्थापित करें
  2. मेटाडेटा लाने के लिए Document क्लास ऑब्जेक्ट का उपयोग करके स्रोत PDF फ़ाइल लोड करें
  3. PDF मेटाडेटा वाले DocumentInfo क्लास ऑब्जेक्ट तक पहुंच प्राप्त करें
  4. कुछ सूचना गुणों तक पहुँचें और उन्हें कंसोल पर प्रदर्शित करें

ये चरण प्रक्रिया का वर्णन करते हैं Python का उपयोग करके PDF मेटाडेटा देखें। सबसे पहले, आपको लक्ष्य पीडीएफ फाइल को लोड करना होगा और फिर डॉक्यूमेंट क्लास में ‘इन्फो’ नाम की डॉक्यूमेंटइन्फो प्रॉपर्टी को एक्सेस करना होगा। इस ऑब्जेक्ट में पीडीएफ में निर्माता, संशोधन समय क्षेत्र, निर्माता, निर्माण तिथि और संशोधन तिथि जैसे सभी मेटाडेटा हैं।

पायथन का उपयोग करके पीडीएफ मेटाडेटा प्राप्त करने के लिए कोड

import aspose.pdf as pdf
# Load the license
license = pdf.License()
license.set_license("Aspose.Total.lic")
# Open document
pdfDocument = pdf.Document("InputFile.pdf")
# Get document information
docInfo = pdfDocument.info
# Show document information
print("Creator: " + docInfo.creator)
print("ModTimeZone: " + str(docInfo.mod_time_zone))
print("Producer: " + docInfo.producer)
print("CreationDate: " + str(docInfo.creation_date))
print("ModDate: " + str(docInfo.mod_date))
print("PDF metadata read successfully")

यह कोड केवल पायथन * का उपयोग करके पीडीएफ मेटाडेटा लाने की प्रक्रिया को प्रदर्शित करता है। DocumentInfo क्लास ऑब्जेक्ट को लोड किए गए दस्तावेज़ से एक्सेस किया जाता है जिसमें ट्रैप किए गए फ़्लैग, शीर्षक, विषय, दस्तावेज़ के कीवर्ड और लेखक जैसी कई मेटाडेटा जानकारी होती है। यदि आप इन गुणों को जोड़ना चाहते हैं तो आप DocumentInfo.add () विधि का उपयोग कर सकते हैं, मेटाडेटा को साफ़ करने के लिए स्पष्ट () विधि का उपयोग कर सकते हैं और केवल निर्दिष्ट मेटाडेटा को हटाने के लिए निकालें () विधि का उपयोग कर सकते हैं।

इस लेख में पीडीएफ से मेटाडेटा को पुनः प्राप्त करने की प्रक्रिया का वर्णन किया गया है। यदि आप PDF सामग्री को पढ़ने की प्रक्रिया सीखना चाहते हैं, तो पायथन में पीडीएफ सामग्री कैसे पढ़ें पर लेख देखें।

 हिन्दी