यह त्वरित ट्यूटोरियल बताता है पायथन का उपयोग करके पीडीएफ मेटाडेटा कैसे पढ़ें। इसमें एप्लिकेशन को विकसित करने के लिए पर्यावरण सेट करने के लिए विस्तृत जानकारी, एक चरणबद्ध प्रक्रिया, और Python का उपयोग करके PDF से मेटाडेटा निकालने के लिए एक रन करने योग्य नमूना कोड शामिल है। आप सीखेंगे कि किसी भी पायथन-समर्थित वातावरण में किसी भी तृतीय-पक्ष उपकरण को स्थापित किए बिना बहुत कम एपीआई कॉल का उपयोग करके एप्लिकेशन लिखना और PDF से मेटाडेटा जानकारी तक पहुंचना कितना आसान है।
पायथन का उपयोग करके पीडीएफ मेटाडेटा पढ़ने के चरण
- मेटाडेटा पढ़ने के लिए .NET के माध्यम से पायथन के लिए Aspose.PDF का उपयोग करें के लिए वातावरण स्थापित करें
- मेटाडेटा लाने के लिए Document क्लास ऑब्जेक्ट का उपयोग करके स्रोत PDF फ़ाइल लोड करें
- PDF मेटाडेटा वाले DocumentInfo क्लास ऑब्जेक्ट तक पहुंच प्राप्त करें
- कुछ सूचना गुणों तक पहुँचें और उन्हें कंसोल पर प्रदर्शित करें
ये चरण प्रक्रिया का वर्णन करते हैं Python का उपयोग करके PDF मेटाडेटा देखें। सबसे पहले, आपको लक्ष्य पीडीएफ फाइल को लोड करना होगा और फिर डॉक्यूमेंट क्लास में ‘इन्फो’ नाम की डॉक्यूमेंटइन्फो प्रॉपर्टी को एक्सेस करना होगा। इस ऑब्जेक्ट में पीडीएफ में निर्माता, संशोधन समय क्षेत्र, निर्माता, निर्माण तिथि और संशोधन तिथि जैसे सभी मेटाडेटा हैं।
पायथन का उपयोग करके पीडीएफ मेटाडेटा प्राप्त करने के लिए कोड
import aspose.pdf as pdf | |
# Load the license | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Open document | |
pdfDocument = pdf.Document("InputFile.pdf") | |
# Get document information | |
docInfo = pdfDocument.info | |
# Show document information | |
print("Creator: " + docInfo.creator) | |
print("ModTimeZone: " + str(docInfo.mod_time_zone)) | |
print("Producer: " + docInfo.producer) | |
print("CreationDate: " + str(docInfo.creation_date)) | |
print("ModDate: " + str(docInfo.mod_date)) | |
print("PDF metadata read successfully") |
यह कोड केवल पायथन * का उपयोग करके पीडीएफ मेटाडेटा लाने की प्रक्रिया को प्रदर्शित करता है। DocumentInfo क्लास ऑब्जेक्ट को लोड किए गए दस्तावेज़ से एक्सेस किया जाता है जिसमें ट्रैप किए गए फ़्लैग, शीर्षक, विषय, दस्तावेज़ के कीवर्ड और लेखक जैसी कई मेटाडेटा जानकारी होती है। यदि आप इन गुणों को जोड़ना चाहते हैं तो आप DocumentInfo.add () विधि का उपयोग कर सकते हैं, मेटाडेटा को साफ़ करने के लिए स्पष्ट () विधि का उपयोग कर सकते हैं और केवल निर्दिष्ट मेटाडेटा को हटाने के लिए निकालें () विधि का उपयोग कर सकते हैं।
इस लेख में पीडीएफ से मेटाडेटा को पुनः प्राप्त करने की प्रक्रिया का वर्णन किया गया है। यदि आप PDF सामग्री को पढ़ने की प्रक्रिया सीखना चाहते हैं, तो पायथन में पीडीएफ सामग्री कैसे पढ़ें पर लेख देखें।