यह त्वरित ट्यूटोरियल आपको पायथन में DOCX फ़ाइल कैसे पढ़ें पर मार्गदर्शन करता है। इसमें पर्यावरण को कॉन्फ़िगर करने के लिए आवश्यक पूरी जानकारी, कोड लिखते समय पालन करने के चरण और एक रन करने योग्य नमूना पायथन कोड शामिल है। आप DOC फ़ाइल को Python** में भी पढ़ सकते हैं, साथ ही समान निर्देशों का उपयोग करके अन्य सभी MS Word समर्थित फ़ाइलें भी पढ़ सकते हैं।
पायथन में DOCX फ़ाइल पढ़ने के चरण
- DOCX फ़ाइल पढ़ने के लिए Aspose.Words for Python by .NET का उपयोग करने के लिए विकास परिवेश सेट करें
- aspose.words नामस्थान आयात करें और इसके लिए उपनाम सेट करें
- इनपुट DOCX फ़ाइल को दस्तावेज़ क्लास ऑब्जेक्ट में लोड करें जिसे पायथन का उपयोग करके पढ़ा जाना है
- लोड किए गए DOCX से सभी पैराग्राफ नोड्स लाने के लिए एक लूप निष्पादित करें
- प्रत्येक नोड को एक पैराग्राफ में कास्ट करें
- प्रत्येक अनुच्छेद से सामग्री निकालें और उन्हें प्रदर्शन के लिए स्ट्रिंग में बदलें
ये चरण इस प्रश्न का उत्तर देते हैं कि कॉन्फ़िगरेशन और अन्य आवश्यक विवरण साझा करके पायथन वर्ड दस्तावेज़ कैसे पढ़ सकता है। यह आवश्यक नामस्थानों को आयात करने, DOCX फ़ाइल को लोड करने के तरीकों, इस नमूना कोड में अनुच्छेद जैसे किसी विशेष प्रकार के सभी नोड्स के माध्यम से पुनरावृति करने और फिर कंसोल पर प्रदर्शन के लिए प्रत्येक अनुच्छेद सामग्री को एक स्ट्रिंग में परिवर्तित करने के लिए मार्गदर्शन करता है।
पायथन में वर्ड फाइल पढ़ने के लिए कोड
पायथन में यह कोड वर्ड फ़ाइल को लोड करके और फिर उसकी सभी सामग्री के माध्यम से पुनरावृत्त करके पढ़ता है। आप पैराग्राफ के बीच चयनित टेक्स्ट को भी पढ़ सकते हैं, और कुछ को सूचीबद्ध करने के लिए विभिन्न प्रकार के नोड्स जैसे सेक्शन, बॉडी, टेबल, शेप, कमेंट और हेडर फुटर तक पहुंच प्राप्त कर सकते हैं। आप Document.built_in_document_properties संग्रह के माध्यम से पुनरावृति करके और आवश्यक जानकारी प्राप्त करने के लिए प्रत्येक आइटम के “नाम” और “मान” गुणों का उपयोग करके अंतर्निहित गुणों जैसे दस्तावेज़-स्तर की जानकारी भी प्राप्त कर सकते हैं।
इस लेख ने पायथन में एक वर्ड फ़ाइल को पढ़ने का प्रदर्शन किया है। यदि आप Word फ़ाइल बनाने में रुचि रखते हैं, तो पायथन का उपयोग करके वर्ड डॉक्यूमेंट कैसे बनाएं पर लेख देखें।