पायथन में HTML डॉक्यूमेंट को वर्ड में कैसे बदलें

यह संक्षिप्त ट्यूटोरियल पायथन में HTML दस्तावेज़ को Word में कैसे परिवर्तित करें पर मार्गदर्शन करता है। इसमें नमूना कोड के परीक्षण के लिए आईडीई सेट करने का विवरण, एप्लिकेशन लिखने के लिए चरणों की एक सूची और **पायथन में HTML को DOCX में परिवर्तित करने के लिए एक चलाने योग्य नमूना कोड है। वर्ड फ़ाइल के रूप में सहेजने से पहले लोड की गई HTML फ़ाइल के वैकल्पिक संशोधन के लिए नमूना कोड का भी वर्णन किया जाएगा।

पायथन में HTML को वर्ड डॉक्यूमेंट में बदलने के चरण

  1. HTML को DOCX में परिवर्तित करने के लिए पर्यावरण को .NET के माध्यम से Python के लिए Aspose.Words का उपयोग करें पर स्थापित करें
  2. Aspose.words नेमस्पेस से Document क्लास ऑब्जेक्ट का उपयोग करके स्रोत HTML फ़ाइल खोलें
  3. HTML संशोधन प्रदर्शित करने के लिए HTML फ़ाइल के पहले पैराग्राफ में कुछ नमूना पाठ जोड़ें
  4. Save नाम और प्रारूप सेट करके HTML फ़ाइल को Word फ़ाइल के रूप में लोड करें

उपरोक्त चरण पायथन में HTML को Word DOC में बदलने की प्रक्रिया को परिभाषित करते हैं। लक्ष्य HTML फ़ाइल को aspose.words नेमस्पेस से दस्तावेज़ वर्ग ऑब्जेक्ट में लोड किया गया है। इस दस्तावेज़ को पहले पैराग्राफ के अंत में कुछ नमूना पाठ जोड़कर HTML फ़ाइल के वैकल्पिक संशोधन के साथ Document.save() विधि का उपयोग करके एक वर्ड फ़ाइल के रूप में सहेजा गया है।

पायथन में HTML दस्तावेज़ को वर्ड में बदलने के लिए कोड

यह नमूना कोड एक सरल पायथन में HTML से वर्ड दस्तावेज़ कनवर्टर है। एक बार जब स्रोत HTML फ़ाइल दस्तावेज़ वर्ग ऑब्जेक्ट में लोड हो जाती है, तो सभी समृद्ध सुविधाओं का उपयोग लोड किए गए दस्तावेज़ के साथ काम करने के लिए किया जा सकता है, उदाहरण के लिए पहले पैराग्राफ की शुरुआत में टेक्स्ट जोड़ना, जैसा कि इस नमूना कोड में दिखाया गया है, नए नोड्स, टेबल जोड़ना, आवश्यकताओं के अनुसार चार्ट आदि। इसी तरह, आउटपुट फ़ाइल को कुछ सूचीबद्ध करने के लिए DOCX, DOC, DOCM, RTF, XPS, SVG, TIFF, PNG, JPEG, GIF और EPS के रूप में सहेजा जा सकता है।

इस लेख में, हमने Python में HTML से Word में परिवर्तन के बारे में सीखा। यदि आप HTML फ़ाइल को पीडीएफ में परिवर्तित करने की प्रक्रिया सीखना चाहते हैं, तो पायथन में HTML को पीडीएफ में कैसे परिवर्तित करें पर लेख देखें।

 हिन्दी