यह संक्षिप्त ट्यूटोरियल पायथन में HTML दस्तावेज़ को Word में कैसे परिवर्तित करें पर मार्गदर्शन करता है। इसमें नमूना कोड के परीक्षण के लिए आईडीई सेट करने का विवरण, एप्लिकेशन लिखने के लिए चरणों की एक सूची और **पायथन में HTML को DOCX में परिवर्तित करने के लिए एक चलाने योग्य नमूना कोड है। वर्ड फ़ाइल के रूप में सहेजने से पहले लोड की गई HTML फ़ाइल के वैकल्पिक संशोधन के लिए नमूना कोड का भी वर्णन किया जाएगा।
पायथन में HTML को वर्ड डॉक्यूमेंट में बदलने के चरण
- HTML को DOCX में परिवर्तित करने के लिए पर्यावरण को .NET के माध्यम से Python के लिए Aspose.Words का उपयोग करें पर स्थापित करें
- Aspose.words नेमस्पेस से Document क्लास ऑब्जेक्ट का उपयोग करके स्रोत HTML फ़ाइल खोलें
- HTML संशोधन प्रदर्शित करने के लिए HTML फ़ाइल के पहले पैराग्राफ में कुछ नमूना पाठ जोड़ें
- Save नाम और प्रारूप सेट करके HTML फ़ाइल को Word फ़ाइल के रूप में लोड करें
उपरोक्त चरण पायथन में HTML को Word DOC में बदलने की प्रक्रिया को परिभाषित करते हैं। लक्ष्य HTML फ़ाइल को aspose.words नेमस्पेस से दस्तावेज़ वर्ग ऑब्जेक्ट में लोड किया गया है। इस दस्तावेज़ को पहले पैराग्राफ के अंत में कुछ नमूना पाठ जोड़कर HTML फ़ाइल के वैकल्पिक संशोधन के साथ Document.save() विधि का उपयोग करके एक वर्ड फ़ाइल के रूप में सहेजा गया है।
पायथन में HTML दस्तावेज़ को वर्ड में बदलने के लिए कोड
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("License.lic") | |
# Load the HTML | |
htmlDoc = aw.Document("Sample.html") | |
# Append some text | |
htmlDoc.first_section.body.first_paragraph.append_child(aw.Run(htmlDoc, "This text is added for demonstration")) | |
# Save the loaded HTML document as DOCX | |
htmlDoc.save("output.docx", aw.SaveFormat.DOCX) | |
print ("HTML to Word file converted successfully") |
यह नमूना कोड एक सरल पायथन में HTML से वर्ड दस्तावेज़ कनवर्टर है। एक बार जब स्रोत HTML फ़ाइल दस्तावेज़ वर्ग ऑब्जेक्ट में लोड हो जाती है, तो सभी समृद्ध सुविधाओं का उपयोग लोड किए गए दस्तावेज़ के साथ काम करने के लिए किया जा सकता है, उदाहरण के लिए पहले पैराग्राफ की शुरुआत में टेक्स्ट जोड़ना, जैसा कि इस नमूना कोड में दिखाया गया है, नए नोड्स, टेबल जोड़ना, आवश्यकताओं के अनुसार चार्ट आदि। इसी तरह, आउटपुट फ़ाइल को कुछ सूचीबद्ध करने के लिए DOCX, DOC, DOCM, RTF, XPS, SVG, TIFF, PNG, JPEG, GIF और EPS के रूप में सहेजा जा सकता है।
इस लेख में, हमने Python में HTML से Word में परिवर्तन के बारे में सीखा। यदि आप HTML फ़ाइल को पीडीएफ में परिवर्तित करने की प्रक्रिया सीखना चाहते हैं, तो पायथन में HTML को पीडीएफ में कैसे परिवर्तित करें पर लेख देखें।