У цьому короткому посібнику описано, як конвертувати документ HTML у Word на Python. Він містить деталі налаштування IDE для тестування зразка коду, список кроків для написання програми та придатний для виконання зразок коду для перетворення HTML у DOCX на Python. Також буде описано зразок коду для додаткової модифікації завантаженого файлу HTML перед збереженням його як файл Word.
Кроки для перетворення HTML у документ Word на Python
- Створіть середовище використовувати Aspose.Words для Python через .NET для перетворення HTML у DOCX
- Відкрийте вихідний файл HTML за допомогою об’єкта класу Document із простору імен aspose.words
- Додайте зразок тексту до першого абзацу HTML-файлу, щоб продемонструвати модифікацію HTML
- Save завантажений файл HTML як файл Word, встановивши назву та формат
Наведені вище кроки визначають процес перетворення HTML у Word DOC у Python. Цільовий файл HTML завантажується в об’єкт класу Document із простору імен aspose.words. Цей документ зберігається як файл Word за допомогою методу Document.save() разом із необов’язковою зміною файлу HTML шляхом додавання зразка тексту в кінці першого абзацу.
Код для перетворення документа HTML у Word на Python
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("License.lic") | |
# Load the HTML | |
htmlDoc = aw.Document("Sample.html") | |
# Append some text | |
htmlDoc.first_section.body.first_paragraph.append_child(aw.Run(htmlDoc, "This text is added for demonstration")) | |
# Save the loaded HTML document as DOCX | |
htmlDoc.save("output.docx", aw.SaveFormat.DOCX) | |
print ("HTML to Word file converted successfully") |
Цей приклад коду є простим конвертором документів HTML у Word на Python. Після завантаження вихідного HTML-файлу в об’єкт класу Document можна використовувати всі багаті функції для роботи із завантаженим документом, наприклад, додавати текст на початку першого абзацу, як показано в цьому прикладі коду, додавати нові вузли, таблиці, діаграми тощо відповідно до вимог. Подібним чином вихідний файл можна зберегти у форматах DOCX, DOC, DOCM, RTF, XPS, SVG, TIFF, PNG, JPEG, GIF і EPS.
У цій статті ми навчилися перетворювати HTML у Word на Python. Якщо ви хочете дізнатися, як конвертувати файл HTML у PDF, перегляньте статтю як конвертувати HTML у PDF на Python.