В этом кратком руководстве рассказывается, как преобразовать документ HTML в Word в Python. В нем содержатся сведения о настройке IDE для тестирования примера кода, список шагов по написанию приложения и работоспособный пример кода для преобразования HTML в DOCX на Python. Также будет описан пример кода для дополнительной модификации загруженного HTML-файла перед его сохранением в виде файла Word.
Действия по преобразованию HTML в документ Word в Python
- Установите среду для используйте Aspose.Words для Python через .NET для преобразования HTML в DOCX.
- Откройте исходный HTML-файл, используя объект класса Document из пространства имен aspose.words.
- Добавьте образец текста в первый абзац HTML-файла, чтобы продемонстрировать модификацию HTML.
- Save загруженный HTML-файл как файл Word, задав имя и формат.
Вышеуказанные шаги определяют процесс конвертирования HTML в Word DOC в Python. Целевой HTML-файл загружается в объект класса Document из пространства имен aspose.words. Этот документ сохраняется как файл Word с использованием метода Document.save() вместе с дополнительной модификацией HTML-файла путем добавления образца текста в конце первого абзаца.
Код для преобразования HTML-документа в Word на Python
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("License.lic") | |
# Load the HTML | |
htmlDoc = aw.Document("Sample.html") | |
# Append some text | |
htmlDoc.first_section.body.first_paragraph.append_child(aw.Run(htmlDoc, "This text is added for demonstration")) | |
# Save the loaded HTML document as DOCX | |
htmlDoc.save("output.docx", aw.SaveFormat.DOCX) | |
print ("HTML to Word file converted successfully") |
Этот пример кода представляет собой простой конвертер документов HTML в Word на Python. После загрузки исходного HTML-файла в объект класса Document все богатые функции можно использовать для работы с загруженным документом, например, добавление текста в начале первого абзаца, как показано в этом примере кода, добавление новых узлов, таблиц и т. д. диаграммы и т. д. в соответствии с требованиями. Аналогично, выходной файл можно сохранить в форматах DOCX, DOC, DOCM, RTF, XPS, SVG, TIFF, PNG, JPEG, GIF и EPS, и это лишь некоторые из них.
В этой статье мы узнали о преобразовании HTML в Word на Python. Если вы хотите узнать о процессе преобразования HTML-файла в PDF, обратитесь к статье как конвертировать HTML в PDF в Python.