В этом кратком руководстве описывается, как преобразовать файл Word в файл MD с помощью Python. Он содержит все сведения о настройке IDE, пошаговый процесс написания приложения и исполняемый пример кода для преобразования DOCX в Markdown с помощью Python. Вы также узнаете, как настроить вывод Markdown с помощью соответствующих параметров сохранения.
Шаги по преобразованию Word в Markdown с помощью Python
- Установите среду для использования Aspose.Words для Python через .NET для преобразования DOCX в файл MD.
- Загрузите входной файл Word с помощью объекта класса Document для преобразования в Markdown
- Инициализировать объект класса MarkdownSaveOptions
- Установите флаги полей обновления
- Установите флаг оптимизации памяти
- Сохраните выходной файл MD, используя пользовательские настройки.
Здесь объясняется процесс преобразования DOCX в MD с использованием Python с помощью последовательности шагов, которые необходимо выполнить при написании программы, введения основных классов и методов, которые будут использоваться в приложении, и демонстрации. настройки выходного файла MD. Исходный файл DOCX загружается в объект класса Document для преобразования в файл MD. Объект класса MarkdownSaveOptions объявляется для установки различных свойств, таких как обновление полей в исходном файле Word перед записью в файл MD и установка флага оптимизации памяти для обработки больших файлов.
Код для преобразования Word в файл MD с использованием Python
import aspose.words as aw | |
# Load the license | |
wordToMd = aw.License() | |
wordToMd.set_license("Aspose.Total.lic") | |
# Load input file | |
doc = aw.Document("Input.docx") | |
# Initialize MarkdownSaveOptions object | |
options = aw.saving.MarkdownSaveOptions() | |
options.update_fields = True | |
options.memory_optimization = True | |
# Save the output Markdown file | |
doc.save("SaveWordToMarkdown.md", options) | |
print ("Word Document to .MD conversion performed successfully") |
Класс Document используется для загрузки исходного файла Word при демонстрации процесса изменения DOCX на Markdown с использованием Python, который содержит другие перегрузки, такие как загрузка файла из потока памяти или использование объекта класса LoadOptions для обработки поврежденных файлов, проверки неверные пароли для защищенных файлов и проверка поддерживаемых форматов. Объект класса MarkdownSaveOptions используется для установки свойств кодирования, добавления принудительных разрывов страниц и установки папки изображений, в которую будут помещены изображения, и многих других.
В этой статье мы узнали, как написать конвертер Word в Markdown с помощью Python. Если вы хотите узнать о других операциях, таких как добавление номеров страниц в файл Word, обратитесь к статье как поставить номер страницы в Word с помощью Python.