У цьому короткому посібнику описано, як конвертувати Word у файл MD за допомогою Python. Він містить усі деталі для налаштування IDE, поетапний процес написання програми та приклад коду, який можна виконувати, щоб конвертувати DOCX у Markdown за допомогою Python. Ви також дізнаєтесь про параметри налаштування виведення Markdown за допомогою відповідних параметрів збереження.
Кроки для перетворення Word у Markdown за допомогою Python
- Створіть середовище для використання Aspose.Words для Python через .NET для перетворення DOCX у файл MD
- Завантажте вхідний файл Word за допомогою об’єкта класу Document для перетворення в Markdown
- Ініціалізувати об’єкт класу MarkdownSaveOptions
- Встановіть прапорці полів оновлення
- Встановіть прапор оптимізації пам’яті
- Збережіть вихідний файл MD за допомогою користувацьких налаштувань
Тут пояснюється процес перетворення DOCX на MD за допомогою Python за допомогою послідовності кроків, яких слід виконувати під час написання програми, ознайомлення з основними класами та методами, які використовуватимуться в програмі, і демонстрація налаштування вихідного файлу MD. Вихідний файл DOCX завантажується в об’єкт класу Document для перетворення у файл MD. Об’єкт класу MarkdownSaveOptions оголошено для встановлення різних властивостей, як-от оновлення полів у вихідному файлі Word перед записом у файл MD і встановлення позначки оптимізації пам’яті для обробки великих файлів.
Код для перетворення Word у файл MD за допомогою Python
import aspose.words as aw | |
# Load the license | |
wordToMd = aw.License() | |
wordToMd.set_license("Aspose.Total.lic") | |
# Load input file | |
doc = aw.Document("Input.docx") | |
# Initialize MarkdownSaveOptions object | |
options = aw.saving.MarkdownSaveOptions() | |
options.update_fields = True | |
options.memory_optimization = True | |
# Save the output Markdown file | |
doc.save("SaveWordToMarkdown.md", options) | |
print ("Word Document to .MD conversion performed successfully") |
Клас Document використовується для завантаження вихідного файлу Word під час демонстрації процесу зміни DOCX на Markdown за допомогою Python, який містить інші перевантаження, зокрема завантаження файлу з потоку пам’яті або використання об’єкта класу LoadOptions для обробки пошкоджених файлів, перевірки недійсні паролі для захищених файлів і перевірка підтримуваних форматів. Об’єкт класу MarkdownSaveOptions використовується для встановлення властивостей кодування, додавання примусових розривів сторінок і встановлення папки зображень, куди будуть розміщуватися зображення, тощо.
Ця стаття навчила нас писати конвертер Word у Markdown за допомогою Python. Якщо ви хочете навчитися виконувати інші операції, як-от додавання номерів сторінок до файлу Word, зверніться до статті як поставити номер сторінки в Word за допомогою Python.