这个简短的教程描述了如何使用 Python 将 Word 转换为 MD 文件。它包含配置 IDE 的所有详细信息、编写应用程序的逐步过程以及使用 Python 将 DOCX 转换为 Markdown 的可运行示例代码。您还将学习使用相应的保存选项自定义输出 Markdown 的选项。
使用 Python 将 Word 转换为 Markdown 的步骤
- 搭建环境使用Aspose.Words for Python 通过 .NET将DOCX转换为MD文件
- 使用 Document 类对象加载输入 Word 文件以转换为 Markdown
- 初始化 MarkdownSaveOptions 类对象
- 设置更新字段标志
- 设置内存优化标志
- 使用自定义设置保存输出 MD 文件
这里解释了使用 Python 将 DOCX 转换为 MD 的过程,并借助编写程序时要遵循的一系列步骤、应用程序中要使用的主要类和方法的介绍以及演示输出MD文件的自定义。源 DOCX 文件被加载到 Document 类对象中以转换为 MD 文件。声明 MarkdownSaveOptions 类的对象以设置不同的属性,例如在写入 MD 文件之前更新源 Word 文件中的字段以及设置用于处理大文件的内存优化标志。
使用 Python 将 Word 转换为 MD 文件的代码
Document 类用于加载源 Word 文件,同时演示使用 Python* 将 *DOCX 更改为 Markdown 的过程,其中包含其他重载,例如从内存流加载文件或使用 LoadOptions 类对象处理损坏的文件,检查受保护文件的无效密码,并验证支持的格式。 MarkdownSaveOptions 类对象用于设置编码属性、添加强制分页符以及设置将放置图像的图像文件夹等等。
本文教我们如何使用 Python* 编写 *Word 到 Markdown 转换器。如果您想了解其他操作,例如向 Word 文件添加页码,请参阅 如何使用 Python 在 Word 中输入页码 上的文章。