您可以通过这个简短的教程 从 C# 中的 Word 文档中提取 Text。它包含设置开发环境的步骤、分步工作流程以及用于将 DOCX 转换为 C# 中的 TXT** 的当前工作示例代码。开发的应用程序可以集成到 Linux、MS Windows 或 macOS 中支持 .NET 框架的任何应用程序中。
在 C# 中从 Word 文档中提取文本的步骤
- 通过安装Aspose.Words for .NET建立系统,使用C#将DOCX文件转换为TXT文件
- 使用 Document 类的实例访问源 Word 文档
- 实例化 TxtSaveOptions 类实例并设置所需的属性
- 使用 Save 方法将 Word 文件以 TXT 形式保存在磁盘上
C# 中的这些简洁步骤使用一些 API 调用从 Word 文档 中提取文本。首先,从磁盘加载源 Word 文档文件,然后使用 TxtSaveOptions 类实例设置输出 TXT 文件导出选项。最后,使用Save方法将加载的DOCX作为TXT文件保存在磁盘上。
在 C# 中将 DOCX 转换为 TXT 的代码
此代码片段中有效地使用了基于 C#* 的 API 从 Word 文档中提取文本。您可以将 Word 文档保存到 TXT,而无需使用可选的 TxtSaveOptions 类实例。但是,如果您应该进一步自定义输出 TXT 文件,则可以使用 TxtSaveOptions 类公开的不同属性,包括设置 Encoding、ForcePageBreaks、MaxCharactersPerLine、ParagraphBreak 和 PrettyFormat 等。
本文解释了使用 C#* 开发 *Word 到 TXT 转换器的信息。如果您想比较 PDF 文档,请参阅 使用 C# 比较 PDF 文档 上的文章。