Извлечь текст из документа Word на C#

Вы можете Извлечь Text из документа Word на C# с помощью этого краткого руководства. Он включает в себя шаги по настройке среды разработки, пошаговый рабочий процесс и текущий рабочий пример кода для преобразования DOCX в TXT на C#. Разработанное приложение может быть интегрировано в любое приложение, поддерживающее .NET framework в Linux, MS Windows или macOS.

Действия по извлечению текста из документа Word на C#

  1. Установите систему, установив Aspose.Words for .NET для преобразования файла DOCX в файл TXT с помощью C#.
  2. Получите доступ к исходному документу Word, используя экземпляр класса Document.
  3. Создайте экземпляр класса TxtSaveOptions и установите необходимые свойства.
  4. Сохраните файл Word в формате TXT на диске, используя метод Save.

Эти краткие шаги в C# извлекают текст из документа Word с помощью нескольких вызовов API. Сначала загрузите исходный файл документа Word с диска, после чего задайте параметры экспорта выходного файла TXT с помощью экземпляра класса TxtSaveOptions. Наконец, загруженный DOCX сохраняется в виде файла TXT на диске с помощью метода Save.

Код для преобразования DOCX в TXT на C#

Для извлечения текста из документа Word в этом фрагменте кода эффективно используется API на основе C#. Вы можете сохранить документ Word в формате TXT без использования дополнительного экземпляра класса TxtSaveOptions. Однако если вам необходимо дополнительно настроить выходной файл TXT, вы можете использовать различные свойства, предоставляемые классом TxtSaveOptions, включая настройку Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak и PrettyFormat, и это лишь некоторые из них.

В этой статье объясняется информация по разработке конвертера Word в TXT с использованием C#. Если вы хотите сравнить PDF-документы, обратитесь к статье на Сравнение PDF-документов с помощью C#.

 Русский