Вилучення тексту з документа Word на C#

Ви можете Витягти Text з документа Word на C# за допомогою цього короткого посібника. Він містить кроки для налаштування середовища розробки, покроковий робочий процес і поточний робочий зразок коду для перетворення DOCX у TXT на C#. Розроблену програму можна інтегрувати в будь-яку програму, що підтримує .NET framework в Linux, MS Windows або macOS.

Кроки для вилучення тексту з документа Word на C#

  1. Налаштуйте систему, встановивши Aspose.Words for .NET, щоб конвертувати файл DOCX у файл TXT за допомогою C#
  2. Отримайте доступ до вихідного документа Word за допомогою екземпляра класу Document
  3. Створіть екземпляр класу TxtSaveOptions і встановіть необхідні властивості
  4. Збережіть файл Word як TXT на диску за допомогою методу збереження

Ці короткі кроки в C# витягують текст із документа Word за допомогою кількох викликів API. Спочатку завантажте вихідний файл документа Word із диска, після чого встановіть параметри експорту вихідного файлу TXT за допомогою екземпляра класу TxtSaveOptions. Нарешті, завантажений DOCX зберігається як файл TXT на диску за допомогою методу збереження.

Код для перетворення DOCX на TXT на C#

Для вилучення тексту з документа Word у цьому фрагменті коду було ефективно використано API на основі C#. Ви можете зберегти документ Word у TXT без використання додаткового екземпляра класу TxtSaveOptions. Однак, якщо вам потрібно додатково налаштувати вихідний файл TXT, ви можете використовувати різні властивості, надані класом TxtSaveOptions, включаючи налаштування Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak і PrettyFormat, щоб назвати декілька.

У цій статті пояснюється інформація щодо розробки конвертера Word у TXT за допомогою C#. Якщо ви хочете порівняти PDF-документи, зверніться до статті Порівняйте PDF-документи за допомогою C#.

 Українська