Як читати документ Word на C#

У цьому короткому підручнику ми навчимося як читати документ Word на C# за допомогою детальної інформації про конфігурацію середовища, списку кроків і коду, який можна виконувати. Код продемонструє читання файлу Word різними способами. Ви дізнаєтесь, як C# читає документ Word, завантажуючи файл Word, як-от DOCX, DOC, RTF або HTML тощо, а потім відкриваючи його різні елементи для обробки чи перегляду.

Кроки для читання даних із документа Word у C#

  1. Налаштуйте середовище проекту для використання Aspose.Words із менеджера пакетів NuGet
  2. Завантажте вхідний файл DOCX в об’єкт класу Document
  3. Отримайте всі вузли типу Paragraph із документа
  4. Перетворіть кожен абзац на рядок і відобразіть його на консолі
  5. Отримайте з документа всі вузли типу Run
  6. Перетворіть кожен елемент Run на рядок і відобразіть його разом із назвою та розміром шрифту

Ці кроки надають детальну інформацію, необхідну для налаштування середовища та завдань, які потрібно виконати під час написання програми читання файлів Word. Він показує, як C# читає файл DOCX, завантажуючи вихідний файл в екземпляр класу Document, а потім відкриваючи всі його абзаци для відображення тексту. Він також описує читання даних з абзаців, таблиць тощо таким чином, що кожен сегмент тексту з іншим стилем відокремлюється або кожне значення комірки таблиці окремо отримується для обробки.

Код для читання файлу Word у C#

Цей код демонструє як читати файл Word у C# за допомогою функції Document.GetChildNodes(), яка вимагає отримання такого типу вузла, як-от абзац, рядок, розділ, тіло, нижній колонтитул, коментар тощо. Після доступу до дочірнього вузла , ви повинні привести його до відповідного типу, щоб використовувати його методи та властивості. Наприклад, ми прочитали документ двічі так, що спочатку відображається весь текст із усього документа, незалежно від звичайного абзацу чи таблиці тощо, а вдруге він читається на основі будь-якої зміни стилю та типу вмісту.

Ця стаття навчила нас читати файли Word, але якщо ви хочете навчитися конвертувати документи Word у HTML, зверніться до статті на як конвертувати документ Word у HTML за допомогою C#.

 Українська