Як перетворити HTML на текст у C#

Ця проста інструкція демонструє, як перетворити HTML на текст у C#. У C# HTML у звичайний текст можна легко здійснити, використовуючи кілька рядків коду для будь-якої програми на основі .NET, що працює на платформах Windows, macOS або Linux.

Кроки для перетворення HTML на текст у C#

  1. Установіть Aspose.HTML for .NET із менеджера пакетів NuGet
  2. Додайте простір імен Aspose.HTML до свого проекту
  3. Завантажте вміст HTML-файлу в рядок
  4. Створіть екземпляр класу HTMLDocument, щоб завантажити рядок, що містить HTML
  5. Створення екземпляра класу INodeIterator для проходження через вузли та додавання в StringBuilder
  6. Нарешті, збережіть конвертований текст із HTML на диск

Щоб отримати звичайний текст із HTML C#, можна ефективно використати кілька рядків коду в будь-якій програмі на основі .NET. Процес починається із завантаження файлу HTML як рядка в екземпляр класу HTMLDocument за допомогою методу File.ReadAllText. Потім INodeIterator буде використано для вилучення вузлів з HTML і додавання їх до StringBuilder. Нарешті, витягнутий HTML у StringBuilder буде збережено на диску.

Код для перетворення HTML на текст у C#

Наведений вище код у C# перетворює HTML у звичайний текст за допомогою кількох викликів API. Ми використали налаштований клас StyleFilter, який успадковує клас NodeFilter, щоб замінити метод AcceptNode, який фільтрує небажані вузли з HTML під час процесу перетворення.

У попередній темі ми навчилися створити файл HTML на C#. Тоді як наведений вище приклад у C# отримує звичайний текст із файлу HTML програмним шляхом.

 Українська