Ця проста інструкція демонструє, як перетворити HTML на текст у C#. У C# HTML у звичайний текст можна легко здійснити, використовуючи кілька рядків коду для будь-якої програми на основі .NET, що працює на платформах Windows, macOS або Linux.
Кроки для перетворення HTML на текст у C#
- Установіть Aspose.HTML for .NET із менеджера пакетів NuGet
- Додайте простір імен Aspose.HTML до свого проекту
- Завантажте вміст HTML-файлу в рядок
- Створіть екземпляр класу HTMLDocument, щоб завантажити рядок, що містить HTML
- Створення екземпляра класу INodeIterator для проходження через вузли та додавання в StringBuilder
- Нарешті, збережіть конвертований текст із HTML на диск
Щоб отримати звичайний текст із HTML C#, можна ефективно використати кілька рядків коду в будь-якій програмі на основі .NET. Процес починається із завантаження файлу HTML як рядка в екземпляр класу HTMLDocument за допомогою методу File.ReadAllText. Потім INodeIterator буде використано для вилучення вузлів з HTML і додавання їх до StringBuilder. Нарешті, витягнутий HTML у StringBuilder буде збережено на диску.
Код для перетворення HTML на текст у C#
Наведений вище код у C# перетворює HTML у звичайний текст за допомогою кількох викликів API. Ми використали налаштований клас StyleFilter, який успадковує клас NodeFilter, щоб замінити метод AcceptNode, який фільтрує небажані вузли з HTML під час процесу перетворення.
У попередній темі ми навчилися створити файл HTML на C#. Тоді як наведений вище приклад у C# отримує звичайний текст із файлу HTML програмним шляхом.