Как да конвертирате HTML в текст в C#

Това просто ръководство демонстрира как да конвертирате HTML в текст на C#. В C# HTML към обикновен текст преобразуването може лесно да се постигне чрез използване на няколко реда код за всяко .NET базирано приложение, работещо в Windows, macOS или Linux платформи.

Стъпки за конвертиране на HTML в текст в C#

  1. Инсталирайте Aspose.HTML for .NET от мениджъра на пакети NuGet
  2. Включете пространство от имена Aspose.HTML в проекта си
  3. Заредете съдържанието на HTML файла в низ
  4. Създайте екземпляр на клас HTMLDocument, за да заредите низа, съдържащ HTML
  5. Създайте екземпляр на клас INodeIterator за итерация през възли и добавяне в StringBuilder
  6. И накрая, запазете конвертирания текст от HTML на диск

За да получите обикновен текст от HTML C# няколко реда код могат да се използват ефективно във всяко .NET базирано приложение. Процесът започва със зареждане на HTML файла като String в екземпляр на HTMLDocument class чрез използване на метода File.ReadAllText. Тогава INodeIterator ще се използва за извличане на възли от HTML и добавянето им към StringBuilder. Накрая, извлеченият HTML в StringBuilder ще бъде записан на диск.

Код за конвертиране на HTML в текст в C#

Горният код в C# преобразува HTML в обикновен текст с помощта на няколко извиквания на API. Използвахме персонализиран StyleFilter клас, който наследява NodeFilter клас, за да замени метода AcceptNode, който филтрира нежеланите възли от HTML по време на процеса на конвертиране.

В предишната тема научихме как да създаване на HTML файл в C#. Като има предвид, че горният пример в C# получава обикновен текст от HTML файл програмно.

 Български