Kaip konvertuoti HTML į tekstą C#

Šis paprastas patarimas parodo, kaip konvertuoti HTML į tekstą C#. C# HTML į paprastą tekstą galima lengvai konvertuoti naudojant kelias kodo eilutes bet kuriai .NET pagrįstai programai, veikiančiai Windows, macOS arba Linux platformose.

Veiksmai, kaip konvertuoti HTML į tekstą C#

  1. Įdiekite Aspose.HTML for .NET iš NuGet paketų tvarkyklės
  2. Į savo projektą įtraukite Aspose.HTML vardų erdvę
  3. Įkelkite HTML failo turinį į eilutę
  4. Sukurkite HTMLDocument klasės egzempliorių, kad įkeltumėte eilutę, kurioje yra HTML
  5. Sukurkite INodeIterator klasės egzempliorių, kad galėtumėte kartoti per mazgus ir pridėti prie StringBuilder
  6. Galiausiai išsaugokite konvertuotą tekstą iš HTML diske

Norint gauti paprastą tekstą iš HTML C#, kelios kodo eilutės gali būti efektyviai naudojamos bet kurioje .NET pagrįstoje programoje. Procesas prasideda įkeliant HTML failą kaip eilutę į HTMLDocument class egzempliorių naudojant File.ReadAllText metodą. Tada INodeIterator bus naudojamas mazgams išgauti iš HTML ir pridėti juos prie StringBuilder. Galiausiai “StringBuilder” ištrauktas HTML bus išsaugotas diske.

Kodas konvertuoti HTML į tekstą C#

Aukščiau pateiktas kodas C# konvertuoja HTML į paprastą tekstą naudodamas kelis API iškvietimus. Naudojome tinkintą StyleFilter klasę, kuri paveldi NodeFilter klasę, kad nepaisytų AcceptNode metodo, kuris konvertavimo proceso metu išfiltruoja nepageidaujamus HTML mazgus.

Ankstesnėje temoje sužinojome, kaip sukurti HTML failą C#. Tuo tarpu aukščiau pateiktame pavyzdyje C# programiškai gaunate paprastą tekstą iš HTML failo.

 Latviski