Hogyan lehet HTML-t szöveggé konvertálni C#-ban

Ez az egyszerű útmutató bemutatja, hogyan lehet a HTML-t szöveggé konvertálni C#-ban. A C# HTML-ből egyszerű szöveggé könnyen megvalósítható néhány sornyi kód felhasználásával bármely Windows, macOS vagy Linux platformon futó .NET alapú alkalmazás.

Lépések a HTML szöveggé konvertálásához C#-ban

  1. Telepítse a Aspose.HTML for .NET alkalmazást a NuGet csomagkezelőből
  2. Szerelje be a Aspose.HTML névteret a projektbe
  3. Töltse be a HTML-fájl tartalmát egy karakterláncba
  4. Hozzon létre egy példányt a HTMLDocument osztályból a HTML-t tartalmazó karakterlánc betöltéséhez
  5. Példányosítsa az INodeIterator osztálypéldányt a csomópontokon keresztüli iterációhoz és hozzáfűzéshez a StringBuilderben
  6. Végül mentse a konvertált szöveget HTML-ből a lemezre

Annak érdekében, hogy sima szöveget kapjunk a HTML C#-ból, néhány sornyi kód hatékonyan használható bármely .NET alapú alkalmazásban. A folyamat a HTML-fájl karakterláncként történő betöltésével kezdődik a HTMLDocument class példányba a File.ReadAllText metódussal. Ezután az INodeIterator a csomópontok HTML-ből való kinyerésére és a StringBuilderhez való hozzáfűzésére szolgál. Végül a StringBuilderben kibontott HTML lemezre kerül mentésre.

Kód a HTML szöveggé konvertálásához C#-ban

A fenti kód C#-ban a HTML-t egyszerű szöveggé konvertálja néhány API-hívás segítségével. Testreszabott StyleFilter osztályt használtunk, amely a NodeFilter osztályt örökli, hogy felülbírálja az AcceptNode metódust, amely kiszűri a nemkívánatos csomópontokat a HTML-ből a konverziós folyamat során.

Az előző témakörben megtanultuk, hogyan kell HTML fájl létrehozása C#-ban. Míg a fenti példa C#-ban egyszerű szöveget kap programozottan a HTML fájlból.

 Magyar