Ez az egyszerű útmutató bemutatja, hogyan lehet a HTML-t szöveggé konvertálni C#-ban. A C# HTML-ből egyszerű szöveggé könnyen megvalósítható néhány sornyi kód felhasználásával bármely Windows, macOS vagy Linux platformon futó .NET alapú alkalmazás.
Lépések a HTML szöveggé konvertálásához C#-ban
- Telepítse a Aspose.HTML for .NET alkalmazást a NuGet csomagkezelőből
- Szerelje be a Aspose.HTML névteret a projektbe
- Töltse be a HTML-fájl tartalmát egy karakterláncba
- Hozzon létre egy példányt a HTMLDocument osztályból a HTML-t tartalmazó karakterlánc betöltéséhez
- Példányosítsa az INodeIterator osztálypéldányt a csomópontokon keresztüli iterációhoz és hozzáfűzéshez a StringBuilderben
- Végül mentse a konvertált szöveget HTML-ből a lemezre
Annak érdekében, hogy sima szöveget kapjunk a HTML C#-ból, néhány sornyi kód hatékonyan használható bármely .NET alapú alkalmazásban. A folyamat a HTML-fájl karakterláncként történő betöltésével kezdődik a HTMLDocument class példányba a File.ReadAllText metódussal. Ezután az INodeIterator a csomópontok HTML-ből való kinyerésére és a StringBuilderhez való hozzáfűzésére szolgál. Végül a StringBuilderben kibontott HTML lemezre kerül mentésre.
Kód a HTML szöveggé konvertálásához C#-ban
A fenti kód C#-ban a HTML-t egyszerű szöveggé konvertálja néhány API-hívás segítségével. Testreszabott StyleFilter osztályt használtunk, amely a NodeFilter osztályt örökli, hogy felülbírálja az AcceptNode metódust, amely kiszűri a nemkívánatos csomópontokat a HTML-ből a konverziós folyamat során.
Az előző témakörben megtanultuk, hogyan kell HTML fájl létrehozása C#-ban. Míg a fenti példa C#-ban egyszerű szöveget kap programozottan a HTML fájlból.