Den här enkla instruktionen visar hur man konverterar HTML till text i C#. I C# HTML till vanlig text kan konvertering enkelt uppnås genom att använda några rader kod för alla .NET-baserade program som körs på Windows, macOS eller Linux-plattformar.
Steg för att konvertera HTML till text i C#
- Installera Aspose.HTML for .NET från NuGet-pakethanteraren
- Inkludera namnområdet Aspose.HTML i ditt projekt
- Ladda HTML-filens innehåll till en sträng
- Skapa en instans av klassen HTMLDocument för att ladda strängen som innehåller HTML
- Instantiera INodeIterator-klassinstansen för att iterera genom noder och lägga till i StringBuilder
- Slutligen, spara konverterad text från HTML på disken
För att få vanlig text från HTML C# kan några rader kod användas effektivt i alla .NET-baserade applikationer. Processen börjar med att ladda HTML-filen som sträng i HTMLDocument class-instansen genom att använda metoden File.ReadAllText. Sedan kommer INodeIterator att användas för att extrahera noder från HTML och lägga till dem i StringBuilder. Slutligen kommer den extraherade HTML-koden i StringBuilder att sparas på disken.
Kod för att konvertera HTML till text i C#
Ovanstående kod i C# konverterar HTML till vanlig text med några få API-anrop. Vi har använt anpassad StyleFilter-klass som ärver NodeFilter-klassen för att åsidosätta AcceptNode-metoden, som filtrerar bort oönskade noder från HTML under konverteringsprocessen.
I det föregående ämnet lärde vi oss hur man skapa HTML-fil i C#. Medan exemplet ovan i C# hämtar vanlig text från HTML-filen programmatiskt.