Hur man konverterar HTML till text i C#

Den här enkla instruktionen visar hur man konverterar HTML till text i C#. I C# HTML till vanlig text kan konvertering enkelt uppnås genom att använda några rader kod för alla .NET-baserade program som körs på Windows, macOS eller Linux-plattformar.

Steg för att konvertera HTML till text i C#

  1. Installera Aspose.HTML for .NET från NuGet-pakethanteraren
  2. Inkludera namnområdet Aspose.HTML i ditt projekt
  3. Ladda HTML-filens innehåll till en sträng
  4. Skapa en instans av klassen HTMLDocument för att ladda strängen som innehåller HTML
  5. Instantiera INodeIterator-klassinstansen för att iterera genom noder och lägga till i StringBuilder
  6. Slutligen, spara konverterad text från HTML på disken

För att få vanlig text från HTML C# kan några rader kod användas effektivt i alla .NET-baserade applikationer. Processen börjar med att ladda HTML-filen som sträng i HTMLDocument class-instansen genom att använda metoden File.ReadAllText. Sedan kommer INodeIterator att användas för att extrahera noder från HTML och lägga till dem i StringBuilder. Slutligen kommer den extraherade HTML-koden i StringBuilder att sparas på disken.

Kod för att konvertera HTML till text i C#

Ovanstående kod i C# konverterar HTML till vanlig text med några få API-anrop. Vi har använt anpassad StyleFilter-klass som ärver NodeFilter-klassen för att åsidosätta AcceptNode-metoden, som filtrerar bort oönskade noder från HTML under konverteringsprocessen.

I det föregående ämnet lärde vi oss hur man skapa HTML-fil i C#. Medan exemplet ovan i C# hämtar vanlig text från HTML-filen programmatiskt.

 Svenska