Hoe HTML naar tekst te converteren in C#

Deze eenvoudige how-to laat zien hoe je converteert HTML naar tekst in C#. In C# HTML naar platte tekst kan conversie eenvoudig worden bereikt door een paar regels code te gebruiken voor elke op .NET gebaseerde applicatie die draait op Windows-, macOS- of Linux-platforms.

Stappen om HTML naar tekst te converteren in C#

  1. Installeer Aspose.HTML for .NET van NuGet-pakketbeheerder
  2. Neem Aspose.HTML naamruimte op in uw project
  3. Laad de inhoud van het HTML-bestand in een String
  4. Maak een instantie van de klasse HTMLDocument om de tekenreeks met HTML te laden
  5. Instantieer de instantie van de klasse INodeIterator om door knooppunten te itereren en toe te voegen in StringBuilder
  6. Sla tot slot geconverteerde tekst van HTML op schijf op

Om platte tekst uit HTML C# te halen kunnen enkele regels code effectief worden gebruikt in elke op .NET gebaseerde toepassing. Het proces begint met het laden van het HTML-bestand als String in de HTMLDocument class-instantie met behulp van de File.ReadAllText-methode. Vervolgens wordt INodeIterator gebruikt om knooppunten uit HTML te extraheren en toe te voegen aan StringBuilder. Ten slotte wordt de geëxtraheerde HTML in StringBuilder op schijf opgeslagen.

Code om HTML naar tekst te converteren in C#

De bovenstaande code in C# converteert HTML naar platte tekst met een paar API-aanroepen. We hebben aangepaste StyleFilter-klasse gebruikt die de NodeFilter-klasse overneemt om de AcceptNode-methode te negeren, die de ongewenste knooppunten uit HTML filtert tijdens het conversieproces.

In het vorige onderwerp hebben we geleerd hoe u HTML-bestand maken in C# kunt gebruiken. Terwijl het bovenstaande voorbeeld in C# programmatisch platte tekst uit een HTML-bestand haalt.

 Nederlands