So konvertieren Sie HTML in Text in C#

Diese einfache Anleitung zeigt, wie man HTML in C# in Text umwandelt**. In C# kann die Konvertierung von HTML in reinen Text einfach durch die Verwendung weniger Codezeilen für jede .NET-basierte Anwendung erreicht werden, die auf Windows-, macOS- oder Linux-Plattformen ausgeführt wird.

Schritte zum Konvertieren von HTML in Text in C#

  1. Installieren Sie Aspose.HTML for .NET aus dem NuGet-Paket-Manager
  2. Fügen Sie Aspose.HTML Namespace in Ihr Projekt ein
  3. Laden Sie den Inhalt der HTML-Datei in einen String
  4. Erstellen Sie eine Instanz der Klasse HTMLDocument, um den String zu laden, der HTML enthält
  5. Instanziieren Sie die Klasseninstanz INodeIterator, um Knoten zu durchlaufen und in StringBuilder anzuhängen
  6. Speichern Sie schließlich konvertierten Text aus HTML auf der Festplatte

Um einfachen Text aus HTML C# zu erhalten, können wenige Codezeilen effektiv in jeder .NET-basierten Anwendung verwendet werden. Der Prozess beginnt mit dem Laden der HTML-Datei als String in die HTMLDocument-Klasse-Instanz mithilfe der File.ReadAllText-Methode. Dann wird INodeIterator verwendet, um Knoten aus HTML zu extrahieren und sie an StringBuilder anzuhängen. Schließlich wird das extrahierte HTML in StringBuilder auf der Festplatte gespeichert.

Code zum Konvertieren von HTML in Text in C#

Der obige Code in C# konvertiert HTML in reinen Text mit wenigen API-Aufrufen. Wir haben eine angepasste StyleFilter-Klasse verwendet, die die NodeFilter-Klasse erbt, um die AcceptNode-Methode zu überschreiben, die während des Konvertierungsprozesses unerwünschte Knoten aus HTML herausfiltert.

Im vorherigen Thema haben wir gelernt, wie man HTML-Datei in C# erstellen. Während das obige Beispiel in C# programmgesteuert Klartext aus der HTML-Datei erhält.

 Deutsch