Come convertire HTML in testo in C#

Questa semplice procedura mostra come convertire HTML in testo in C#. In C# HTML in testo normale la conversione può essere facilmente ottenuta utilizzando poche righe di codice per qualsiasi applicazione basata su .NET in esecuzione su piattaforme Windows, macOS o Linux.

Passaggi per convertire HTML in testo in C#

  1. Installa Aspose.HTML for .NET dal gestore di pacchetti NuGet
  2. Includi Aspose.HTML spazio dei nomi nel tuo progetto
  3. Carica il contenuto del file HTML in una stringa
  4. Crea un’istanza della classe HTMLDocument per caricare la stringa contenente HTML
  5. Istanziare l’istanza della classe INodeIterator per scorrere i nodi e aggiungere in StringBuilder
  6. Infine, salva il testo convertito da HTML su disco

Per ottenere testo normale da HTML C#, alcune righe di codice possono essere utilizzate efficacemente in qualsiasi applicazione basata su .NET. Il processo inizia caricando il file HTML come String nell’istanza HTMLDocument class utilizzando il metodo File.ReadAllText. Quindi INodeIterator verrà utilizzato per estrarre i nodi da HTML e aggiungerli a StringBuilder. Infine, l’HTML estratto in StringBuilder verrà salvato su disco.

Codice per convertire HTML in testo in C#

Il codice sopra in C# converte l’HTML in testo normale usando poche chiamate API. Abbiamo utilizzato la classe StyleFilter personalizzata che eredita la classe NodeFilter per sovrascrivere il metodo AcceptNode, che filtra i nodi indesiderati dall’HTML durante il processo di conversione.

Nell’argomento precedente, abbiamo imparato come crea file HTML in C#. Considerando che l’esempio precedente in C# ottiene testo normale dal file HTML a livello di codice.

 Italiano