Questo semplice argomento riguarda come convertire HTML in testo in Java. In Java HTML in testo normale è possibile sviluppare applicazioni di conversione in esecuzione su piattaforme Windows, Linux o macOS utilizzando interfacce API semplici e facili.
Passaggi per convertire HTML in testo in Java
- Configura il tuo progetto per aggiungere Aspose.HTML for Java dal repository Maven
- Includi il riferimento allo spazio dei nomi Aspose.HTML nella tua applicazione
- Leggere il contenuto del file HTML di origine utilizzando l’oggetto String
- Inizializza l’oggetto HTMLDocument class per caricare la stringa HTML di origine
- Inizializza l’oggetto della classe INodeIterator per iterare i nodi e aggiungerli in StringBuilder
- Salva il testo estratto dall’HTML su disco
Per estrarre testo da HTML Java è possibile utilizzare un’applicazione basata su poche righe di codice. Inizieremo il processo caricando l’HTML sorgente in un oggetto String e successivamente caricando quella String usando la classe HTMLDocument. Useremo quindi INodeIterator per estrarre, attraversare e aggiungere i nodi HTML a uno StringBuilder. Infine, lo StringBuilder verrà salvato come file di testo normale su disco.
Codice per convertire HTML in testo in Java
L’esempio sopra in Java converte l’HTML in testo normale in poche chiamate API. Abbiamo creato la classe StyleFilter che estende la classe NodeFilter e implementa il metodo AcceptNode per impostare i filtri dei nodi del cliente ed omettere i nodi indesiderati dall’HTML durante il processo di conversione.
In questo argomento, abbiamo esplorato come estrarre testo da HTML in Java. Se sei interessato alla conversione del file MD in formato XPS, passa all’argomento come converti Markdown in XPS usando Java.