Ova jednostavna tema govori o tome kako pretvoriti HTML u tekst u Javi. U Javi HTML u običan tekst aplikacija za pretvorbu koja radi pod Windows, Linux ili macOS platformama može se razviti pomoću jednostavnih i lakih API sučelja.
Koraci za pretvaranje HTML-a u tekst u Javi
- Konfigurirajte svoj projekt za dodavanje Aspose.HTML for Java iz Maven repozitorija
- Uključite referencu na imenski prostor Aspose.HTML u svoju prijavu
- Pročitajte izvorni sadržaj HMTL datoteke koristeći String objekt
- Inicijalizirajte HTMLDocument class objekt za učitavanje izvornog HTML niza
- Inicijalizirajte objekt klase INodeIterator za ponavljanje čvorova i dodavanje u StringBuilder
- Spremite izdvojeni tekst iz HTML-a na disk
Za izdvajanje teksta iz HTML aplikacije temeljene na Javi može se koristiti nekoliko redaka koda. Pokrenut ćemo proces učitavanjem izvornog HTML-a u String objekt i naknadnim učitavanjem tog Stringa koristeći HTMLDocument class. Zatim ćemo koristiti INodeIterator za izdvajanje, prelaženje i dodavanje HMTL čvorova u StringBuilder. Konačno, StringBuilder će biti spremljen kao obična tekstualna datoteka na disk.
Kod za pretvaranje HTML-a u tekst u Javi
Gornji primjer u Javi pretvara HTML u običan tekst u nekoliko API poziva. Napravili smo StyleFilter klasu koja proširuje NodeFilter klasu i implementiramo AcceptNode metodu za postavljanje filtara korisničkih čvorova i izostavljanje nepoželjnih čvorova iz HTML-a tijekom procesa konverzije.
U ovoj smo temi istražili kako izdvojiti tekst iz HTML-a u Javi. Ako ste zainteresirani za konverziju MD datoteke u XPS format, prijeđite na temu kako pretvoriti Markdown u XPS pomoću Jave.