Kako pretvoriti HTML u tekst u Javi

Ova jednostavna tema govori o tome kako pretvoriti HTML u tekst u Javi. U Javi HTML u običan tekst aplikacija za pretvorbu koja radi pod Windows, Linux ili macOS platformama može se razviti pomoću jednostavnih i lakih API sučelja.

Koraci za pretvaranje HTML-a u tekst u Javi

  1. Konfigurirajte svoj projekt za dodavanje Aspose.HTML for Java iz Maven repozitorija
  2. Uključite referencu na imenski prostor Aspose.HTML u svoju prijavu
  3. Pročitajte izvorni sadržaj HMTL datoteke koristeći String objekt
  4. Inicijalizirajte HTMLDocument class objekt za učitavanje izvornog HTML niza
  5. Inicijalizirajte objekt klase INodeIterator za ponavljanje čvorova i dodavanje u StringBuilder
  6. Spremite izdvojeni tekst iz HTML-a na disk

Za izdvajanje teksta iz HTML aplikacije temeljene na Javi može se koristiti nekoliko redaka koda. Pokrenut ćemo proces učitavanjem izvornog HTML-a u String objekt i naknadnim učitavanjem tog Stringa koristeći HTMLDocument class. Zatim ćemo koristiti INodeIterator za izdvajanje, prelaženje i dodavanje HMTL čvorova u StringBuilder. Konačno, StringBuilder će biti spremljen kao obična tekstualna datoteka na disk.

Kod za pretvaranje HTML-a u tekst u Javi

Gornji primjer u Javi pretvara HTML u običan tekst u nekoliko API poziva. Napravili smo StyleFilter klasu koja proširuje NodeFilter klasu i implementiramo AcceptNode metodu za postavljanje filtara korisničkih čvorova i izostavljanje nepoželjnih čvorova iz HTML-a tijekom procesa konverzije.

U ovoj smo temi istražili kako izdvojiti tekst iz HTML-a u Javi. Ako ste zainteresirani za konverziju MD datoteke u XPS format, prijeđite na temu kako pretvoriti Markdown u XPS pomoću Jave.

 Hrvatski