Ši paprasta tema yra apie tai, kaip konvertuoti HTML į tekstą Java. Naudojant Java HTML į paprastą tekstą konvertavimo programą, veikiančią Windows, Linux arba MacOS platformose, galima sukurti naudojant paprastas ir paprastas API sąsajas.
Veiksmai, kaip konvertuoti HTML į tekstą Java
- Sukonfigūruokite projektą, kad pridėtumėte Aspose.HTML for Java iš Maven saugyklos
- Į savo programą įtraukite nuorodą į Aspose.HTML vardų sritį
- Skaitykite šaltinio HMTL failo turinį naudodami String objektą
- Inicijuokite HTMLDocument class objektą, kad įkeltumėte šaltinio HTML eilutę
- Inicijuokite INodeIterator klasės objektą, kad kartotumėte mazgus ir pridėkite prie StringBuilder
- Išsaugokite ištrauktą tekstą iš HTML diske
Norint ištraukti tekstą iš HTML Java, galima naudoti kelias kodo eilutes. Pradėsime procesą įkeldami šaltinio HTML į eilutės objektą ir vėliau įkeldami tą eilutę naudodami HTMLDocument class. Tada naudosime INodeIterator, norėdami išgauti, pereiti ir pridėti HMTL mazgus prie StringBuilder. Galiausiai “StringBuilder” bus išsaugotas kaip paprasto teksto failas diske.
Kodas konvertuoti HTML į tekstą Java
Aukščiau pateiktas pavyzdys Java konvertuoja HTML į paprastą tekstą keliais API iškvietimais. Sukūrėme StyleFilter klasę, kuri išplečia NodeFilter klasę ir įdiegė AcceptNode metodą, kad nustatytume klientų mazgų filtrus ir konversijos proceso metu pašalintume nepageidaujamus HTML mazgus.
Šioje temoje mes ištyrėme kaip išgauti tekstą iš HTML Java. Jei jus domina MD failo konvertavimas į XPS formatą, pereikite prie temos, kaip konvertuoti Markdown į XPS naudojant Java.