Ten prosty temat dotyczy tego, jak konwertować HTML na tekst w Javie. W Java HTML do zwykłego tekstu aplikacja do konwersji działająca na platformach Windows, Linux lub macOS może być rozwijana przy użyciu prostych i łatwych interfejsów API.

Kroki, aby przekonwertować HTML na tekst w Javie

Skonfiguruj swój projekt, aby dodać Aspose.HTML for Java z repozytorium Maven
Dołącz odwołanie do przestrzeni nazw Aspose.HTML w swojej aplikacji
Odczytaj zawartość źródłowego pliku HMTL za pomocą obiektu String
Zainicjuj obiekt HTMLDocument class, aby załadować źródłowy ciąg HTML
Zainicjuj obiekt klasy INodeIterator, aby iterować węzły i dołączyć w StringBuilder
Zapisz wyodrębniony tekst z HTML na dysku

W celu wyodrębnienia tekstu z HTML można użyć aplikacji opartej na Javie za pomocą kilku linijek kodu. Zainicjujemy ten proces, ładując źródłowy kod HTML do obiektu String, a następnie ładując ten ciąg przy użyciu HTMLDocument class. Następnie użyjemy INodeIterator do wyodrębnienia, przejścia i dołączenia węzłów HMTL do StringBuilder. Na koniec StringBuilder zostanie zapisany jako zwykły plik tekstowy na dysku.

Kod do konwersji HTML na tekst w Javie

Powyższy przykład w Java konwertuje HTML na zwykły tekst w kilku wywołaniach API. Stworzyliśmy klasę StyleFilter, która rozszerza klasę NodeFilter i zaimplementowaliśmy metodę AcceptNode w celu ustawienia filtrów węzłów klienta i pominięcia niepożądanych węzłów z HTML podczas procesu konwersji.

W tym temacie zbadaliśmy jak wyodrębnić tekst z HTML w Javie. Jeśli interesuje Cię konwersja pliku MD do formatu XPS, przejdź do tematu jak przekonwertuj Markdown na XPS przy użyciu Java.

Baza wiedzy Aspose

Znajdź odpowiedzi według API

Jak przekonwertować HTML na tekst w Javie

Kroki, aby przekonwertować HTML na tekst w Javie

Kod do konwersji HTML na tekst w Javie