Ten prosty temat dotyczy tego, jak konwertować HTML na tekst w Javie. W Java HTML do zwykłego tekstu aplikacja do konwersji działająca na platformach Windows, Linux lub macOS może być rozwijana przy użyciu prostych i łatwych interfejsów API.
Kroki, aby przekonwertować HTML na tekst w Javie
- Skonfiguruj swój projekt, aby dodać Aspose.HTML for Java z repozytorium Maven
- Dołącz odwołanie do przestrzeni nazw Aspose.HTML w swojej aplikacji
- Odczytaj zawartość źródłowego pliku HMTL za pomocą obiektu String
- Zainicjuj obiekt HTMLDocument class, aby załadować źródłowy ciąg HTML
- Zainicjuj obiekt klasy INodeIterator, aby iterować węzły i dołączyć w StringBuilder
- Zapisz wyodrębniony tekst z HTML na dysku
W celu wyodrębnienia tekstu z HTML można użyć aplikacji opartej na Javie za pomocą kilku linijek kodu. Zainicjujemy ten proces, ładując źródłowy kod HTML do obiektu String, a następnie ładując ten ciąg przy użyciu HTMLDocument class. Następnie użyjemy INodeIterator do wyodrębnienia, przejścia i dołączenia węzłów HMTL do StringBuilder. Na koniec StringBuilder zostanie zapisany jako zwykły plik tekstowy na dysku.
Kod do konwersji HTML na tekst w Javie
Powyższy przykład w Java konwertuje HTML na zwykły tekst w kilku wywołaniach API. Stworzyliśmy klasę StyleFilter, która rozszerza klasę NodeFilter i zaimplementowaliśmy metodę AcceptNode w celu ustawienia filtrów węzłów klienta i pominięcia niepożądanych węzłów z HTML podczas procesu konwersji.
W tym temacie zbadaliśmy jak wyodrębnić tekst z HTML w Javie. Jeśli interesuje Cię konwersja pliku MD do formatu XPS, przejdź do tematu jak przekonwertuj Markdown na XPS przy użyciu Java.