Ez az egyszerű téma arról szól, hogyan lehet a HTML szöveggé konvertálni Java nyelven. A Java HTML-ből egyszerű szöveggé konvertáló alkalmazások Windows, Linux vagy macOS platformokon fejleszthetők egyszerű és egyszerű API-felületekkel.
Lépések a HTML szöveggé konvertálásához Java nyelven
- Konfigurálja a projektet úgy, hogy hozzáadja a(z) Aspose.HTML for Java elemet a Maven adattárból
- Szerelje be a Aspose.HTML névtérre való hivatkozást az alkalmazásban
- Olvassa be a forrás HMTL fájl tartalmát a String objektum használatával
- A forrás HTML-karakterlánc betöltéséhez inicializálja a HTMLDocument class objektumot
- Inicializálja az INodeIterator osztályobjektumot a csomópontok iterálásához és hozzáfűzéséhez a StringBuilderben
- Mentse a HTML-ből kivont szöveget a lemezre
Annak érdekében, hogy szöveg kinyerése HTML-ből Java alapú alkalmazás használható néhány sor kóddal. A folyamatot úgy indítjuk el, hogy betöltjük a forrás-HTML-t egy String objektumba, majd ezt követően betöltjük a karakterláncot a HTMLDocument class használatával. Ezután az INodeIterator segítségével kibontjuk, bejárjuk és hozzáfűzzük a HMTL csomópontokat egy StringBuilderhez. Végül a StringBuilder egyszerű szöveges fájlként kerül mentésre a lemezre.
Kód a HTML szöveggé konvertálásához Java nyelven
A fenti példa a Java-ban néhány API-hívásban konvertálja a HTML-t egyszerű szöveggé. Létrehoztuk a StyleFilter osztályt, amely kiterjeszti a NodeFilter osztályt, és megvalósítja az AcceptNode metódust az ügyfél csomópontszűrőinek beállításához és a nem kívánt csomópontok kihagyásához a HTML-ből a konverziós folyamat során.
Ebben a témában megvizsgáltuk, hogyan lehet szöveget kivonni a HTML-ből Java nyelven. Ha érdekli az MD fájl XPS formátumba konvertálása, folytassa a konvertálja a Markdown-t XPS-re Java segítségével témával.