Hogyan lehet HTML-t szöveggé konvertálni Java nyelven

Ez az egyszerű téma arról szól, hogyan lehet a HTML szöveggé konvertálni Java nyelven. A Java HTML-ből egyszerű szöveggé konvertáló alkalmazások Windows, Linux vagy macOS platformokon fejleszthetők egyszerű és egyszerű API-felületekkel.

Lépések a HTML szöveggé konvertálásához Java nyelven

  1. Konfigurálja a projektet úgy, hogy hozzáadja a(z) Aspose.HTML for Java elemet a Maven adattárból
  2. Szerelje be a Aspose.HTML névtérre való hivatkozást az alkalmazásban
  3. Olvassa be a forrás HMTL fájl tartalmát a String objektum használatával
  4. A forrás HTML-karakterlánc betöltéséhez inicializálja a HTMLDocument class objektumot
  5. Inicializálja az INodeIterator osztályobjektumot a csomópontok iterálásához és hozzáfűzéséhez a StringBuilderben
  6. Mentse a HTML-ből kivont szöveget a lemezre

Annak érdekében, hogy szöveg kinyerése HTML-ből Java alapú alkalmazás használható néhány sor kóddal. A folyamatot úgy indítjuk el, hogy betöltjük a forrás-HTML-t egy String objektumba, majd ezt követően betöltjük a karakterláncot a HTMLDocument class használatával. Ezután az INodeIterator segítségével kibontjuk, bejárjuk és hozzáfűzzük a HMTL csomópontokat egy StringBuilderhez. Végül a StringBuilder egyszerű szöveges fájlként kerül mentésre a lemezre.

Kód a HTML szöveggé konvertálásához Java nyelven

A fenti példa a Java-ban néhány API-hívásban konvertálja a HTML-t egyszerű szöveggé. Létrehoztuk a StyleFilter osztályt, amely kiterjeszti a NodeFilter osztályt, és megvalósítja az AcceptNode metódust az ügyfél csomópontszűrőinek beállításához és a nem kívánt csomópontok kihagyásához a HTML-ből a konverziós folyamat során.

Ebben a témában megvizsgáltuk, hogyan lehet szöveget kivonni a HTML-ből Java nyelven. Ha érdekli az MD fájl XPS formátumba konvertálása, folytassa a konvertálja a Markdown-t XPS-re Java segítségével témával.

 Magyar