Det här enkla ämnet handlar om hur man konverterar HTML till text i Java. I Java HTML till vanlig text kan konverteringsapplikationer som körs under Windows, Linux eller macOS-plattformar utvecklas med enkla och enkla API-gränssnitt.
Steg för att konvertera HTML till text i Java
- Konfigurera ditt projekt för att lägga till Aspose.HTML for Java från Maven-förvaret
- Inkludera hänvisningen till namnområdet Aspose.HTML i din applikation
- Läs källinnehållet i HMTL-filen med String-objekt
- Initiera objektet HTMLDocument class för att läsa in HTML-källsträngen
- Initiera INodeIterator-klassobjektet för att iterera noder och lägg till i StringBuilder
- Spara den extraherade texten från HTML på disken
För att extrahera text från HTML kan Java-baserad applikation med några rader kod användas. Vi kommer att initiera processen genom att ladda käll-HTML i ett String-objekt och sedan ladda den strängen med HTMLDocument class. Vi kommer sedan att använda INodeIterator för att extrahera, korsa och lägga till HMTL-noderna till en StringBuilder. Slutligen kommer StringBuilder att sparas som vanlig textfil på disken.
Kod för att konvertera HTML till text i Java
Ovanstående exempel i Java konverterar HTML till vanlig text i några få API-anrop. Vi har skapat StyleFilter class som utökar NodeFilter class och implementerar AcceptNode metoden för att ställa in kundnodfiltren och utelämna oönskade noder från HTML under konverteringsprocessen.
I det här ämnet har vi utforskat hur man extraherar text från HTML i Java. Om du är intresserad av konvertering av MD-fil till XPS-format, fortsätt till ämnet hur man konvertera Markdown till XPS med Java.