Hur man konverterar HTML till text i Java

Det här enkla ämnet handlar om hur man konverterar HTML till text i Java. I Java HTML till vanlig text kan konverteringsapplikationer som körs under Windows, Linux eller macOS-plattformar utvecklas med enkla och enkla API-gränssnitt.

Steg för att konvertera HTML till text i Java

  1. Konfigurera ditt projekt för att lägga till Aspose.HTML for Java från Maven-förvaret
  2. Inkludera hänvisningen till namnområdet Aspose.HTML i din applikation
  3. Läs källinnehållet i HMTL-filen med String-objekt
  4. Initiera objektet HTMLDocument class för att läsa in HTML-källsträngen
  5. Initiera INodeIterator-klassobjektet för att iterera noder och lägg till i StringBuilder
  6. Spara den extraherade texten från HTML på disken

För att extrahera text från HTML kan Java-baserad applikation med några rader kod användas. Vi kommer att initiera processen genom att ladda käll-HTML i ett String-objekt och sedan ladda den strängen med HTMLDocument class. Vi kommer sedan att använda INodeIterator för att extrahera, korsa och lägga till HMTL-noderna till en StringBuilder. Slutligen kommer StringBuilder att sparas som vanlig textfil på disken.

Kod för att konvertera HTML till text i Java

Ovanstående exempel i Java konverterar HTML till vanlig text i några få API-anrop. Vi har skapat StyleFilter class som utökar NodeFilter class och implementerar AcceptNode metoden för att ställa in kundnodfiltren och utelämna oönskade noder från HTML under konverteringsprocessen.

I det här ämnet har vi utforskat hur man extraherar text från HTML i Java. Om du är intresserad av konvertering av MD-fil till XPS-format, fortsätt till ämnet hur man konvertera Markdown till XPS med Java.

 Svenska