Ištraukite tekstą iš Word dokumento Java.

Galite Ištraukti Text iš Word dokumento Java programoje, remiantis šiuo paprastu straipsniu. Tai apima būtinus veiksmus, skirtus sukurti kūrimo aplinką, laipsnišką programos darbo eigą ir veikiantį kodo pavyzdį, skirtą konvertuoti DOCX į TXT Java. Sukurta programa gali būti naudojama bet kurioje Java palaikomoje Linux, MS Windows ar macOS aplinkoje.

Veiksmai kuriant Word į TXT konverterį naudojant Java

  1. Konfigūruokite aplinką įdiegdami Aspose.Words for Java iš saugyklos tvarkyklės, kad konvertuotumėte DOCX failą į TXT failą naudodami Java
  2. Atidarykite šaltinio Word dokumentą sukurdami Document klasės egzempliorių, skirtą Word į TXT failą konvertuoti
  3. Sukurkite TxtSaveOptions klasės objektą, kad nustatytumėte reikiamas išvesties TXT failo ypatybes
  4. Išsaugokite įkeltą DOCX failą kaip TXT failą diske naudodami išsaugojimo metodą

Šie tikslūs žingsniai Java ištraukia tekstą iš Word dokumento naudojant paprastą API sąsają. Pirmiausia įkelsime šaltinio DOCX failą iš disko, naudodami Document klasės egzempliorių, po kurio nustatomos norimos išvesties TXT failo eksporto parinktys, naudojant TxtSaveOptions klasės egzempliorių. Galiausiai atidarytas Word dokumentas išsaugomas kaip TXT failas diske naudojant išsaugojimo metodą.

Kodas, skirtas konvertuoti DOCX į TXT Java

Norint pasiekti DOCX šaltinį iš disko ir ištraukti tekstą iš Word dokumento, pirmiau minėtame kodo pavyzdyje buvo naudojama Java API. TXT failą galima išsaugoti diske nepasikliaujant pasirenkamu TxtSaveOptions klasės egzemplioriumi. Tačiau jei norite tinkinti norimą TXT failą, galite naudoti skirtingus nustatymo metodus, kuriuos atskleidžia TxtSaveOptions klasė, įskaitant setEncoding(), setForcePageBreaks(), setMaxCharactersPerLine(), setParagraphBreak() ir setPrettyFormat().

Šis straipsnis mus paskatino sukurti Word į TXT keitiklį naudojant Java. Jei jus domina Word dokumentų palyginimas, žr. straipsnį Palyginkite Word dokumentus naudodami Java..

 Latviski