Wyodrębnij tekst z dokumentu programu Word w Javie

Można Wyodrębnić Text z dokumentu Word w Javie, odwołując się do tego prostego artykułu. Obejmuje kroki wymagane do skonfigurowania środowiska programistycznego, etapowy przepływ pracy programu i działający przykładowy kod do konwertowania DOCX na TXT w Javie. Opracowaną aplikację można używać w dowolnym środowisku wspieranym przez Javę w systemie Linux, MS Windows lub macOS.

Kroki tworzenia konwertera Word na TXT przy użyciu języka Java

  1. Skonfiguruj środowisko, instalując Aspose.Words for Java z menedżera repozytorium, aby przekonwertować plik DOCX na plik TXT przy użyciu Java
  2. Otwórz dokument źródłowy programu Word, tworząc instancję klasy Document do konwersji pliku Word na plik TXT
  3. Utwórz obiekt klasy TxtSaveOptions, aby ustawić wymagane właściwości wyjściowego pliku TXT
  4. Zapisz załadowany plik DOCX jako plik TXT na dysku, korzystając z metody zapisu

Te dokładne kroki w Java wyodrębniają tekst z dokumentu programu Word przy użyciu prostego interfejsu API. Najpierw załadujemy z dysku źródłowy plik DOCX za pomocą instancji klasy Document, a następnie ustawimy żądane opcje eksportu wyjściowego pliku TXT za pomocą instancji klasy TxtSaveOptions. Na koniec otwarty dokument Word jest zapisywany na dysku jako plik TXT przy użyciu metody zapisu.

Kod do konwersji DOCX na TXT w Javie

Aby uzyskać dostęp do źródła DOCX z dysku i wyodrębnić tekst z dokumentu programu Word, w powyższym przykładzie kodu użyto interfejsu API opartego na języku Java. Można zapisać plik TXT na dysku bez polegania na opcjonalnej instancji klasy TxtSaveOptions. Jeśli jednak chcesz dostosować żądany plik TXT, możesz użyć różnych metod ustawiających udostępnianych przez klasę TxtSaveOptions, w tym setEncoding(), setForcePageBreaks(), setMaxCharactersPerLine(), setParagraphBreak() i setPrettyFormat(), żeby wymienić tylko kilka.

Ten artykuł nauczył nas, jak opracować konwerter Word na TXT przy użyciu języka Java. Jeśli interesuje Cię porównanie dokumentów Worda, zapoznaj się z artykułem na temat Porównaj dokumenty programu Word przy użyciu języka Java.

 Polski