이 간단한 기사를 참조하면 Java의 Word 문서에서 Text를 추출할 수 있습니다. 여기에는 개발 환경을 설정하는 데 필요한 단계, 단계별 프로그램 워크플로 및 DOCX}를 Java에서 TXT로 변환하기 위한 실행 예제 코드가 포함되어 있습니다. 개발된 애플리케이션은 Linux, MS Windows, macOS 등 Java가 지원되는 모든 환경에서 사용할 수 있습니다.
Java를 사용하여 Word에서 TXT 변환기를 개발하는 단계
- Java를 사용하여 DOCX 파일을 TXT 파일로 변환하려면 저장소 관리자에서 Aspose.Words for Java을 설치하여 환경을 구성하십시오.
- Word에서 TXT 파일로 변환하기 위한 Document 클래스의 인스턴스를 생성하여 소스 Word 문서를 엽니다.
- 필요한 출력 TXT 파일 속성을 설정하려면 TxtSaveOptions 클래스 객체를 생성하세요.
- save 메소드를 사용하여 로드된 DOCX 파일을 TXT 파일로 디스크에 저장합니다.
Java의 이러한 정확한 단계는 간단한 API 인터페이스를 사용하여 Word 문서에서 텍스트를 추출합니다. 먼저 Document 클래스의 인스턴스를 사용하여 디스크에서 소스 DOCX 파일을 로드한 다음 TxtSaveOptions 클래스의 인스턴스를 사용하여 원하는 출력 TXT 파일 내보내기 옵션을 설정합니다. 마지막으로 열려 있는 Word 문서는 save 메소드를 사용하여 디스크에 TXT 파일로 저장됩니다.
Java에서 DOCX를 TXT로 변환하는 코드
디스크에서 소스 DOCX에 액세스하고 Word 문서에서 텍스트를 추출하기 위해 Java 기반 API가 앞서 언급한 코드 예제에서 사용되었습니다. 선택적 TxtSaveOptions 클래스 인스턴스에 의존하지 않고 디스크에 TXT 파일을 저장할 수 있습니다. 그러나 원하는 TXT 파일을 사용자 정의하려는 경우 setEncoding(), setForcePageBreaks(), setMaxCharactersPerLine(), setParagraphBreak() 및 setPrettyFormat()을 포함하여 TxtSaveOptions 클래스에서 제공하는 다양한 setter 메서드를 사용할 수 있습니다.
이 기사에서는 Java*를 사용하여 *Word를 TXT로 변환하는 변환기를 개발하는 방법에 대해 설명했습니다. Word 문서 비교에 관심이 있다면 Java를 사용하여 Word 문서 비교의 기사를 참조하세요.