Trong hướng dẫn ngắn gọn này, chúng ta sẽ tìm hiểu cách chuyển đổi Word thành Markdown bằng Java. Các tệp Markdown được sử dụng phổ biến để tạo các trang web và bài viết trên internet. Bạn có thể tạo tài liệu dưới dạng tệp DOC hoặc DOCX, sau đó xuất tệp đó bằng Trình chuyển đổi Word sang Markdown bằng Java trong bất kỳ hệ điều hành nào như MS Windows, macOS hoặc Linux.
Các bước chuyển Word sang Markdown bằng Java
- Thêm tham chiếu vào tệp JAR Aspose.Words bằng kho lưu trữ Maven
- Khởi tạo đối tượng lớp Document để tải tài liệu nguồn
- Sử dụng lớp MarkdownSaveOptions, đặt các thuộc tính khác nhau cho tệp đánh dấu
- Lưu tệp đầu ra được tạo ở định dạng đánh dấu
Trong các bước trên, tài liệu Word đầu vào được tải trước tiên và sau đó các thuộc tính khác nhau được hiển thị bởi lớp MarkdownSaveOptions được đặt. Chẳng hạn, bạn có thể chỉ định các tùy chọn cho tệp đánh dấu như mã hóa, tối ưu hóa bộ nhớ hoặc chân trang đầu trang, v.v. Thông qua quá trình này, bạn có thể dễ dàng chuyển đổi DOCX sang MD bằng Java.
Mã để chuyển đổi DOCX sang Markdown bằng Java
Trong đoạn mã này, một đối tượng của Document class được khởi tạo để tải tài liệu Word nguồn. Các đặc điểm khác nhau cho tệp đầu ra cũng được đặt sao cho mã hóa, chân trang tiêu đề được chỉ định để nhận được tệp đánh dấu cần thiết. Bạn có thể sử dụng tính năng này để chuyển DOCX sang Markdown bằng Java trong ứng dụng của mình.
Trong bài viết này, chúng ta đã học cách chuyển đổi DOC sang MD bằng Java. Tuy nhiên, nếu bạn muốn khám phá chuyển đổi từ Word sang HTML, vui lòng tham khảo bài viết trên cách chuyển đổi DOCX sang HTML bằng Java.