Cách chuyển đổi tài liệu Word sang HTML bằng Java

Trong chủ đề đơn giản này, bạn sẽ tìm hiểu cách chuyển đổi Word Document thành HTML bằng Java. Các bước đơn giản sau đây có thể được sử dụng để xuất DOCX sang HTML bằng Java trong bất kỳ hệ điều hành phổ biến nào như MS Windows, Ubuntu hoặc macOS bằng các lệnh gọi API đơn giản.

Các bước để chuyển đổi tài liệu Word sang HTML bằng Java

  1. Thêm tham chiếu tệp JAR Aspose.Words bằng kho lưu trữ Maven
  2. Khởi tạo đối tượng Document Class để tải tài liệu nguồn
  3. Chỉ định các HtmlSaveOptions khác nhau bao gồm Lề trang, CssStyleSheet và Thiết lập trang, v.v.
  4. Xuất DOCX sang HTML trong Java bằng phương thức lưu

Trong mã mẫu sau đây, trước tiên chúng tôi sẽ tải DOCX nguồn bằng cách sử dụng phiên bản Document class. Sau đó, sử dụng phiên bản HtmlSaveOptions class, chúng tôi sẽ đặt CssStyleSheetType, ExportPageMargins và ImageResolution. Cuối cùng, sử dụng phương thức lưu, chúng ta sẽ tạo HTML từ DOCX trong Java.

Mã để xuất DOCX sang HTML trong Java

Trong mã mẫu này, chúng tôi đã tải DOCX nguồn bằng cách sử dụng phiên bản của Lớp tài liệu. Phiên bản HtmlSaveOptions class có thể được sử dụng để đặt các tùy chọn khác nhau như mã hóa, tùy chọn SVG, phiên bản và nhiều thuộc tính khác. Cuối cùng, chúng tôi xuất DOCX sang HTML bằng Java.

Trong chủ đề trước của cách chuyển đổi DOCX sang TIFF bằng Java, chúng tôi đã tập trung vào việc hiển thị DOCX thành TIFF. Trong khi đó, trong chủ đề này, chúng ta đã học cách tạo HTML từ DOCX bằng Java.

 Tiếng Việt