Trong hướng dẫn ngắn này, chúng ta sẽ tìm hiểu cách chuyển đổi Word Document thành HTML bằng Python. Các dòng mã mẫu trong Python chuyển đổi DOCX sang HTML một cách hiệu quả bằng cách làm theo các bước đơn giản. Người ta có thể thực hiện chuyển đổi này trên bất kỳ hệ điều hành nào như Linux, macOS hoặc MS Windows nơi khung .NET được định cấu hình.
Các bước để chuyển đổi tài liệu Word sang HTML bằng Python
- Thiết lập môi trường để sử dụng Aspose.Words cho Python qua .NET trong ứng dụng của bạn
- Bao gồm các không gian tên và các lớp được yêu cầu khi bắt đầu chương trình
- Mở tệp Word nguồn từ đĩa vào đối tượng lớp Tài liệu để chuyển đổi sang HTML
- Khởi tạo đối tượng HtmlSaveOptions để tùy chỉnh HTML đầu ra
- Chuyển đổi DOCX sang HTML bằng phương pháp lưu
Với sự trợ giúp của các bước trên trong quá trình chuyển đổi Python DOCX sang HTML đã đạt được. Trước hết, thể hiện của lớp Tài liệu được sử dụng để tải Tài liệu Word đầu vào và sau đó đặt các thuộc tính khác nhau cho quy trình hiển thị HTML như ExportPageMargins, CssStyleSheetType và ImageResolution, v.v. Cuối cùng, tệp đầu ra được lưu trên đĩa với phần mở rộng tệp HTML .
Mã để chuyển đổi Word sang HTML trong Python
Trong ứng dụng chuyển đổi Python Word sang HTML được phát triển với sự trợ giúp của ví dụ nói trên. Phiên bản của lớp Tài liệu được sử dụng để tải Tài liệu Word nguồn và sau đó các tùy chọn hiển thị khác nhau được chỉ định để tùy chỉnh các thuộc tính của tệp HTML đầu ra. Cuối cùng, để lưu phương thức lưu dựa trên Word to HTML Python* được sử dụng.
Trong bài viết này, chúng ta đã khám phá quy trình chuyển đổi DOCX sang HTML bằng API dựa trên Python. Tuy nhiên, nếu bạn muốn chuyển đổi tệp DOCX thành PDF, hãy tham khảo bài viết trên cách chuyển Word sang PDF bằng Python.