Trong hướng dẫn ngắn này, chúng ta sẽ tìm hiểu cách chuyển đổi Word Document thành HTML bằng C#. Chúng tôi có thể ** xuất DOCX sang HTML trong C#** một cách hiệu quả bằng các bước và đoạn mã đơn giản sau đây. Bạn có thể thực hiện chuyển đổi này trên bất kỳ hệ điều hành nào như macOS, Linux hoặc MS Windows nơi .NET framework được định cấu hình.
Các bước để chuyển đổi tài liệu Word sang HTML bằng C#
- Cài đặt thư viện Aspose.Words từ plugin trình quản lý gói NuGet
- Khởi tạo một đối tượng của lớp Document để tải DOCX
- Chỉ định các thuộc tính khác nhau liên quan đến CssStyleSheet, Lề trang, Thiết lập trang, v.v.
- Lưu tệp đầu ra dưới dạng tệp HTML
Trong các bước trên, trước tiên, phiên bản Document class được khởi tạo để tải Tài liệu Word đầu vào, sau đó đặt các thuộc tính khác nhau cho quy trình kết xuất như Lề trang, Thiết lập trang, v.v. để tùy chỉnh các thuộc tính của tệp HTML đầu ra. Cuối cùng, tệp đầu ra được lưu với phần mở rộng tệp HTML.
Mã để xuất DOCX sang HTML trong C#
Trong mã mẫu này, một thể hiện của Document class được khai báo để tải Tài liệu Word đầu vào. Các tùy chọn hiển thị khác nhau sau đó được chỉ định để kiểm soát các thuộc tính của tệp HTML đầu ra. Bạn có thể thao tác cách hiển thị phông chữ và hình ảnh hoặc biểu định kiểu css và các tùy chọn thư mục để chuyển đổi tệp theo yêu cầu của bạn. Cuối cùng, chúng ta sẽ tạo HTML từ DOCX bằng C#.
Trong bài viết này, chúng ta đã khám phá cách tạo HTML từ DOCX bằng C#. Tuy nhiên, nếu bạn muốn chuyển đổi tệp DOCX sang TIFF, hãy tham khảo bài viết trên cách chuyển đổi DOCX sang TIFF bằng C#.