Đây là bài viết hướng dẫn cách chuyển đổi HTML sang Word bằng C# bằng cách cung cấp thông tin chi tiết về cài đặt môi trường và cũng chứa mã C# chạy được để tải tệp HTML nguồn để chuyển đổi. Các tùy chọn có sẵn để định cấu hình tệp DOCX đầu ra bằng cách sử dụng đối tượng lớp DocSaveOptions. Trong phần hướng dẫn viết HTML sang Word, ngôn ngữ C# đã được sử dụng.
Các bước để viết nội dung HTML vào tài liệu Word bằng C#
- Thêm tham chiếu đến Aspose.HTML vào dự án để chuyển đổi HTML thành tệp Word
- Mở tệp HTML nguồn bằng cách tải nó vào HTMLDocument bằng cách cung cấp đường dẫn tệp
- Tạo đối tượng lớp DocSaveOptions để định cấu hình tệp đầu ra
- Lưu tệp Word được chuyển đổi từ tệp HTML nguồn bằng cách sử dụng cấu hình đã chỉ định
Các bước đơn giản này mô tả cách sử dụng C# chuyển đổi tệp HTML sang Word như DOCX có thể dễ dàng đạt được. Thông tin đầu tiên được chia sẻ để định cấu hình môi trường và sau đó tệp HTML nguồn được tải. Trong bước tiếp theo, đối tượng lớp DocSaveOptions được sử dụng để định cấu hình tệp DOCX đầu ra, tuy nhiên, bạn có tùy chọn sử dụng tất cả các cài đặt mặc định của lớp này. Ở bước cuối cùng và cũng là bước cuối cùng, tệp được lưu dưới dạng DOCX, trong khi bạn cũng có thể lưu tệp đó sang bất kỳ định dạng nào khác được MS Word hỗ trợ.
Mã để chuyển đổi HTML sang Word bằng C#
Trong mã mẫu này, chúng ta đã học cách chuyển đổi HTML thành Word trong C# bằng cách sử dụng một vài dòng mã trong đó ngay từ đầu, tệp HTML nguồn được tải vào HTMLDocument. Lưu ý rằng không cần thiết phải tải tệp HTML hiện có nhưng bạn có thể tìm nạp chuỗi HTML từ một số nguồn bên ngoài hoặc sử dụng một số URL trong khi gọi hàm Converter.ConvertHTML(). Cũng có thể thực hiện nhiều cấu hình khác bằng cách sử dụng đối tượng lớp DocSaveOptions như đặt kích thước trang và lề của tệp DOCX đầu ra.
Trong hướng dẫn cách thực hiện này, chúng ta đã học cách viết nội dung HTML vào tài liệu Word bằng C#. Nếu bạn quan tâm đến việc chuyển đổi tệp HTML thành văn bản, hãy tham khảo bài viết trên cách chuyển đổi HTML thành văn bản trong C#.