Bài viết này giải thích cách chuyển đổi HTML sang Excel bằng Python. Bài viết mô tả các thiết lập môi trường, danh sách các bước và mã mẫu để chuyển đổi định dạng tệp từ HTML sang Excel bằng Python. Bạn sẽ học cách tùy chỉnh việc tải tệp PDF nguồn và lưu đầu ra ở nhiều định dạng khác nhau theo yêu cầu.
Các bước chuyển đổi HTML sang XLS bằng Python
- Thiết lập môi trường để sử dụng Aspose.PDF cho Python qua .NET để thay đổi tệp HTML thành Excel
- Tạo một thể hiện của lớp HtmlLoadOptions để tùy chỉnh việc tải tệp HTML nguồn
- Tải tệp HTML đầu vào vào đối tượng lớp Document bằng cách sử dụng các tùy chọn đã chỉ định
- Lưu định dạng đã tải ở định dạng Excel bằng cách sử dụng trình liệt kê SaveFormat
Các bước này tóm tắt quá trình phát triển trình chuyển đổi HTML sang XLS bằng Python. Bắt đầu quá trình bằng cách tạo một đối tượng của lớp HtmlLoadOptions để kiểm soát việc tải tệp HTML đầu vào. Tải tệp HTML vào đối tượng Document với các tùy chọn tải tùy chỉnh và lưu tệp đó ở định dạng Excel bằng cách sử dụng trình liệt kê SaveFormat.
Mã để chuyển đổi tệp HTML sang Excel bằng Python
Mã này trình bày cách thay đổi tài liệu HTML thành Excel bằng Python. Bạn có thể thiết lập trình xử lý cảnh báo để quản lý các lỗi và cảnh báo được tạo ra trong quá trình tải HTML. Bạn có thể thiết lập cờ để thiết lập các tùy chọn bố cục trang, hiển thị toàn bộ tài liệu thành một trang duy nhất, thiết lập mã hóa và sử dụng tùy chọn SaveFormat để xác định định dạng đầu ra như EXCEL, PPTX, XPS, DOC, v.v.
Chủ đề này đã hướng dẫn chúng ta cách chuyển đổi HTML sang XLS bằng Python. Nếu bạn muốn chuyển đổi hình ảnh sang PDF, hãy tham khảo bài viết trên Cách chuyển đổi hình ảnh sang PDF bằng Python.