Cách chuyển đổi PDF sang HTML trong C#

Chủ đề hướng dẫn ngắn gọn này tập trung vào cách Chuyển đổi PDF thành HTML trong C#. Bạn có thể xuất PDF sang HTML trong C# bằng cách sử dụng lệnh gọi API đơn giản mà không phụ thuộc vào Adobe Acrobat hoặc bất kỳ công cụ bên thứ ba nào khác. Ứng dụng này có thể được sử dụng trong bất kỳ ứng dụng dựa trên .NET nào chạy trong hệ điều hành MS Windows, Linux hoặc macOS.

Các bước để chuyển đổi PDF sang HTML trong C#

  1. Cài đặt Aspose.PDF bằng công cụ gói NuGet trong ứng dụng của bạn
  2. Thêm tham chiếu đến không gian tên Aspose.PDF trong ứng dụng của bạn
  3. Khởi tạo phiên bản lớp Document để tải PDF và chuyển đổi sang HTML
  4. Khởi tạo đối tượng HtmlSaveOptions để đặt các tùy chọn lưu Phông chữ, SVG và Hình ảnh
  5. Cuối cùng, chuyển đổi PDF sang HTML trong C# bằng cách sử dụng phương thức Lưu

Bằng cách làm theo các bước trên trong quá trình chuyển đổi C# PDF sang HTML, việc chuyển đổi có thể thực hiện được bằng cách sử dụng lệnh gọi API đơn giản. Bạn sẽ bắt đầu bằng cách thêm các tham chiếu API cần thiết và sau đó tải tệp PDF nguồn. Sau đó, bạn sẽ thiết lập các tùy chọn cần thiết trong HTML đã xuất bằng cách sử dụng lớp HtmlSaveOptions. Cuối cùng, bằng cách sử dụng SaveFormat.Html enumerator bên trong phương thức Save, HTML sẽ được lưu trên đĩa.

Mã để chuyển đổi PDF sang HTML trong C#

Ví dụ trên trong C# chuyển đổi PDF sang HTML bằng cách sử dụng lớp HtmlSaveOptions cho phép bạn đặt các tùy chọn như chia nhỏ PDF thành nhiều trang và quản lý cài đặt phông chữ. Nó cũng cho phép bạn đặt các tùy chọn xuất SVG như nén và đường dẫn cho nội dung SVG cùng với cài đặt đường dẫn cho các hình ảnh được xuất từ PDF nguồn. Cuối cùng, tệp HTML mong muốn được lưu trên đĩa hoặc trong MemoryStream để sử dụng tiếp.

Chúng tôi đã chứng kiến việc chuyển đổi PDF sang HTML trong C# và nhận được đầu ra tùy chỉnh tiện lợi như thế nào. Nếu bạn quan tâm đến việc lưu tệp PDF dưới dạng hình ảnh, hãy tham khảo bài viết trên cách chuyển PDF sang Image trong C#.

 Tiếng Việt