Cách đọc tệp PDF trong C#

Đọc các loại tài liệu khác nhau theo chương trình là thông lệ ngày nay. Trong hướng dẫn cách thực hiện này, bạn sẽ học cách đọc Tệp PDF trong C# bằng cách thực hiện theo các bước đơn giản bên dưới.

Các bước để đọc tệp PDF trong C#

  1. Tạo một Ứng dụng Bảng điều khiển C# trống trong Visual Studio
  2. Thêm tham chiếu vào Aspose.PDF for .NET bằng cách cài đặt nó từ NuGet.org
  3. Tải tệp PDF hiện có trong đối tượng Tài liệu
  4. Khởi tạo lớp TextAbsorber để đọc tệp PDF
  5. Trích xuất văn bản PDF và ghi nó vào đầu ra Console
  6. Duyệt qua Trang PDF Resources để tìm hình ảnh
  7. Tạo đối tượng FileStream với hình ảnh tìm thấy
  8. Lưu hình ảnh vào đĩa cục bộ

Đoạn mã dưới đây giải thích cách mở và đọc tệp PDF trong C#. Bạn sẽ có thể đọc văn bản và trích xuất hình ảnh từ tệp PDF bằng cách sử dụng nó. API cung cấp Lớp TextAbsorber được sử dụng để đọc văn bản từ tệp PDF và bạn có thể đạt được kết quả được trích xuất thông qua đối tượng Text. Cũng có thể tìm hình ảnh và lưu chúng vào đĩa cục bộ bằng cách lặp qua các tài nguyên Trang PDF như được hiển thị bên dưới.

Mã để đọc tệp PDF trong C#

Trong chủ đề trước, bạn đã học cách xử lý các tệp PDF lớn trong C#. Thông tin và mã ví dụ ở trên sẽ cho phép bạn mở và đọc các tệp PDF trong C# để trích xuất văn bản và hình ảnh.

 Tiếng Việt