Trong hướng dẫn này, chúng ta sẽ tìm hiểu cách đọc tệp PDF trong C++. Bạn có thể trích xuất văn bản hoặc hình ảnh từ bất kỳ trang nào hoặc toàn bộ tài liệu của tệp PDF bằng các lệnh gọi API đơn giản trong C++. Tính năng này không phụ thuộc vào Adobe Acrobat hoặc bất kỳ ứng dụng nào để đọc PDF trên nền tảng Windows hoặc Linux.
Các bước để đọc tệp PDF trong C ++
- Cài đặt Aspose.Pdf for C++ từ công cụ quản lý gói NuGet
- Thêm tham chiếu vào không gian tên Aspose::Pdf
- Tải PDF đầu vào bằng Document Class
- Khởi tạo một thể hiện của lớp TextFragmentAbsorber
- In văn bản trích xuất trên bàn điều khiển
- Lặp lại qua từng trang và hình ảnh của tài liệu
- Lưu hình ảnh đầu ra được trích xuất dưới dạng tệp JPG
Bạn có thể mở và đọc tệp pdf bằng C++ với vài dòng mã đơn giản. Nó có thể trích xuất tất cả văn bản và hình ảnh từ tệp PDF một cách hiệu quả.
Mã để đọc tệp PDF trong C ++
Trong chủ đề trước, chúng ta đã khám phá Cách làm phẳng các trường biểu mẫu PDF trong C#. Chủ đề này tập trung vào cách đọc văn bản từ tệp PDF trong C++.