Chủ đề này trình bày chi tiết về cách lấy hình ảnh từ tệp PDF bằng Python với sự trợ giúp của các bước cấu hình và mã mẫu có thể chạy được. Mã chương trình hoàn chỉnh được chia sẻ có thể được sử dụng để phát triển ứng dụng này vì tất cả các lớp và phương thức bắt buộc đều được cung cấp cần thiết để lấy hình ảnh từ PDF bằng Python ở các định dạng khác nhau như PNG, JPEG, v.v. Bạn cũng sẽ quan sát các tùy chọn khác nhau để nâng cao quy trình bằng cách tùy chỉnh hình ảnh được tạo sau khi truy cập chúng từ tệp PDF.
Các bước để có được hình ảnh PDF trong Python
- Định cấu hình IDE để sử dụng Aspose.PDF cho Python qua .NET để trích xuất hình ảnh từ PDF
- Truy cập tệp PDF nguồn có hình ảnh bên trong bằng cách sử dụng đối tượng lớp Document
- Truy cập một hình ảnh cụ thể bên trong tài nguyên trang bằng cách sử dụng đối tượng lớp XImage
- Tạo một luồng tệp mới bằng tên của hình ảnh mong muốn
- Lưu hình ảnh dưới dạng tệp JPEG trên đĩa
Các bước này đòi hỏi cách lấy hình ảnh từ PDF bằng Python bằng cách hiển thị cách tiếp cận từng bước trong đó đầu tiên chúng tôi mở tệp PDF nguồn và sau đó truy cập một trang cụ thể bên trong PDF. Đối với mỗi trang PDF, có một tập hợp các tài nguyên bao gồm các hình ảnh có thể được tham khảo với sự trợ giúp của một chỉ mục. Khi tham chiếu hình ảnh cần thiết được truy cập bằng cách sử dụng một thể hiện của đối tượng lớp XImage, nó có thể được lưu dưới dạng hình ảnh trên đĩa bằng cách sử dụng một thể hiện của luồng bộ nhớ.
Mã để lấy hình ảnh từ PDF bằng Python
Mã này trình bày quy trình lấy hình ảnh ra khỏi PDF trong Python bằng cách truy cập nó vào đối tượng lớp Tài liệu và sau đó tải truy cập hình ảnh mong muốn trên một trang cụ thể bằng cách truy cập danh sách tài nguyên của nó. Khi chúng tôi có quyền truy cập vào hình ảnh mong muốn, chúng tôi có thể đổi tên nó và cũng có thể thay đổi các tham chiếu trong tài liệu. Bạn cũng có thể truy cập các thuộc tính khác nhau như tên, chiều rộng và chiều cao để lọc hình ảnh trước khi lưu chúng dưới dạng tệp trên đĩa.
Ví dụ này đã hướng dẫn chúng tôi trích xuất hình ảnh từ một trang PDF. Nếu bạn muốn tìm hiểu về quy trình thêm hình mờ trong tệp PDF, hãy tham khảo bài viết trên cách thêm hình mờ vào PDF bằng Python.