Cách trích xuất tất cả hình ảnh từ tài liệu Word bằng Python

Hướng dẫn nhanh này chứa thông tin về cách trích xuất tất cả hình ảnh từ tài liệu Word bằng Python. Nó cung cấp tất cả các tài nguyên để định cấu hình môi trường và giới thiệu các cấu trúc API quan trọng được yêu cầu để hoàn thành tác vụ bao gồm tên lớp, phương thức và thuộc tính. Bạn có thể làm theo các bước và viết một chương trình hoàn chỉnh để trích xuất hình ảnh từ tài liệu Word bằng python như trích xuất hình ảnh từ tệp DOCX và lưu dưới dạng loại hình ảnh PNG, JPG, v.v. trên đĩa.

Các bước để trích xuất hình ảnh từ tệp Word bằng Python

  1. Định cấu hình môi trường để sử dụng Aspose.Words cho Python qua .NET để trích xuất hình ảnh
  2. Tải tệp Word nguồn có hình ảnh bằng đối tượng lớp Document
  3. Nhận danh sách tất cả các hình dạng từ tài liệu đã tải bằng phương pháp get_child_nodes()
  4. Phân tích cú pháp qua tất cả các phần tử trong bộ sưu tập hình dạng và phát hiện hình ảnh
  5. Tạo tên tệp duy nhất cho từng hình ảnh được phát hiện trong bộ sưu tập hình dạng
  6. Lưu hình ảnh được trích xuất trên đĩa với tên duy nhất

Các bước này mô tả quy trình trích xuất ảnh từ tài liệu Word bằng Python bằng cách chia sẻ cấu hình môi trường và các bước viết chương trình. Sau khi thiết lập môi trường, hãy tải tệp Word có hình ảnh bằng cách sử dụng đối tượng lớp Tài liệu và lấy bộ sưu tập tất cả các hình dạng từ đó. Vì lớp Shape có các phương thức để phát hiện hình ảnh, bạn có thể trích xuất hình ảnh và lưu chúng trên đĩa với tên đã chỉ định.

Mã để trích xuất ảnh từ tài liệu Word bằng Python

Ở đây mã được trình bày minh họa quá trình trích xuất ảnh từ Word trong Python bằng cách tải tệp nguồn bằng cách sử dụng đối tượng lớp Tài liệu có nhiều tính năng như cung cấp mật khẩu cho các tệp được bảo vệ, đặt mã hóa và đính kèm cảnh báo gọi lại để kiểm soát quá trình tải. Tương tự, phương thức get_child_nodes() được sử dụng để trích xuất các hình dạng, tuy nhiên, bạn có thể tìm nạp các nút khác như đầu trang, chân trang, bảng, nhận xét, chú thích cuối trang và nội dung, v.v.

Bài viết này đã hướng dẫn chúng tôi tìm nạp tất cả ảnh từ tệp Word bằng Python. Nếu bạn muốn tìm hiểu quy trình chèn ảnh vào tệp Word, hãy tham khảo bài viết trên cách chèn ảnh vào Word bằng Python.

 Tiếng Việt