Cách trích xuất hình ảnh từ tệp Word trong Java

Trong hướng dẫn nhanh này, chúng ta sẽ tìm hiểu cách trích xuất hình ảnh từ tệp Word trong Java. Nó chứa tất cả thông tin cần thiết để thiết lập môi trường, chi tiết về cách sử dụng API để viết ứng dụng và mã mẫu có thể chạy được minh họa quy trình trích xuất ảnh từ tài liệu Word trong Java. Bạn cũng sẽ tìm hiểu các tùy chọn khác nhau để tùy chỉnh quy trình trong khi tải tệp nguồn DOCX và trích xuất các hình ảnh khác nhau từ tệp đó như PNG, JPEG, v.v.

Các bước để trích xuất hình ảnh từ Word trong Java

  1. Thiết lập môi trường để thêm Aspose.Words for Java để trích xuất hình ảnh
  2. Tải tệp Word nguồn có hình ảnh vào đối tượng lớp Document
  3. Nhận bộ sưu tập hình bằng phương thức getChildNodes() trong lớp Tài liệu
  4. Lặp lại tất cả các hình dạng trong bộ sưu tập
  5. Kiểm tra xem hình dạng có hình ảnh hay không bằng phương thức hasImage() trong lớp Shape
  6. Lưu hình ảnh thành một tệp riêng biệt trên đĩa

Các bước này giải thích quy trình trích xuất hình ảnh từ tệp Word trong Java. Đầu tiên, các tài nguyên được chia sẻ để thiết lập môi trường, sau đó là phần giới thiệu về các lớp, phương thức và thuộc tính cần thiết để hoàn thành tác vụ như lớp Tài liệu được sử dụng để tải tệp Word nguồn và phương thức getChildNodes() được sử dụng để trích xuất tất cả những hình ảnh từ nó. Cuối cùng, mỗi thành phần của bộ sưu tập được kiểm tra xem có hình ảnh hay không và nếu tìm thấy sẽ được lưu trên đĩa dưới dạng tệp hình ảnh riêng biệt.

Mã để trích xuất hình ảnh từ tài liệu Word trong Java

Mã mẫu này trình bày quy trình trích xuất tất cả hình ảnh từ tài liệu Word trong Java. Sau khi tải tệp Word nguồn, phương thức getChildNodes() được sử dụng bằng cách cung cấp giá trị NodeType.SHAPE làm đối số trả về tập hợp tất cả các hình dạng trong tài liệu vì lớp Shape có phương thức hasImage() xác minh sự tồn tại của hình ảnh . Khi hình ảnh được phát hiện, phần mở rộng của nó được truy xuất bằng cách sử dụng shape.getImageData().getImageType() và được sử dụng trong tên hình ảnh đầu ra cùng với tùy chọn lọc hình ảnh dựa trên loại của chúng.

Trong hướng dẫn này, chúng ta đã học cách chèn ảnh trong MS Word bằng Java. Nếu muốn tìm hiểu cách tạo tài liệu Word từ đầu, bạn có thể tham khảo bài viết cách tạo tài liệu Word bằng Java.

 Tiếng Việt