Bài viết này mô tả cách trích xuất hình ảnh từ tài liệu Word trong C#. Nó cung cấp thông tin chi tiết về cấu hình của môi trường cần thiết để kiểm tra mã mẫu, quy trình từng bước và mã mẫu có thể chạy được để đọc tệp DOCX và lưu từng hình ảnh dưới dạng tệp PNG. Nó cũng sẽ cung cấp giải thích về các lớp, phương thức và thuộc tính được yêu cầu để trích xuất tất cả hình ảnh từ tài liệu Word trong C#.
Các bước để trích xuất hình ảnh từ Word trong C#
- Thiết lập môi trường để thêm Aspose.Words for .NET để trích xuất hình ảnh
- Tải tệp Word nguồn có hình ảnh trong đối tượng lớp Document
- Lấy tập hợp các hình từ tài liệu Word bằng phương pháp GetChildNodes()
- Lặp lại qua tất cả các phần tử trong bộ sưu tập hình dạng
- Lưu từng hình dạng có hình ảnh dưới dạng hình ảnh riêng biệt
Các bước này cung cấp chi tiết để trích xuất ảnh từ tài liệu Word trong C#. Đầu tiên, tệp Word nguồn được tải vào đối tượng lớp Tài liệu, sau đó bộ sưu tập hình dạng được truy cập từ nó bằng cách sử dụng phương thức GetChildNodes() lấy bộ liệt kê NodeType.Shape làm đối số. Trong bước tiếp theo, bộ sưu tập này được lặp lại và mỗi hình dạng được kiểm tra xem có hình ảnh hay không và nếu tìm thấy sẽ được lưu dưới dạng tệp hình ảnh riêng biệt.
Mã để trích xuất hình ảnh từ tệp Word trong C#
Đoạn mã này trình bày quá trình trích xuất hình ảnh từ tài liệu Word trong C# sử dụng đối tượng lớp Tài liệu có các hàm quá tải khác nhau hỗ trợ nhiều tính năng như cài đặt mã hóa, cài đặt phông chữ, tùy chọn ngôn ngữ, v.v. Tương tự, bạn có thể tìm nạp các loại nút con khác bằng cách sử dụng phương thức GetChildNodes() như phần, đầu trang/chân trang, bảng, hàng, ô và đoạn văn để đặt tên cho một số ít.
Bài viết này giải thích cách trích xuất hình ảnh từ tệp Word. Nếu bạn muốn tìm hiểu quy trình thêm hình ảnh, hãy tham khảo bài viết trên cách thêm hình ảnh vào tài liệu Word bằng C#.