如何在 Java 中从 Word 文件中提取图像

在这个快速教程中,我们将学习如何在 Java 中从 Word 文件中提取图像。它包含建立环境所需的所有信息、编写应用程序的 API 使用细节以及一个可运行的示例代码,该代码演示了从 Java 中的 Word 文档中提取图片的过程。您还将学习在加载源 DOCX 文件并从中提取不同图像(如 PNG、JPEG 等)时自定义过程的不同选项。

Java中从Word中提取图像的步骤

  1. 建立环境添加 Aspose.Words for Java 用于提取图像
  2. 将带有图像的源 Word 文件加载到 Document 类对象中
  3. 使用 Document 类中的 getChildNodes() 方法获取形状集合
  4. 遍历集合中的所有形状
  5. 使用 Shape 类中的 hasImage() 方法检查形状是否有图像
  6. 将图像另存为磁盘上的单独文件

这些步骤解释了从 Java 中的 Word 文件中提取图像的过程。首先,资源共享用于环境的建立,然后介绍完成任务所需的类、方法和属性,如 Document 类用于加载源 Word 文件,getChildNodes() 方法用于提取所有来自它的图像。最后,测试集合的每个元素是否具有图像,如果发现则作为单独的图像文件保存在磁盘上。

用Java从Word文档中提取图像的代码

此示例代码演示了从 Java 中的 Word 文档中提取所有图像的过程。加载源 Word 文件后,通过提供 NodeType.SHAPE 值作为参数使用 getChildNodes() 方法,该参数返回文档中所有形状的集合,因为 Shape 类具有验证图像存在的方法 hasImage() .检测到图像后,将使用 shape.getImageData().getImageType() 检索其扩展名,并将其用于输出图像名称以及根据图像类型过滤图像的选项。

在本教程中,我们学习了如何使用 Java 在 MS Word 中插入图片。如果您想学习如何从头开始创建 Word 文档,可以参考文章 如何使用 Java 创建 Word 文档

 简体中文