在这个快速教程中,我们将学习如何在 Java 中从 Word 文件中提取图像。它包含建立环境所需的所有信息、编写应用程序的 API 使用细节以及一个可运行的示例代码,该代码演示了从 Java 中的 Word 文档中提取图片的过程。您还将学习在加载源 DOCX 文件并从中提取不同图像(如 PNG、JPEG 等)时自定义过程的不同选项。
Java中从Word中提取图像的步骤
- 建立环境添加 Aspose.Words for Java 用于提取图像
- 将带有图像的源 Word 文件加载到 Document 类对象中
- 使用 Document 类中的 getChildNodes() 方法获取形状集合
- 遍历集合中的所有形状
- 使用 Shape 类中的 hasImage() 方法检查形状是否有图像
- 将图像另存为磁盘上的单独文件
这些步骤解释了从 Java 中的 Word 文件中提取图像的过程。首先,资源共享用于环境的建立,然后介绍完成任务所需的类、方法和属性,如 Document 类用于加载源 Word 文件,getChildNodes() 方法用于提取所有来自它的图像。最后,测试集合的每个元素是否具有图像,如果发现则作为单独的图像文件保存在磁盘上。
用Java从Word文档中提取图像的代码
此示例代码演示了从 Java 中的 Word 文档中提取所有图像的过程。加载源 Word 文件后,通过提供 NodeType.SHAPE 值作为参数使用 getChildNodes() 方法,该参数返回文档中所有形状的集合,因为 Shape 类具有验证图像存在的方法 hasImage() .检测到图像后,将使用 shape.getImageData().getImageType() 检索其扩展名,并将其用于输出图像名称以及根据图像类型过滤图像的选项。
在本教程中,我们学习了如何使用 Java 在 MS Word 中插入图片。如果您想学习如何从头开始创建 Word 文档,可以参考文章 如何使用 Java 创建 Word 文档。