วิธีดึงรูปภาพออกจากไฟล์ Word ใน Java

ในบทช่วยสอนฉบับย่อนี้ เราจะได้เรียนรู้ วิธีแยกรูปภาพจากไฟล์ Word ใน Java ประกอบด้วยข้อมูลทั้งหมดที่จำเป็นในการสร้างสภาพแวดล้อม รายละเอียดการใช้ API สำหรับการเขียนแอปพลิเคชัน และโค้ดตัวอย่างที่รันได้ซึ่งสาธิตกระบวนการ แยกรูปภาพจากเอกสาร Word ในภาษาจาวา คุณจะได้เรียนรู้ตัวเลือกต่างๆ ในการปรับแต่งกระบวนการขณะโหลดไฟล์ต้นฉบับ DOCX และแยกรูปภาพต่างๆ ออกจากไฟล์ เช่น PNG, JPEG เป็นต้น

ขั้นตอนในการแยกรูปภาพจาก Word ใน Java

  1. สร้างสภาพแวดล้อมเพื่อเพิ่ม Aspose.Words for Java เพื่อแยกรูปภาพ
  2. โหลดไฟล์ Word ต้นฉบับพร้อมรูปภาพลงในวัตถุคลาส Document
  3. รับคอลเลกชันรูปร่างโดยใช้เมธอด getChildNodes() ในคลาส Document
  4. วนซ้ำรูปร่างทั้งหมดในคอลเลกชัน
  5. ตรวจสอบว่ารูปร่างมีรูปภาพหรือไม่โดยใช้เมธอด hasImage() ในคลาส Shape
  6. บันทึกภาพเป็นไฟล์แยกต่างหากบนดิสก์

ขั้นตอนเหล่านี้อธิบายกระบวนการ แยกรูปภาพจากไฟล์ Word ในภาษาจาวา ขั้นแรก ทรัพยากรจะถูกแบ่งปันสำหรับการสร้างสภาพแวดล้อม ตามด้วยการแนะนำคลาส เมธอด และคุณสมบัติที่จำเป็นในการทำงานให้สำเร็จ เช่น คลาส Document ใช้เพื่อโหลดไฟล์ Word ต้นทาง และเมธอด getChildNodes() ใช้เพื่อแยกข้อมูลทั้งหมด ภาพจากมัน สุดท้าย แต่ละองค์ประกอบของคอลเล็กชันจะได้รับการทดสอบว่ามีรูปภาพหรือไม่ และหากพบว่าบันทึกอยู่ในดิสก์เป็นไฟล์รูปภาพแยกต่างหาก

รหัสเพื่อแยกรูปภาพจากเอกสาร Word ใน Java

โค้ดตัวอย่างนี้สาธิตขั้นตอนการ แยกรูปภาพทั้งหมดจากเอกสาร Word ในภาษาจาวา หลังจากโหลดไฟล์ Word ต้นทางแล้ว จะมีการใช้เมธอด getChildNodes() โดยระบุค่า NodeType.SHAPE เป็นอาร์กิวเมนต์ที่ส่งคืนชุดของรูปร่างทั้งหมดในเอกสาร เนื่องจากคลาส Shape มีเมธอด hasImage() ที่ยืนยันการมีอยู่ของรูปภาพ . เมื่อตรวจพบรูปภาพแล้ว ส่วนขยายของรูปภาพจะถูกดึงข้อมูลโดยใช้ shape.getImageData().getImageType() และใช้ในชื่อรูปภาพที่ส่งออกพร้อมกับตัวเลือกในการกรองรูปภาพตามประเภทของรูปภาพ

ในบทช่วยสอนนี้ เราได้เรียนรู้วิธีการแทรกรูปภาพใน MS Word โดยใช้ Java หากต้องการเรียนรู้วิธีสร้างเอกสาร Word ตั้งแต่เริ่มต้น โปรดดูบทความ วิธีสร้างเอกสาร Word โดยใช้ Java

 ไทย