ในบทช่วยสอนฉบับย่อนี้ เราจะได้เรียนรู้ วิธีแยกรูปภาพจากไฟล์ Word ใน Java ประกอบด้วยข้อมูลทั้งหมดที่จำเป็นในการสร้างสภาพแวดล้อม รายละเอียดการใช้ API สำหรับการเขียนแอปพลิเคชัน และโค้ดตัวอย่างที่รันได้ซึ่งสาธิตกระบวนการ แยกรูปภาพจากเอกสาร Word ในภาษาจาวา คุณจะได้เรียนรู้ตัวเลือกต่างๆ ในการปรับแต่งกระบวนการขณะโหลดไฟล์ต้นฉบับ DOCX และแยกรูปภาพต่างๆ ออกจากไฟล์ เช่น PNG, JPEG เป็นต้น
ขั้นตอนในการแยกรูปภาพจาก Word ใน Java
- สร้างสภาพแวดล้อมเพื่อเพิ่ม Aspose.Words for Java เพื่อแยกรูปภาพ
- โหลดไฟล์ Word ต้นฉบับพร้อมรูปภาพลงในวัตถุคลาส Document
- รับคอลเลกชันรูปร่างโดยใช้เมธอด getChildNodes() ในคลาส Document
- วนซ้ำรูปร่างทั้งหมดในคอลเลกชัน
- ตรวจสอบว่ารูปร่างมีรูปภาพหรือไม่โดยใช้เมธอด hasImage() ในคลาส Shape
- บันทึกภาพเป็นไฟล์แยกต่างหากบนดิสก์
ขั้นตอนเหล่านี้อธิบายกระบวนการ แยกรูปภาพจากไฟล์ Word ในภาษาจาวา ขั้นแรก ทรัพยากรจะถูกแบ่งปันสำหรับการสร้างสภาพแวดล้อม ตามด้วยการแนะนำคลาส เมธอด และคุณสมบัติที่จำเป็นในการทำงานให้สำเร็จ เช่น คลาส Document ใช้เพื่อโหลดไฟล์ Word ต้นทาง และเมธอด getChildNodes() ใช้เพื่อแยกข้อมูลทั้งหมด ภาพจากมัน สุดท้าย แต่ละองค์ประกอบของคอลเล็กชันจะได้รับการทดสอบว่ามีรูปภาพหรือไม่ และหากพบว่าบันทึกอยู่ในดิสก์เป็นไฟล์รูปภาพแยกต่างหาก
รหัสเพื่อแยกรูปภาพจากเอกสาร Word ใน Java
โค้ดตัวอย่างนี้สาธิตขั้นตอนการ แยกรูปภาพทั้งหมดจากเอกสาร Word ในภาษาจาวา หลังจากโหลดไฟล์ Word ต้นทางแล้ว จะมีการใช้เมธอด getChildNodes() โดยระบุค่า NodeType.SHAPE เป็นอาร์กิวเมนต์ที่ส่งคืนชุดของรูปร่างทั้งหมดในเอกสาร เนื่องจากคลาส Shape มีเมธอด hasImage() ที่ยืนยันการมีอยู่ของรูปภาพ . เมื่อตรวจพบรูปภาพแล้ว ส่วนขยายของรูปภาพจะถูกดึงข้อมูลโดยใช้ shape.getImageData().getImageType() และใช้ในชื่อรูปภาพที่ส่งออกพร้อมกับตัวเลือกในการกรองรูปภาพตามประเภทของรูปภาพ
ในบทช่วยสอนนี้ เราได้เรียนรู้วิธีการแทรกรูปภาพใน MS Word โดยใช้ Java หากต้องการเรียนรู้วิธีสร้างเอกสาร Word ตั้งแต่เริ่มต้น โปรดดูบทความ วิธีสร้างเอกสาร Word โดยใช้ Java