วิธีแยกรูปภาพทั้งหมดออกจากเอกสาร Word ด้วย Python

บทช่วยสอนฉบับย่อนี้มีข้อมูลเกี่ยวกับ วิธีแยกรูปภาพทั้งหมดจากเอกสาร Word ใน Python จัดเตรียมทรัพยากรทั้งหมดเพื่อกำหนดค่าสภาพแวดล้อมและแนะนำโครงสร้าง API ที่สำคัญซึ่งจำเป็นสำหรับการทำงานให้สำเร็จ รวมถึงชื่อคลาส เมธอด และคุณสมบัติ คุณสามารถทำตามขั้นตอนและเขียนโปรแกรมที่สมบูรณ์เพื่อ แยกรูปภาพจากเอกสาร Word ในภาษาไพทอน เช่น การแยกรูปภาพจากไฟล์ DOCX และบันทึกเป็นภาพประเภท PNG, JPG เป็นต้น บนดิสก์

ขั้นตอนในการดึงรูปภาพออกจากไฟล์ Word ใน Python

  1. กำหนดค่าสภาพแวดล้อมเพื่อใช้ Aspose.Words สำหรับ Python ผ่าน .NET เพื่อแยกรูปภาพ
  2. โหลดไฟล์ Word ต้นฉบับพร้อมรูปภาพโดยใช้วัตถุคลาส Document
  3. รับรายการรูปร่างทั้งหมดจากเอกสารที่โหลดโดยใช้เมธอด get_child_nodes()
  4. แยกวิเคราะห์องค์ประกอบทั้งหมดในคอลเลกชันรูปร่างและตรวจหารูปภาพ
  5. สร้างชื่อไฟล์ที่ไม่ซ้ำกันสำหรับแต่ละภาพที่ตรวจพบในคอลเลกชันรูปร่าง
  6. บันทึกภาพที่แยกออกมาบนดิสก์ด้วยชื่อเฉพาะ

ขั้นตอนเหล่านี้อธิบายกระบวนการ แยกรูปภาพจากเอกสาร Word ใน Python โดยแชร์การกำหนดค่าสภาพแวดล้อมและขั้นตอนในการเขียนโปรแกรม หลังจากสร้างสภาพแวดล้อมแล้ว ให้โหลดไฟล์ Word พร้อมรูปภาพโดยใช้ออบเจกต์คลาส Document และรับคอลเลกชันของรูปร่างทั้งหมดจากนั้น เนื่องจากคลาส Shape มีเมธอดในการตรวจหารูปภาพ คุณจึงสามารถแยกรูปภาพและบันทึกลงในดิสก์ด้วยชื่อที่ระบุได้

รหัสเพื่อดึงรูปภาพจากเอกสาร Word ใน Python

ที่นี่มีการนำเสนอโค้ดที่สาธิตกระบวนการ แยกรูปภาพจาก Word ใน Python โดยการโหลดไฟล์ต้นฉบับโดยใช้วัตถุคลาส Document ที่มีคุณสมบัติมากมาย เช่น การให้รหัสผ่านสำหรับไฟล์ที่มีการป้องกัน การตั้งค่าการเข้ารหัส และการแนบคำเตือน โทรกลับเพื่อควบคุมกระบวนการโหลด ในทำนองเดียวกัน เมธอด get_child_nodes() ใช้เพื่อแยกรูปร่าง อย่างไรก็ตาม คุณสามารถดึงโหนดอื่นๆ เช่น ส่วนหัว ส่วนท้าย ตาราง ความคิดเห็น เชิงอรรถ และเนื้อหา เป็นต้น

บทความนี้แนะนำเราให้ดึงรูปภาพทั้งหมดจากไฟล์ Word ใน Python หากคุณต้องการเรียนรู้ขั้นตอนการแทรกรูปภาพในไฟล์ Word โปรดดูบทความใน วิธีแทรกรูปภาพใน Word โดยใช้ Python

 ไทย