ดึงข้อความจาก PowerPoint ด้วย Python

คู่มือสั้นนี้อธิบายวิธี ดึงข้อความจาก PowerPoint ด้วย Python. มีรายละเอียดการตั้งค่า IDE รายการขั้นตอน และตัวอย่างโค้ดเพื่อ แปลง PowerPoint เป็นข้อความด้วย Python. จะมีการอธิบายเทคนิคต่าง ๆ เพื่อดึงข้อความจากสไลด์.

ขั้นตอนการดึงข้อความจาก PPTX ด้วย Python

  1. ตั้งค่า IDE ให้ใช้ Aspose.Slides for Python via .NET เพื่อดึงข้อความ
  2. นำเข้าคลาสที่ต้องการจากไลบรารีและคลาสยูทิลิตี้ SlideUtil
  3. กำหนดเส้นทางไฟล์อินพุต/เอาต์พุตและโหลดใบอนุญาต
  4. โหลดงานนำเสนอ PowerPoint ต้นฉบับเข้าสู่วัตถุ Presentation
  5. ใช้ SlideUtil.get_all_text_frames เพื่อดึงกรอบข้อความทั้งหมดจากทุกสไลด์
  6. วิเคราะห์ผ่านกรอบข้อความทั้งหมดและย่อหน้าของมันเพื่อรวบรวมส่วนข้อความแต่ละส่วน
  7. ประมวลผลแต่ละเฟรมและเพิ่มเนื้อหาสไลด์ในบรรทัดใหม่
  8. บันทึกส่วนข้อความที่รวบรวมทั้งหมดและบันทึกผลลัพธ์เป็นไฟล์ TXT

ขั้นตอนเหล่านี้อธิบายกระบวนการพัฒนา PPTX to text converter using Python. โหลดงานนำเสนอ, ดึงเฟรมข้อความทั้งหมดจากมัน, แยกวิเคราะห์แต่ละย่อหน้าในทุกเฟรม, และดึงข้อความจากส่วนต่าง ๆ ของมัน. บันทึกข้อมูลที่รวบรวมทั้งหมดลงในไฟล์ข้อความโดยใช้ตัวคั่นบรรทัดสำหรับแต่ละส่วนข้อความ.

โค้ดสำหรับแปลง PowerPoint เป็นข้อความโดยใช้ Python

โค้ดนี้แสดงวิธี แปลง PPTX เป็น TXT ด้วย Python แทนที่จะสแกนการนำเสนอทั้งหมดในครั้งเดียว คุณสามารถเข้าถึงแต่ละสไลด์แยกกันและประมวลผลเพื่อดึงข้อความจากสไลด์ที่เลือกเท่านั้น อีกทางเลือกหนึ่งคือคุณไม่ต้องโหลดการนำเสนอเข้าสู่หน่วยความจำและใช้เพียงเส้นทางไฟล์เพื่อสกัดข้อความของมันโดยใช้แฟล็กเพื่อดึงข้อความตามลำดับที่จัดเรียงไว้ ไม่ว่าจะเป็นตามต้นฉบับหรือในลำดับแบน.

บทความสั้นนี้แนะนำวิธีการดึงข้อความจากไฟล์ PPTX. หากต้องการแปลงการนำเสนอเป็นวิดีโอ โปรดดูบทความ Convert PowerPoint to video using Python.

 ไทย