วิธีอ่านไฟล์ DOCX ใน Python

บทแนะนำฉบับย่อนี้จะแนะนำคุณเกี่ยวกับ วิธีอ่านไฟล์ DOCX ใน Python ประกอบด้วยข้อมูลทั้งหมดที่จำเป็นในการกำหนดค่าสภาพแวดล้อม ขั้นตอนที่ต้องปฏิบัติตามขณะเขียนโค้ด และโค้ด Python ตัวอย่างที่รันได้ คุณยังสามารถ อ่านไฟล์ DOC ใน Python รวมถึงไฟล์อื่นๆ ที่รองรับ MS Word ได้โดยใช้คำแนะนำเดียวกัน

ขั้นตอนในการอ่านไฟล์ DOCX ใน Python

  1. ตั้งค่าสภาพแวดล้อมการพัฒนาให้ใช้ Aspose.Words สำหรับ Python ผ่าน .NET สำหรับอ่านไฟล์ DOCX
  2. นำเข้า aspose.words เนมสเปซและตั้งนามแฝงให้
  3. โหลดไฟล์ DOCX อินพุตลงในวัตถุคลาสเอกสารที่จะอ่านโดยใช้ Python
  4. ดำเนินการวนซ้ำเพื่อดึงโหนดย่อหน้าทั้งหมดจาก DOCX ที่โหลด
  5. ส่งแต่ละโหนดไปยังย่อหน้า
  6. แยกเนื้อหาจากแต่ละย่อหน้าและแปลงเป็นสตริงเพื่อแสดง

ขั้นตอนเหล่านี้ตอบคำถามที่ว่า Python อ่านเอกสาร Word ได้อย่างไร โดยแชร์การกำหนดค่าและรายละเอียดที่จำเป็นอื่นๆ โดยจะแนะนำการนำเข้าเนมสเปซที่จำเป็น วิธีการโหลดไฟล์ DOCX การวนซ้ำผ่านโหนดทั้งหมดของประเภทเฉพาะ เช่น ย่อหน้า ในโค้ดตัวอย่างนี้ จากนั้นจึงแปลงเนื้อหาแต่ละย่อหน้าเป็นสตริงสำหรับแสดงบนคอนโซล

รหัสสำหรับอ่านไฟล์ Word ใน Python

โค้ดนี้ในไฟล์ Python อ่าน Word โดยการโหลดแล้วทำซ้ำผ่านเนื้อหาทั้งหมด คุณยังสามารถอ่านข้อความที่เลือกระหว่างย่อหน้า และเข้าถึงโหนดประเภทต่างๆ เช่น ส่วน เนื้อหา ตาราง รูปร่าง ความคิดเห็น และส่วนหัว ส่วนท้าย เพื่อแสดงรายการบางส่วน คุณยังสามารถรับข้อมูลระดับเอกสาร เช่น คุณสมบัติในตัวได้โดยการวนซ้ำผ่านคอลเล็กชัน Document.build_in_document_properties และใช้คุณสมบัติ ชื่อ และ ค่า ของแต่ละรายการเพื่อรับข้อมูลที่จำเป็น

บทความนี้ได้สาธิตการอ่านไฟล์ Word ใน Python หากคุณสนใจที่จะสร้างไฟล์ Word โปรดดูบทความเกี่ยวกับ วิธีสร้างเอกสาร Word โดยใช้ Python

 ไทย