บทแนะนำฉบับย่อนี้จะแนะนำคุณเกี่ยวกับ วิธีอ่านไฟล์ DOCX ใน Python ประกอบด้วยข้อมูลทั้งหมดที่จำเป็นในการกำหนดค่าสภาพแวดล้อม ขั้นตอนที่ต้องปฏิบัติตามขณะเขียนโค้ด และโค้ด Python ตัวอย่างที่รันได้ คุณยังสามารถ อ่านไฟล์ DOC ใน Python รวมถึงไฟล์อื่นๆ ที่รองรับ MS Word ได้โดยใช้คำแนะนำเดียวกัน
ขั้นตอนในการอ่านไฟล์ DOCX ใน Python
- ตั้งค่าสภาพแวดล้อมการพัฒนาให้ใช้ Aspose.Words สำหรับ Python ผ่าน .NET สำหรับอ่านไฟล์ DOCX
- นำเข้า aspose.words เนมสเปซและตั้งนามแฝงให้
- โหลดไฟล์ DOCX อินพุตลงในวัตถุคลาสเอกสารที่จะอ่านโดยใช้ Python
- ดำเนินการวนซ้ำเพื่อดึงโหนดย่อหน้าทั้งหมดจาก DOCX ที่โหลด
- ส่งแต่ละโหนดไปยังย่อหน้า
- แยกเนื้อหาจากแต่ละย่อหน้าและแปลงเป็นสตริงเพื่อแสดง
ขั้นตอนเหล่านี้ตอบคำถามที่ว่า Python อ่านเอกสาร Word ได้อย่างไร โดยแชร์การกำหนดค่าและรายละเอียดที่จำเป็นอื่นๆ โดยจะแนะนำการนำเข้าเนมสเปซที่จำเป็น วิธีการโหลดไฟล์ DOCX การวนซ้ำผ่านโหนดทั้งหมดของประเภทเฉพาะ เช่น ย่อหน้า ในโค้ดตัวอย่างนี้ จากนั้นจึงแปลงเนื้อหาแต่ละย่อหน้าเป็นสตริงสำหรับแสดงบนคอนโซล
รหัสสำหรับอ่านไฟล์ Word ใน Python
โค้ดนี้ในไฟล์ Python อ่าน Word โดยการโหลดแล้วทำซ้ำผ่านเนื้อหาทั้งหมด คุณยังสามารถอ่านข้อความที่เลือกระหว่างย่อหน้า และเข้าถึงโหนดประเภทต่างๆ เช่น ส่วน เนื้อหา ตาราง รูปร่าง ความคิดเห็น และส่วนหัว ส่วนท้าย เพื่อแสดงรายการบางส่วน คุณยังสามารถรับข้อมูลระดับเอกสาร เช่น คุณสมบัติในตัวได้โดยการวนซ้ำผ่านคอลเล็กชัน Document.build_in_document_properties และใช้คุณสมบัติ ชื่อ และ ค่า ของแต่ละรายการเพื่อรับข้อมูลที่จำเป็น
บทความนี้ได้สาธิตการอ่านไฟล์ Word ใน Python หากคุณสนใจที่จะสร้างไฟล์ Word โปรดดูบทความเกี่ยวกับ วิธีสร้างเอกสาร Word โดยใช้ Python