แยกข้อความจากเอกสาร Word ใน C #

คุณสามารถ แยก Text ออกจากเอกสาร Word ในภาษา C# ได้ด้วยบทช่วยสอนสั้นๆ นี้ ประกอบด้วยขั้นตอนสำหรับการตั้งค่าสภาพแวดล้อมการพัฒนา ขั้นตอนการทำงานทีละขั้นตอน และโค้ดตัวอย่างการทำงานปัจจุบันเพื่อ แปลง DOCX เป็น TXT ใน C# แอปพลิเคชันที่พัฒนาขึ้นสามารถรวมเข้ากับแอปพลิเคชันใดๆ ที่รองรับ .NET Framework ใน Linux, MS Windows หรือ macOS

ขั้นตอนในการแยกข้อความจากเอกสาร Word ใน C

  1. สร้างระบบโดยการติดตั้ง Aspose.Words for .NET เพื่อแปลงไฟล์ DOCX เป็นไฟล์ TXT โดยใช้ C#
  2. เข้าถึงเอกสาร Word ต้นฉบับโดยใช้อินสแตนซ์ของคลาส Document
  3. สร้างอินสแตนซ์คลาส TxtSaveOptions และตั้งค่าคุณสมบัติที่จำเป็น
  4. บันทึกไฟล์ Word เป็น TXT บนดิสก์โดยใช้วิธีการบันทึก

ขั้นตอนที่กระชับเหล่านี้ใน C# แยกข้อความจากเอกสาร Word โดยใช้การเรียก API เพียงไม่กี่ครั้ง ขั้นแรก ให้โหลดไฟล์เอกสาร Word ต้นฉบับจากดิสก์ จากนั้นตามด้วยการตั้งค่าตัวเลือกการส่งออกไฟล์ TXT เอาต์พุตโดยใช้อินสแตนซ์คลาส TxtSaveOptions สุดท้าย DOCX ที่โหลดจะถูกบันทึกเป็นไฟล์ TXT บนดิสก์โดยใช้วิธีการบันทึก

รหัสสำหรับแปลง DOCX เป็น TXT ใน C

หากต้องการ แยกข้อความจากเอกสาร Word C# ที่ใช้ API ที่ใช้อย่างมีประสิทธิภาพในข้อมูลโค้ดนี้ คุณสามารถบันทึกเอกสาร Word ไปยัง TXT ได้โดยไม่ต้องใช้อินสแตนซ์คลาส TxtSaveOptions ที่เป็นตัวเลือก อย่างไรก็ตาม หากคุณควรปรับแต่งไฟล์ TXT เอาท์พุตเพิ่มเติม คุณสามารถใช้คุณสมบัติต่างๆ ที่แสดงโดยคลาส TxtSaveOptions รวมถึงการตั้งค่า Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak และ PrettyFormat เป็นต้น

บทความนี้ได้อธิบายข้อมูลในการพัฒนา ตัวแปลง Word เป็น TXT โดยใช้ C# หากคุณต้องการเปรียบเทียบเอกสาร PDF โปรดดูบทความเกี่ยวกับ เปรียบเทียบเอกสาร PDF โดยใช้ C#

 ไทย