استخراج النص من مستند Word في C#

يمكنك استخراج Text من مستند Word في لغة C# باستخدام هذا البرنامج التعليمي الموجز. وهو يشتمل على خطوات لإعداد بيئة التطوير، وسير العمل خطوة بخطوة، ونموذج كود العمل الحالي لـ تحويل DOCX إلى TXT في C#. يمكن دمج التطبيق المطور في أي تطبيق يدعم إطار عمل .NET في Linux أو MS Windows أو macOS.

خطوات استخراج النص من مستند Word في C#

  1. قم بتأسيس النظام عن طريق تثبيت Aspose.Words for .NET لتحويل ملف DOCX إلى ملف TXT باستخدام C#
  2. قم بالوصول إلى مستند Word المصدر باستخدام مثيل للفئة Document.
  3. قم بإنشاء مثيل للفئة TxtSaveOptions وقم بتعيين الخصائص المطلوبة
  4. احفظ ملف Word بتنسيق TXT على القرص باستخدام طريقة الحفظ

هذه الخطوات الموجزة في C# تستخرج النص من مستند Word باستخدام عدد قليل من استدعاءات واجهة برمجة التطبيقات (API). أولاً، قم بتحميل ملف مستند Word المصدر من القرص، والذي يتبعه بعد ذلك تعيين خيارات تصدير ملف TXT الناتج باستخدام مثيل فئة TxtSaveOptions. وأخيرًا، يتم حفظ ملف DOCX المحمل كملف TXT على القرص باستخدام طريقة الحفظ.

رمز لتحويل DOCX إلى TXT في C#

لاستخراج النص من مستند Word، تم استخدام واجهة برمجة التطبيقات المستندة إلى C#* بشكل فعال في مقتطف التعليمات البرمجية هذا. يمكنك حفظ مستند Word في TXT دون استخدام مثيل فئة TxtSaveOptions الاختيارية. ومع ذلك، إذا كان عليك تخصيص ملف TXT الناتج بشكل أكبر، فيمكنك استخدام خصائص مختلفة تعرضها فئة TxtSaveOptions بما في ذلك إعداد Encoding وForcePageBreaks وMaxCharactersPerLine وParagraphBreak وPrettyFormat على سبيل المثال لا الحصر.

لقد أوضحت هذه المقالة المعلومات اللازمة لتطوير محول Word إلى TXT باستخدام لغة C#. إذا كنت تريد مقارنة مستندات PDF، فارجع إلى المقالة الموجودة على مقارنة مستندات PDF باستخدام C#.

 عربي