استخراج النص من مستند Word في Java

يمكن للمرء استخراج Text من مستند Word في Java بالرجوع إلى هذه المقالة البسيطة. يتضمن الخطوات المطلوبة لإعداد بيئة التطوير، وسير عمل البرنامج خطوة بخطوة، ومثال تشغيل للتعليمات البرمجية تحويل DOCX إلى TXT في Java. يمكن استخدام التطبيق المطور في أي بيئة تدعم Java في Linux أو MS Windows أو macOS.

خطوات تطوير محول Word إلى TXT باستخدام Java

  1. قم بتكوين البيئة عن طريق تثبيت Aspose.Words for Java من مدير المستودع لتحويل ملف DOCX إلى ملف TXT باستخدام Java
  2. افتح مستند Word المصدر عن طريق إنشاء مثيل للفئة Document لتحويل ملف Word إلى TXT
  3. قم بإنشاء كائن فئة TxtSaveOptions لتعيين خصائص ملف TXT الناتج المطلوب
  4. احفظ ملف DOCX الذي تم تحميله كملف TXT على القرص باستخدام طريقة الحفظ

هذه الخطوات الدقيقة في Java تستخرج النص من مستند Word باستخدام واجهة API بسيطة. أولاً، سنقوم بتحميل ملف DOCX المصدر من القرص باستخدام مثيل لفئة المستند، والذي يتبعه بعد ذلك تعيين خيارات تصدير ملف TXT المطلوب للإخراج باستخدام مثيل لفئة TxtSaveOptions. وأخيرًا، يتم حفظ مستند Word المفتوح كملف TXT على القرص باستخدام طريقة الحفظ.

رمز لتحويل DOCX إلى TXT في جافا

للوصول إلى DOCX المصدر من القرص و استخراج النص من مستند Word، تم استخدام واجهة برمجة التطبيقات المستندة إلى Java في مثال التعليمات البرمجية المذكور أعلاه. يمكن للمرء حفظ ملف TXT على القرص دون الاعتماد على مثيل فئة TxtSaveOptions الاختيارية. ومع ذلك، إذا كنت ترغب في تخصيص ملف TXT المطلوب، فيمكنك استخدام طرق ضبط مختلفة تعرضها فئة TxtSaveOptions بما في ذلك setEncoding() وsetForcePageBreaks() وsetMaxCharactersPerLine() وsetParagraphBreak() وsetPrettyFormat() على سبيل المثال لا الحصر.

لقد أرشدتنا هذه المقالة إلى كيفية تطوير محول Word إلى TXT باستخدام Java. إذا كنت مهتمًا بمقارنة مستندات Word، فارجع إلى المقالة الموجودة على مقارنة مستندات Word باستخدام Java.

 عربي