كيفية تحويل HTML إلى نص في جافا

يدور هذا الموضوع البسيط حول كيفية ** تحويل HTML إلى نص في Java **. في * Java HTML إلى نص عادي * يمكن تطوير تطبيق التحويل الذي يعمل تحت أنظمة Windows أو Linux أو macOS باستخدام واجهات API بسيطة وسهلة.

خطوات تحويل HTML إلى نص في Java

  1. تكوين مشروعك لإضافة Aspose.HTML for Java من مستودع Maven
  2. قم بتضمين المرجع إلى مساحة الاسم Aspose.HTML في تطبيقك
  3. اقرأ محتوى ملف HMTL المصدر باستخدام كائن String
  4. تهيئة الكائن HTMLDocument class لتحميل سلسلة HTML المصدر
  5. تهيئة كائن فئة INodeIterator لتكرار العقد وإلحاقها في StringBuilder
  6. احفظ النص المستخرج من HTML على القرص

من أجل * استخراج نص من تطبيق يعتمد على HTML Java * باستخدام بضعة أسطر من التعليمات البرمجية يمكن استخدامها. سنبدأ العملية عن طريق تحميل مصدر HTML في كائن String ثم تحميل تلك السلسلة لاحقًا باستخدام * HTMLDocument class *. سنستخدم بعد ذلك * INodeIterator * لاستخراج عقد HMTL واجتيازها وإلحاقها بـ StringBuilder. أخيرًا ، سيتم حفظ StringBuilder كملف نص عادي على القرص.

كود لتحويل HTML إلى نص في Java

المثال أعلاه في * Java يحول HTML إلى نص عادي * في عدد قليل من مكالمات API. لقد أنشأنا فئة * StyleFilter * التي تمتد * فئة NodeFilter * ونطبق طريقة * AcceptNode * لتعيين عوامل تصفية عقدة العميل وحذف العقد غير المرغوب فيها من HTML أثناء عملية التحويل.

في هذا الموضوع ، اكتشفنا * كيفية استخراج نص من HTML في Java *. إذا كنت مهتمًا بتحويل ملف MD إلى تنسيق XPS ، فانتقل إلى موضوع كيفية قم بتحويل Markdown إلى XPS باستخدام Java.

 عربي