يدور هذا الموضوع البسيط حول كيفية ** تحويل HTML إلى نص في Java **. في * Java HTML إلى نص عادي * يمكن تطوير تطبيق التحويل الذي يعمل تحت أنظمة Windows أو Linux أو macOS باستخدام واجهات API بسيطة وسهلة.
خطوات تحويل HTML إلى نص في Java
- تكوين مشروعك لإضافة Aspose.HTML for Java من مستودع Maven
- قم بتضمين المرجع إلى مساحة الاسم Aspose.HTML في تطبيقك
- اقرأ محتوى ملف HMTL المصدر باستخدام كائن String
- تهيئة الكائن HTMLDocument class لتحميل سلسلة HTML المصدر
- تهيئة كائن فئة INodeIterator لتكرار العقد وإلحاقها في StringBuilder
- احفظ النص المستخرج من HTML على القرص
من أجل * استخراج نص من تطبيق يعتمد على HTML Java * باستخدام بضعة أسطر من التعليمات البرمجية يمكن استخدامها. سنبدأ العملية عن طريق تحميل مصدر HTML في كائن String ثم تحميل تلك السلسلة لاحقًا باستخدام * HTMLDocument class *. سنستخدم بعد ذلك * INodeIterator * لاستخراج عقد HMTL واجتيازها وإلحاقها بـ StringBuilder. أخيرًا ، سيتم حفظ StringBuilder كملف نص عادي على القرص.
كود لتحويل HTML إلى نص في Java
المثال أعلاه في * Java يحول HTML إلى نص عادي * في عدد قليل من مكالمات API. لقد أنشأنا فئة * StyleFilter * التي تمتد * فئة NodeFilter * ونطبق طريقة * AcceptNode * لتعيين عوامل تصفية عقدة العميل وحذف العقد غير المرغوب فيها من HTML أثناء عملية التحويل.
في هذا الموضوع ، اكتشفنا * كيفية استخراج نص من HTML في Java *. إذا كنت مهتمًا بتحويل ملف MD إلى تنسيق XPS ، فانتقل إلى موضوع كيفية قم بتحويل Markdown إلى XPS باستخدام Java.