نحوه تبدیل HTML به متن در جاوا

این موضوع ساده در مورد نحوه تبدیل HTML به متن در جاوا است. در جاوا HTML به متن ساده برنامه تبدیل تحت سیستم عامل های Windows، Linux یا macOS را می توان با استفاده از رابط های API ساده و آسان توسعه داد.

مراحل تبدیل HTML به متن در جاوا

  1. پروژه خود را برای اضافه کردن Aspose.HTML for Java از مخزن Maven پیکربندی کنید
  2. ارجاع به فضای نام Aspose.HTML را در برنامه خود لحاظ کنید
  3. محتوای فایل HMTL منبع را با استفاده از شی String بخوانید
  4. برای بارگیری رشته HTML منبع، شیء HTMLDocument class را مقداردهی کنید
  5. شی کلاس INodeIterator را به گره های تکراری راه اندازی کنید و در StringBuilder اضافه کنید
  6. متن استخراج شده از HTML را روی دیسک ذخیره کنید

به منظور استخراج متن از برنامه مبتنی بر HTML Java با استفاده از چند خط کد می توان استفاده کرد. ما این فرآیند را با بارگیری HTML منبع در یک شی String و سپس بارگیری آن رشته با استفاده از HTMLDocument class آغاز خواهیم کرد. سپس از INodeIterator برای استخراج، پیمایش و الحاق گره های HMTL به StringBuilder استفاده می کنیم. در نهایت، StringBuilder به عنوان فایل متنی ساده روی دیسک ذخیره می شود.

کد برای تبدیل HTML به متن در جاوا

مثال بالا در جاوا تبدیل HTML به متن ساده در چند تماس API. ما کلاس StyleFilter را ایجاد کرده‌ایم که کلاس NodeFilter را گسترش می‌دهد و روش AcceptNode را برای تنظیم فیلترهای گره مشتری و حذف گره‌های نامطلوب از HTML در طول فرآیند تبدیل پیاده‌سازی می‌کند.

در این مبحث، چگونگی استخراج متن از HTML در جاوا را بررسی کرده ایم. اگر علاقه مند به تبدیل فایل MD به فرمت XPS هستید، به مبحث نحوه تبدیل Markdown به XPS با استفاده از جاوا بروید.

 فارسی