این موضوع ساده در مورد نحوه تبدیل HTML به متن در جاوا است. در جاوا HTML به متن ساده برنامه تبدیل تحت سیستم عامل های Windows، Linux یا macOS را می توان با استفاده از رابط های API ساده و آسان توسعه داد.
مراحل تبدیل HTML به متن در جاوا
- پروژه خود را برای اضافه کردن Aspose.HTML for Java از مخزن Maven پیکربندی کنید
- ارجاع به فضای نام Aspose.HTML را در برنامه خود لحاظ کنید
- محتوای فایل HMTL منبع را با استفاده از شی String بخوانید
- برای بارگیری رشته HTML منبع، شیء HTMLDocument class را مقداردهی کنید
- شی کلاس INodeIterator را به گره های تکراری راه اندازی کنید و در StringBuilder اضافه کنید
- متن استخراج شده از HTML را روی دیسک ذخیره کنید
به منظور استخراج متن از برنامه مبتنی بر HTML Java با استفاده از چند خط کد می توان استفاده کرد. ما این فرآیند را با بارگیری HTML منبع در یک شی String و سپس بارگیری آن رشته با استفاده از HTMLDocument class آغاز خواهیم کرد. سپس از INodeIterator برای استخراج، پیمایش و الحاق گره های HMTL به StringBuilder استفاده می کنیم. در نهایت، StringBuilder به عنوان فایل متنی ساده روی دیسک ذخیره می شود.
کد برای تبدیل HTML به متن در جاوا
مثال بالا در جاوا تبدیل HTML به متن ساده در چند تماس API. ما کلاس StyleFilter را ایجاد کردهایم که کلاس NodeFilter را گسترش میدهد و روش AcceptNode را برای تنظیم فیلترهای گره مشتری و حذف گرههای نامطلوب از HTML در طول فرآیند تبدیل پیادهسازی میکند.
در این مبحث، چگونگی استخراج متن از HTML در جاوا را بررسی کرده ایم. اگر علاقه مند به تبدیل فایل MD به فرمت XPS هستید، به مبحث نحوه تبدیل Markdown به XPS با استفاده از جاوا بروید.