Topik sederhana ini adalah tentang cara mengonversi HTML menjadi teks di Java. Dalam aplikasi konversi Java HTML ke teks biasa yang berjalan di bawah platform Windows, Linux, atau macOS dapat dikembangkan menggunakan antarmuka API yang sederhana dan mudah.
Langkah-langkah untuk Mengkonversi HTML ke Teks di Java
- Konfigurasikan proyek Anda untuk menambahkan Aspose.HTML for Java dari repositori Maven
- Sertakan referensi ke Aspose.HTML namespace di aplikasi Anda
- Baca konten file HMTL sumber menggunakan objek String
- Inisialisasi objek HTMLDocument class untuk memuat String HTML sumber
- Inisialisasi objek kelas INodeIterator untuk mengulang node dan menambahkan di StringBuilder
- Simpan teks yang diekstrak dari HTML pada disk
Untuk mengekstrak teks dari aplikasi berbasis Java HTML menggunakan beberapa baris kode dapat digunakan. Kami akan memulai proses dengan memuat HTML sumber ke dalam objek String dan selanjutnya memuat String tersebut menggunakan kelas HTMLDocument. Kami kemudian akan menggunakan INodeIterator untuk mengekstrak, melintasi dan menambahkan node HMTL ke StringBuilder. Akhirnya, StringBuilder akan disimpan sebagai file teks biasa pada disk.
Kode untuk Mengonversi HTML ke Teks di Java
Contoh di atas dalam Java mengonversi HTML ke teks biasa dalam beberapa panggilan API. Kami telah membuat StyleFilter class yang memperluas NodeFilter class dan menerapkan metode AcceptNode untuk mengatur filter node pelanggan dan menghilangkan node yang tidak diinginkan dari HTML selama proses konversi.
Dalam topik ini, kita telah menjelajahi cara mengekstrak teks dari HTML di Java. Jika Anda tertarik untuk mengkonversi file MD ke format XPS, lanjutkan ke topik cara konversi Penurunan harga ke XPS menggunakan Java.