Cara sederhana ini menunjukkan cara mengonversi HTML menjadi teks dalam C#. Dalam C# HTML ke teks biasa konversi dapat dengan mudah dicapai dengan menggunakan beberapa baris kode untuk aplikasi berbasis .NET yang berjalan di platform Windows, macOS atau Linux.
Langkah-langkah untuk Mengkonversi HTML ke Teks di C#
- Instal Aspose.HTML for .NET dari manajer paket NuGet
- Sertakan Aspose.HTML namespace dalam proyek Anda
- Muat konten file HTML ke String
- Buat instance kelas HTMLDocument untuk memuat String yang berisi HTML
- Buat instance kelas INodeIterator untuk beralih melalui node dan menambahkan di StringBuilder
- Terakhir, simpan teks yang dikonversi dari HTML ke disk
Untuk mendapatkan teks biasa dari HTML C# beberapa baris kode dapat digunakan secara efektif dalam aplikasi berbasis .NET. Proses dimulai dengan memuat file HTML sebagai String ke dalam instance HTMLDocument class dengan menggunakan metode File.ReadAllText. Kemudian INodeIterator akan digunakan untuk mengekstrak node dari HTML dan menambahkannya ke StringBuilder. Akhirnya, HTML yang diekstraksi di StringBuilder akan disimpan di disk.
Kode untuk Mengonversi HTML ke Teks di C#
Kode di atas dalam C# mengonversi HTML menjadi teks biasa menggunakan beberapa panggilan API. Kami telah menggunakan StyleFilter class yang disesuaikan yang mewarisi NodeFilter class untuk mengganti metode AcceptNode, yang menyaring node yang tidak diinginkan dari HTML selama proses konversi.
Pada topik sebelumnya, kita telah mempelajari cara membuat file HTML di C#. Padahal, contoh di atas dalam C# mendapatkan teks biasa dari file HTML secara terprogram.