Dalam tutorial singkat ini, kita akan belajar cara membaca dokumen Word di C# dengan bantuan detail tentang konfigurasi lingkungan, daftar langkah, dan kode yang dapat dijalankan. Kode akan menunjukkan pembacaan file Word dengan cara yang berbeda. Anda akan mempelajari bagaimana C# membaca dokumen Word dengan memuat file Word seperti DOCX, DOC, RTF, atau HTML, dll, dan kemudian mengakses elemen yang berbeda untuk diproses atau dilihat.
Langkah-langkah Membaca Data Dari Dokumen Word di C#
- Konfigurasikan lingkungan proyek untuk menggunakan Aspose.Words dari manajer paket NuGet
- Muat file DOCX input ke dalam objek kelas Document
- Dapatkan semua node tipe Paragraph dari dokumen
- Ubah setiap paragraf menjadi string dan tampilkan di konsol
- Dapatkan semua node tipe Run dari dokumen
- Ubah setiap item Jalankan menjadi string dan tampilkan bersama dengan nama dan ukuran font
Langkah-langkah ini memberikan informasi terperinci yang diperlukan untuk mengonfigurasi lingkungan dan tugas yang harus dilakukan saat menulis program pembaca file Word. Ini menunjukkan bagaimana C# membaca file DOCX dengan memuat file sumber ke dalam instance kelas Dokumen dan kemudian mengakses semua paragrafnya untuk menampilkan teks. Ini juga menjelaskan pembacaan data dari paragraf, tabel, dll. sehingga setiap segmen teks dengan gaya yang berbeda dipisahkan atau setiap nilai sel tabel diakses secara terpisah untuk diproses.
Kode untuk Membaca File Word di C#
Kode ini mendemonstrasikan cara membaca file Word dalam C# dengan menggunakan fungsi Document.GetChildNodes() yang membutuhkan tipe node yang akan diambil seperti Paragraph, Run, Section, Body, HeaderFooter, Comment, dll. Setelah node anak diakses , Anda harus mentransmisikannya ke masing-masing tipe untuk menggunakan metode dan propertinya. Misalnya, kami telah membaca dokumen dua kali sehingga pertama semua teks dari seluruh dokumen ditampilkan terlepas dari paragraf normal atau tabel, dll, dan kedua kalinya dibaca berdasarkan perubahan gaya dan tipe konten.
Artikel ini telah mengajarkan kita untuk membaca file Word namun jika Anda ingin mempelajari konversi dokumen Word ke HTML, lihat artikel di cara mengubah dokumen Word ke HTML menggunakan C#.