Tutorial singkat ini menyajikan informasi tentang cara membaca dokumen Word di Java dengan menyediakan prosedur langkah-demi-langkah yang mendetail dan kode Java yang dapat dijalankan yang membaca dokumen contoh dengan cara yang berbeda. Ini memperkenalkan kelas yang diperlukan yang digunakan untuk membaca file Word dan mengakses segmen yang berbeda. Saat membaca dokumen Word dalam kode Java seperti DOCX, DOC, atau file lain yang didukung MS Word, Anda akan beralih melalui node anak yang berbeda dari dokumen dan memproses masing-masing sesuai kebutuhan Anda.
Langkah-langkah Membaca File Word di Java
- Instal Aspose.Words for Java menggunakan repositori Maven untuk membaca file DOCX
- Muat file DOCX sumber ke dalam objek kelas Document untuk dibaca di Java
- Ulangi semua node tipe Paragraph dalam dokumen
- Ubah setiap teks paragraf menjadi string dan tampilkan di konsol
- Iterasi melalui semua node tipe Run dalam dokumen
- Ubah setiap node menjadi tipe Run dan akses nama font, ukuran, dan teks Run
- Tampilkan setiap teks yang dijalankan di konsol
Langkah-langkah ini menjelaskan cara membaca file Word di Java dengan membagikan tautan ke halaman konfigurasi dan kemudian memandu untuk memuat dokumen Word sumber. Setelah file Word dimuat, model objek dokumennya (DOM) yaitu struktur logis juga dimuat dan dapat diuraikan dengan cara yang berbeda. Langkah-langkah ini membantu dalam mempersiapkan dua koleksi utama yaitu Paragraphs dan Runs untuk mengakses bagian-bagian berbeda dari dokumen Word yang dimuat.
Kode untuk Membaca File DOCX di Java
Kode Java untuk membaca dokumen Word ini menunjukkan penguraian DOM dengan menggunakan filter yang berbeda misalnya di tempat pertama kita mengambil semua simpul paragraf. Kelas Paragraph menyediakan fungsi toString() yang mengekstrak teks dari seluruh paragraf termasuk Tabel dll. dan menyimpannya ke variabel string. Demikian pula, ketika kami mengurai dokumen untuk mengambil semua Proses, itu memisahkan konten berdasarkan gaya, font, jenis simpul, dll. Dan membagi satu paragraf menjadi beberapa segmen berdasarkan gaya font teks seperti teks tebal akan disediakan secara terpisah, miring teks secara terpisah dan sebagainya.
Tutorial ini telah memandu kami untuk membaca file DOCX. Namun, jika Anda ingin semacam konversi seperti Word ke PDF, lihat artikel di cara mengonversi Word ke PDF di Java.