Ekstrak Teks Dari Dokumen Word di C#

Anda dapat Mengekstrak Text dari dokumen Word di C# dengan tutorial singkat ini. Ini mencakup langkah-langkah untuk menyiapkan lingkungan pengembangan, alur kerja langkah demi langkah, dan kode contoh kerja saat ini untuk mengonversi DOCX ke TXT di C#. Aplikasi yang dikembangkan dapat diintegrasikan ke dalam aplikasi apa pun yang mendukung kerangka .NET di Linux, MS Windows, atau macOS.

Langkah-langkah Mengekstrak Teks dari Dokumen Word di C#

  1. Bangun sistem dengan menginstal Aspose.Words for .NET untuk mengonversi file DOCX ke file TXT menggunakan C#
  2. Akses dokumen Word sumber menggunakan instance kelas Document
  3. Buat instance instance kelas TxtSaveOptions dan atur properti yang diperlukan
  4. Simpan file Word sebagai TXT pada disk menggunakan metode Simpan

Langkah-langkah singkat dalam C# mengekstrak Teks dari Dokumen Word menggunakan beberapa panggilan API. Pertama, muat file dokumen Word sumber dari disk, yang kemudian diikuti dengan mengatur opsi ekspor file TXT keluaran menggunakan instance kelas TxtSaveOptions. Terakhir, DOCX yang dimuat disimpan sebagai file TXT di disk menggunakan metode Simpan.

Kode untuk Mengonversi DOCX ke TXT di C#

Untuk mengekstrak Teks dari Dokumen Word, API berbasis C# telah efektif digunakan dalam cuplikan kode ini. Anda dapat menyimpan dokumen Word ke TXT tanpa menggunakan instance kelas TxtSaveOptions opsional. Namun, jika Anda ingin menyesuaikan lebih lanjut file TXT keluaran, Anda dapat menggunakan properti berbeda yang diekspos oleh kelas TxtSaveOptions termasuk pengaturan Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak, dan PrettyFormat.

Artikel ini telah menjelaskan informasi untuk mengembangkan Konverter Word ke TXT menggunakan C#. Jika Anda ingin membandingkan dokumen PDF, lihat artikel di Bandingkan Dokumen PDF menggunakan C#.

 Indonesian