Cara Mengekstrak Semua Gambar dari Dokumen Word dengan Python

Tutorial singkat ini berisi informasi tentang cara mengekstrak semua gambar dari dokumen Word dengan Python. Ini menyediakan semua sumber daya untuk mengonfigurasi lingkungan dan memperkenalkan konstruksi API penting yang diperlukan untuk menyelesaikan tugas termasuk nama kelas, metode, dan properti. Anda dapat mengikuti langkah-langkah dan menulis program lengkap untuk mengekstrak gambar dari dokumen Word dengan python seperti mengekstrak gambar dari file DOCX dan menyimpannya sebagai jenis gambar PNG, JPG, dll. pada disk.

Langkah-langkah untuk Mengekstrak Gambar dari File Word dengan Python

  1. Konfigurasikan lingkungan untuk menggunakan Aspose.Words untuk Python melalui .NET untuk mengekstrak gambar
  2. Muat file Word sumber dengan gambar menggunakan objek kelas Document
  3. Dapatkan daftar semua bentuk dari dokumen yang dimuat menggunakan metode get_child_nodes()
  4. Mengurai semua elemen dalam koleksi bentuk dan mendeteksi gambar
  5. Buat nama file unik untuk setiap gambar yang terdeteksi dalam koleksi bentuk
  6. Simpan gambar yang diekstraksi pada disk dengan nama unik

Langkah-langkah ini menjelaskan proses untuk mengekstrak gambar dari dokumen Word dengan Python dengan membagikan konfigurasi lingkungan dan langkah-langkah untuk menulis program. Setelah membangun lingkungan, muat file Word dengan gambar menggunakan objek kelas Dokumen dan dapatkan koleksi semua bentuk darinya. Karena kelas Shape memiliki metode untuk mendeteksi gambar, Anda dapat mengekstrak gambar dan menyimpannya di disk dengan nama yang ditentukan.

Kode untuk Mengekstrak Foto dari Dokumen Word dengan Python

Di sini disajikan kode yang mendemonstrasikan proses mengekstrak gambar dari Word dengan Python dengan memuat file sumber menggunakan objek kelas Dokumen yang memiliki banyak fitur seperti memberikan kata sandi untuk file yang dilindungi, mengatur pengkodean, dan melampirkan peringatan callback untuk mengontrol proses pemuatan. Demikian pula, metode get_child_nodes() digunakan untuk mengekstrak bentuk, namun Anda juga dapat mengambil node lain seperti header, footer, tabel, komentar, catatan kaki, dan isi, dll.

Artikel ini telah memandu kami untuk mengambil semua foto dari file Word dengan Python. Jika Anda ingin mempelajari proses menyisipkan foto ke dalam file Word, lihat artikel di cara menyisipkan gambar di Word menggunakan Python.

 Indonesian