Panduan singkat ini menjelaskan cara mengekstrak teks dari PowerPoint menggunakan Python. Panduan ini berisi detail untuk menyiapkan IDE, daftar langkah, dan contoh kode untuk mengonversi PowerPoint menjadi teks menggunakan Python. Berbagai teknik akan dibahas untuk mengambil teks dari slide.
Langkah-langkah untuk Mengekstrak Teks dari PPTX menggunakan Python
- Atur IDE untuk menggunakan Aspose.Slides for Python via .NET untuk mengekstrak teks
- Impor kelas yang diinginkan dari perpustakaan dan kelas utilitas SlideUtil
- Tentukan jalur file input/output dan muat lisensi
- Muat presentasi PowerPoint sumber ke dalam objek Presentation
- Gunakan SlideUtil.get_all_text_frames untuk mengekstrak semua bingkai teks dari setiap slide
- Mengurai semua bingkai teks dan paragrafnya untuk mengumpulkan bagian teks individu
- Proses setiap frame dan tambahkan konten slide pada baris baru
- Simpan semua bagian teks yang dikumpulkan dan simpan output ke file TXT
Langkah-langkah ini menjelaskan proses mengembangkan konverter PPTX ke teks menggunakan Python. Muat presentasi, dapatkan semua bingkai teks darinya, parse setiap paragraf di semua bingkai, dan ambil teks dari bagian-bagiannya. Simpan semua data yang dikumpulkan dalam file teks dengan pemisah baris untuk setiap segmen teks.
Kode untuk Konverter PowerPoint ke Teks menggunakan Python
Kode ini menunjukkan cara mengonversi PPTX ke TXT menggunakan Python. Alih-alih memindai seluruh presentasi sekaligus, Anda dapat mengakses setiap slide secara terpisah dan memprosesnya untuk mengambil teks hanya dari slide yang dipilih. Pilihan lain adalah Anda tidak memuat presentasi ke memori dan cukup menggunakan jalur file untuk mengekstrak teksnya dengan flag untuk menarik teks dalam urutan yang diatur, baik aslinya maupun dalam urutan datar.
Artikel singkat ini memandu cara mengekstrak teks dari PPTX. Untuk mengonversi presentasi menjadi video, lihat artikel Convert PowerPoint to video using Python.