Tutorial singkat ini memandu tentang cara menemukan dan mengganti teks dalam PDF menggunakan Python. Ini berisi informasi tentang mengonfigurasi IDE, proses mendetail langkah demi langkah, dan kode contoh yang dapat dijalankan untuk menemukan dan mengganti kata dalam pdf menggunakan Python. Anda juga akan mempelajari opsi untuk mencari dan mengganti teks di semua halaman PDF atau di halaman tertentu sesuai persyaratan aplikasi.
Langkah-langkah untuk Menemukan dan Mengganti dalam PDF menggunakan Python
- Setel lingkungan ke gunakan Aspose.PDF untuk Python melalui .NET untuk mengganti teks
- Muat file PDF target menggunakan objek kelas Document tempat data akan dicari dan diganti
- Tentukan teks yang akan dicari menggunakan objek kelas TextFragmentAbsorber
- Terapkan TextAbsorber untuk semua halaman di PDF menggunakan metode Document.pages.accept()
- Dapatkan akses ke koleksi semua item yang dicari di PDF melalui properti TextFragmentAbsorber.text_fragments
- Ulangi semua fragmen teks yang dicari dan tetapkan nilai baru sesuai kebutuhan Anda
- Simpan file PDF yang diperbarui pada disk dengan teks yang diperbarui
Langkah-langkah ini meringkas proses untuk menemukan dan mengganti semua dalam PDF menggunakan Python. Objek TextFragmentAbsorber dideklarasikan dengan menyediakan string yang akan dicari dan kemudian metode Document.pages.accept() dipanggil untuk mengurai semua halaman dalam PDF dan mengumpulkan fragmen teks yang berisi kata target. Setelah koleksi kata-kata yang ditemukan siap, sekarang Anda dapat mengganti semua atau fragmen yang dipilih dengan kata-kata baru sesuai kebutuhan Anda.
Kode untuk Menemukan dan Mengganti Teks dalam PDF menggunakan Python
Kode ini mendemonstrasikan proses untuk mengimplementasikan fitur pencarian PDF dan mengganti teks menggunakan Python. Kode ini telah menggunakan metode Document.pages.accept() untuk mencari teks di seluruh PDF namun jika Anda ingin mencari dan mengganti teks pada halaman tertentu saja, Anda dapat memilih halaman dengan memberikan indeks halaman dalam koleksi Document.pages dan kemudian panggil metode Page.accept() . Anda juga dapat menggunakan objek kelas TextSearchOptions sebagai argumen kedua saat membuat instance objek TextFragmentAbsorber untuk menyesuaikan operasi pencarian.
Artikel ini telah mengajarkan kita untuk mencari dan mengganti teks dalam PDF. Jika Anda ingin mempelajari proses menemukan dan menyorot teks dalam PDF, lihat artikel di cara menyorot dalam PDF menggunakan Python.