Tutorial singkat ini memberikan detail tentang cara mengekstrak teks dari PDF yang dipindai di Java. Anda dapat mengonfigurasi proses mengekstrak teks dari PDF yang dipindai di Java dengan menyetel parameter deteksi. Opsi ini juga tersedia untuk membuat pilihan antara kecepatan atau akurasi tergantung pada kualitas PDF dan persyaratan aplikasi lainnya.
Langkah-langkah untuk Mengekstrak Teks dari PDF yang Dipindai di Jawa
- Dari repositori Maven, konfigurasikan Aspose.OCR di proyek Anda untuk membaca teks PDF yang dipindai
- Inisialisasi objek AsposeOcrPdf untuk membaca teks dari PDF
- Buat instance objek kelas DocumentRecognitionSettings untuk mengatur parameter pengenalan
- Atur halaman awal dan jumlah halaman dalam PDF untuk membaca teks
- Untuk meningkatkan kecepatan deteksi, atur tanda area deteksi ke false
- Panggil fungsi RecognizePdf untuk membaca semua teks sesuai dengan konfigurasi di atas
- Ulangi semua hasil yang diekstraksi dari halaman PDF dan tampilkan di konsol
Selama proses memindai teks dari PDF di Java, objek AsposeOCRPdf dimulai yang sebenarnya berisi fitur untuk mengenali teks dari PDF. Ini mendukung konfigurasi proses deteksi seperti nomor halaman awal, jumlah halaman PDF yang akan dibaca, dan opsi untuk mengatur area deteksi untuk mengontrol kecepatan dan akurasi. Terakhir, kami menguraikan koleksi hasil yang dipindai dari setiap halaman dan menampilkannya di konsol.
Kode untuk Mengonversi PDF yang dipindai menjadi teks di Java
Kode ini menggunakan AsposeOCRPdf untuk mendapatkan teks dari PDF yang dipindai di Java. Objek kelas DocumentRecognitionSettings berisi opsi untuk mengatur konfigurasi halaman baik menggunakan konstruktor seperti yang ditunjukkan dalam kode contoh ini atau dengan mengatur StartPage dan PagesNumber secara terpisah. Anda juga dapat mengatur bahasa, koreksi kemiringan gambar, dan jumlah utas untuk deteksi paralel teks dari PDF yang dipindai.
Pada artikel ini, kami telah mempelajari cara mengekstrak teks dari PDF yang dipindai di Java bersama dengan konfigurasi proses deteksi. Namun, jika Anda ingin mengekstrak teks dari sebuah gambar, lihat artikel di cara mengekstrak teks dari gambar menggunakan Java.