Tutorial singkat ini memandu cara mengonversi PDF yang dipindai menjadi PDF yang dapat diedit menggunakan Java. Ini mencakup detail untuk mengonfigurasi IDE, daftar langkah, dan contoh kode untuk mengonversi PDF yang dipindai menjadi PDF yang dapat dicari menggunakan Java. Anda akan mendapatkan detail untuk menyesuaikan proses pemindaian gambar dan mengonversi konten menjadi teks yang dapat dibaca.
Langkah-langkah Membuat PDF Dapat Dibaca dengan Java
- Atur IDE untuk menggunakan Aspose.Total for Java untuk mengubah PDF yang dipindai menjadi PDF yang dapat dicari
- Instansiasi lisensi produk yang bersangkutan untuk menghindari watermark pada output
- Buat sebuah instance dari mesin pengenalan menggunakan kelas AsposeOCR
- Buat instance input menggunakan kelas OcrInput dan muat PDF hasil pemindaian sumber ke dalamnya
- Buat instance RecognitionSettings untuk mengatur parameter kustomisasi selama pemindaian gambar
- Panggil metode AsposeOCR.Recognize() untuk mengambil data dari PDF yang dipindai dan menyimpannya dalam PDF sementara.
- Muat PDF berukuran sedang ke dalam objek kelas Document dari Aspose.PDF dan atur metadata di dalamnya
- Simpan PDF akhir ke disk dengan teks yang dapat dicari dan metadata
Langkah-langkah ini menjelaskan cara mengonversi gambar PDF menjadi teks PDF menggunakan Java. Buat objek mesin pengenalan, siapkan file input dengan menambahkan file PDF yang dipindai ke objek OcrInput, tentukan parameter dalam objek RecognitionSettings, panggil metode Recognize() untuk memindai data dan menyimpan hasilnya ke file PDF perantara. Akhirnya, muat file PDF perantara menggunakan objek Aspose.PDF.Document dan tambahkan metadata atau format lebih lanjut sebelum menyimpan file PDF akhir.
Kode untuk Mengonversi Gambar PDF menjadi Teks menggunakan Java
Kode ini menunjukkan cara mengonversi PDF menjadi PDF yang dapat dicari menggunakan Java. Anda dapat mengatur bahasa deteksi tertentu saat memindai PDF, mengatur flag untuk mendeteksi bahasa secara otomatis, membatasi pengenalan ke karakter tertentu atau memblacklist karakter yang ingin Anda abaikan oleh OCR. Opsi juga tersedia untuk memilih strategi deteksi area/layout dokumen sumber jika diperlukan.
Artikel ini telah mengajarkan kami proses mengonversi PDF menjadi PDF teks yang dapat dipilih. Untuk mengekspor data dari formulir PDF ke Excel, lihat artikel Ekspor Data dari Formulir PDF ke Excel menggunakan Java.