Bu kısa eğitim size PDF dosyasını Java’da nasıl okuyacağınız konusunda rehberlik eder. PDF dosyasını okumak için Java kodu içerir, öyle ki, önce Java’daki PDF metnini bir dizeye okursunuz ve ardından diske {{HYPERLINK2 olarak kaydetmek için PDF dosyasındaki tüm görüntüleri getirirsiniz. }}. Java’da PDF okumak için herhangi bir üçüncü taraf aracı yüklemeye gerek yoktur.
Java’da PDF Dosyasını Okuma Adımları
- PDF dosyasını okumak için Maven deposunu kullanarak projenize Aspose.PDF yapılandırın
- Örnek PDF dosyasını Document sınıf nesnesine yükleyin
- PDF dosyasındaki metnin tamamını okuyabilen TextAbsorber sınıfı nesnesini örnekleyin
- TextAbsorber sınıf nesnesini kullanarak yüklenen dosyadan PDF metnini okuyun
- PDF dosyasından okunan tüm metni konsolda görüntüleyin
- Resimlere erişmek için PDF dosyasındaki tüm sayfaları yineleyin
- Her sayfadaki resim koleksiyonundaki tüm resimleri ayrıştırın ve diske kaydedin
Bu hızlı adım adım öğreticide, önce hedef PDF dosyasını yükleriz ve ardından PDF’deki tüm sayfalarda metin araması yapabilen TextAbsorber sınıf nesnesini başlatırız. Bu metnin tamamı, gereksinime göre görüntülenebilen veya işlenebilen bir dizeye döndürülür. Benzer şekilde, resim koleksiyonundaki tüm resimleri ayrıştırabilir ve bu eğitimde JPG olarak kaydettiğimiz gibi herhangi bir biçimde diske kaydedebiliriz.
Java kullanarak PDF Okumak için Kod
Bu örnek kodda, Java kullanarak PDF okumak için Page.getResources() öğesinin TextAbsorber sınıfını ve getImages() işlevini kullandık. TextAbsorber nesnesi, PDF PageCollection’daki kabul işleviyle metni okumak için kullanılır. GetResources() koleksiyonunun getImages() işlevi, bir sayfadaki tüm görüntüleri döndürür.
Java’da PDF okumak için bu adımların Windows, Linux veya macOS gibi herhangi bir işletim sisteminde gerçekleştirilebileceğini unutmayın. PDF dosyalarıyla çalışma hakkında daha fazla bilgi edinmek istiyorsanız Java kullanarak PDF’deki yer imleri nasıl okunur makalesine bakın.