Questo breve tutorial ti guida su come leggere i file PDF in Java. Contiene codice Java per leggere il file PDF in modo tale che prima leggi il testo da PDF in Java in una stringa e poi prendi tutte le immagini dal file PDF per salvarle sul disco come JPG. Non è necessario installare alcuno strumento di terze parti per leggere PDF in Java.
Passaggi per leggere il file PDF in Java
- Configura Aspose.PDF nel tuo progetto utilizzando il repository Maven per leggere il file PDF
- Carica il file PDF di esempio nell’oggetto classe Document
- Crea un’istanza dell’oggetto classe TextAbsorber in grado di leggere l’intero testo dal file PDF
- Leggi il testo PDF dal file caricato utilizzando l’oggetto classe TextAbsorber
- Visualizza l’intero testo letto dal file PDF sulla console
- Scorri tutte le pagine del file PDF per accedere alle immagini
- Analizza tutte le immagini in ogni raccolta di immagini di pagina e salvale sul disco
In questo rapido tutorial passo dopo passo, carichiamo prima il file PDF di destinazione e quindi avviamo l’oggetto della classe TextAbsorber che è in grado di cercare testo in tutte le pagine del PDF. L’intero testo viene restituito in una stringa che può essere visualizzata o elaborata secondo il requisito. Allo stesso modo, possiamo analizzare tutte le immagini nella raccolta di immagini e salvarle sul disco in qualsiasi formato poiché lo abbiamo salvato come JPG in questo tutorial.
Codice per leggere PDF utilizzando Java
In questo codice di esempio, abbiamo utilizzato la classe TextAbsorber e la funzione getImages() di Page.getResources() per leggere PDF utilizzando Java. L’oggetto TextAbsorber viene utilizzato per leggere il testo dalla funzione di accettazione nella PDF PageCollection. Mentre la funzione getImages() della raccolta getResources() restituisce tutte le immagini su una pagina.
Tieni presente che questi passaggi per leggere PDF in Java possono essere eseguiti in qualsiasi sistema operativo come Windows, Linux o macOS. Se vuoi saperne di più su come lavorare con i file PDF, consulta l’articolo su come leggere i segnalibri in PDF usando Java.