Estrarre i link dai PDF in Java

In questo breve articolo pratico, imparerai come estrarre link da PDF in Java. Contiene le impostazioni IDE, un elenco di passaggi e un codice di esempio per estrarre hyperlink da PDF in Java. Imparerai a recuperare annotazioni di tipo link e trasformarle in URIAction per recuperare l’URI.

Passaggi per estrarre l’URL dal PDF in Java

  1. Imposta l’IDE per utilizzare Aspose.PDF for Java per estrarre i collegamenti
  2. Carica il PDF sorgente file, scorri tutte le pagine e crea un selettore di annotazioni per la pagina
  3. Estrarre tutte le annotazioni dalla pagina e salvarle nella raccolta Selezionata
  4. Scorrere tutte le annotazioni e convertire ogni annotazione in GoToURIAction
  5. Richiamare il metodo getURI() per accedere al collegamento e visualizzarlo sulla console

Questa guida ha mostrato come estrarre tutti i link da PDF in Java. Caricare il file PDF sorgente, accedere alle pagine di destinazione e creare un selettore di annotazioni per ogni pagina. Chiamare il metodo accept() utilizzando il selettore definito, recuperare l’elenco delle annotazioni dei link e recuperare l’URI tramite il typecasting nella classe GoToURIAction.

Il codice sopra riportato ha dimostrato un estrattore di link PDF in Java. È possibile saltare o selezionare una pagina analizzandone il contenuto tramite l’oggetto della classe Page mentre si scorre attraverso le pagine nel PDF. Il metodo getAction() viene utilizzato per recuperare l’URIAction che contiene l’URI del link.

In questo articolo abbiamo appreso il processo di recupero di collegamenti ipertestuali da un PDF. Per creare collegamenti ipertestuali in un PDF, fare riferimento all’articolo su come creare un collegamento ipertestuale in PDF utilizzando Java.

 Italiano