Koppelingen uit PDF extraheren in Java

In dit korte how-to-artikel leert u hoe u links uit PDF in Java kunt extraheren. Het bevat de IDE-instellingen, een lijst met stappen en een voorbeeldcode om hyperlinks uit PDF in Java te extraheren. U leert hoe u linktype-annotaties kunt ophalen en deze kunt transformeren naar URIAction om de URI op te halen.

Stappen om URL uit PDF te extraheren in Java

  1. Stel de IDE in om Aspose.PDF for Java te gebruiken om links te extraheren
  2. Laad de bron-PDF file, doorloop alle pagina’s en maak een annotatieselector voor de pagina
  3. Haal alle aantekeningen van de pagina en sla ze op in de geselecteerde verzameling
  4. Loop door alle annotaties en typeer elke annotatie naar de GoToURIAction
  5. Roep de getURI()-methode aan om toegang te krijgen tot de link en deze op de console weer te geven

Deze handleiding heeft laten zien hoe u alle links uit PDF in Java kunt extraheren. Laad het bron-PDF-bestand, open de doelpagina’s en maak een annotatieselector voor elke pagina. Roep de accept()-methode aan met de gedefinieerde selector, haal de lijst met linkannotaties op en haal de URI op door deze te typecasten naar de klasse GoToURIAction.

De bovenstaande code heeft een PDF-link-extractor in Java gedemonstreerd. U kunt een pagina overslaan of selecteren door de inhoud ervan te analyseren met behulp van het Page-klasseobject terwijl u door de pagina’s in de PDF itereert. De getAction()-methode wordt gebruikt om de URIAction op te halen die de URI van de link bevat.

In dit artikel hebben we het proces van het ophalen van hyperlinks uit een PDF geleerd. Om hyperlinks in een PDF te maken, raadpleeg het artikel over Hoe maak je een hyperlink in PDF met behulp van Java.

 Nederlands