Extrahera länkar från PDF i Java

I den här korta instruktionsartikeln kommer du att lära dig hur du extraherar länkar från PDF i Java. Den innehåller IDE-inställningarna, en lista med steg och en exempelkod för att extrahera hyperlänkar från PDF i Java. Du kommer att lära dig att hämta länktypskommentarer och omvandla dem till URIaction för att hämta URI:n.

Steg för att extrahera URL från PDF i Java

  1. Ställ in IDE att använda Aspose.PDF for Java för att extrahera länkar
  2. Ladda käll-PDF-filen file, iterera genom alla sidor och skapa en anteckningsväljare för sidan
  3. Extrahera alla kommentarer från sidan och spara dem i den valda samlingen
  4. Iterera igenom alla kommentarer och typcast varje anteckning till GoToURIAction
  5. Anropa metoden getURI() för att komma åt länken och visa den på konsolen

Den här guiden har visat hur man extraherar alla länkar från PDF i Java. Ladda käll-PDF-filen, gå till målsidorna och skapa en anteckningsväljare för varje sida. Anropa accept()-metoden med den definierade väljaren, hämta listan med länkkommentarer och hämta URI:n genom att typcasta den till klassen GoToURIAction.

Kod för att extrahera hyperlänk från PDF i Java

Ovanstående kod har demonstrerat en PDF-länkextraktor i Java. Du kan hoppa över eller välja en sida genom att analysera dess innehåll med hjälp av klassobjektet Sida medan du itererar genom sidorna i PDF-filen. Metoden getAction() används för att hämta URIaction som innehåller länkens URI.

I den här artikeln har vi lärt oss processen att hämta hyperlänkar från en PDF. För att skapa hyperlänkar i en PDF, se artikeln om hur man skapar hyperlänkar i PDF med Java.

 Svenska