Ebből a rövid útmutató cikkből megtudhatja, hogyan lehet linkeket kivonni a PDF webhelyről Java nyelven. Tartalmazza az IDE beállításokat, a lépések listáját és egy mintakódot a hiperhivatkozások PDF-ből Java nyelven történő kivonásához. Megtanulja, hogyan kell lekérni a hivatkozás típusú megjegyzéseket, és átalakítani őket URIAction-vé az URI lekéréséhez.
Az URL kibontásának lépései a PDF-ből Java nyelven
- Állítsa be az IDE-t a Aspose.PDF for Java használatára a hivatkozások kibontására
- Töltse be a forrás PDF-fájlt file, iterálja végig az összes oldalt, és hozzon létre egy kommentárválasztót az oldalhoz
- Csomagolja ki az összes megjegyzést az oldalról, és mentse el a Kiválasztott gyűjteménybe
- Ismételje meg az összes megjegyzést, és írja be az egyes kommentárokat a GoToURIAction
- A hivatkozás eléréséhez és a konzolon való megjelenítéséhez hívja meg a getURI() metódust
Ez az útmutató bemutatja, hogyan lehet kivonni az összes hivatkozást a PDF-ből Java nyelven. Töltse be a forrás-PDF-fájlt, nyissa meg a céloldalakat, és hozzon létre egy megjegyzésválasztót minden oldalhoz. Hívja meg az accept() metódust a definiált szelektor segítségével, kérje le a hivatkozási megjegyzések listáját, és kérje le az URI-t a GoToURIAction osztályba történő típusküldéssel.
Kód a hiperhivatkozás kinyeréséhez a PDF-ből Java nyelven
import com.aspose.pdf.*; | |
import java.util.List; | |
public class Main { | |
public static void main(String[] args) throws Exception {//main() method for fetching URI | |
License license = new License();//Initialize the PDF license | |
license.setLicense("license.lic");//Apply the license | |
Document pdfDocument = new Document("PdfWithLinks.pdf");// Load hyperlinks PDF | |
// Iterate all the pages | |
for (int pageNumber = 1; pageNumber <= pdfDocument.getPages().size(); pageNumber++) { | |
System.out.println("Processing Page " + pageNumber);// Display the current page number | |
Page pdfPage = pdfDocument.getPages().get_Item(pageNumber);// Get the current page | |
// Create an annotation selector to find link annotations on the page | |
AnnotationSelector linkSelector = new AnnotationSelector(new LinkAnnotation(pdfPage, Rectangle.getTrivial())); | |
// Extract all annotations from the current page | |
pdfPage.accept(linkSelector); | |
// Retrieve the list of selected link annotations | |
List<Annotation> linkAnnotations = linkSelector.getSelected(); | |
// Iterate through each link annotation | |
for (Annotation annotation : linkAnnotations) { | |
// Check if the annotation is a LinkAnnotation and has actions | |
if (annotation instanceof LinkAnnotation) { | |
LinkAnnotation linkAnnotation = (LinkAnnotation) annotation; | |
// Check if the LinkAnnotation has any associated actions | |
if (linkAnnotation.getAction() instanceof GoToURIAction) { | |
// Cast the action to a GoToURIAction to access the URI | |
GoToURIAction uriAction = (GoToURIAction) linkAnnotation.getAction(); | |
// Display the extracted URI | |
System.out.println("Found URI: " + uriAction.getURI()); | |
} | |
} | |
} | |
} | |
// Indicate that the process is complete | |
System.out.println("URI extraction completed."); | |
} | |
} |
A fenti kód bemutatott egy PDF link kivonatot Javaban. Kihagyhat vagy kijelölhet egy oldalt a tartalmának elemzésével az Oldalosztály objektum használatával, miközben a PDF-ben lévő oldalakon áthalad. A getAction() metódus a hivatkozás URI-jét tartalmazó URIAction lekérésére szolgál.
Ebben a cikkben megtanultuk a hiperhivatkozások PDF-ből való lekérésének folyamatát. Ha hiperhivatkozásokat szeretne létrehozni PDF-ben, olvassa el a {{HIPERLINK1}} című cikket.