Σε αυτό το σύντομο άρθρο με οδηγίες, θα μάθετε πώς να εξάγετε συνδέσμους από το PDF σε Java. Περιλαμβάνει τις ρυθμίσεις IDE, μια λίστα βημάτων και ένα δείγμα κώδικα για εξαγωγή υπερσυνδέσμων από PDF σε Java. Θα μάθετε να λαμβάνετε σχολιασμούς τύπου συνδέσμου και να τους μετατρέπετε σε URIAction για την ανάκτηση του URI.
Βήματα για την εξαγωγή διεύθυνσης URL από PDF σε Java
- Ρυθμίστε το IDE ώστε να χρησιμοποιεί το Aspose.PDF for Java για την εξαγωγή συνδέσμων
- Φορτώστε το αρχείο πηγής PDF file, επαναλάβετε όλες τις σελίδες και δημιουργήστε έναν επιλογέα σχολιασμού για τη σελίδα
- Εξάγετε όλους τους σχολιασμούς από τη σελίδα και αποθηκεύστε τους στην Επιλεγμένη συλλογή
- Επαναλάβετε όλους τους σχολιασμούς και πληκτρολογήστε μετάδοση κάθε σχολιασμού στο GoToURIAction
- Επικαλέστε τη μέθοδο getURI() για να αποκτήσετε πρόσβαση στον σύνδεσμο και να τον εμφανίσετε στην κονσόλα
Αυτός ο οδηγός δείχνει πώς μπορείτε να εξάγετε όλους τους συνδέσμους από το PDF σε Java. Φορτώστε το αρχείο προέλευσης PDF, αποκτήστε πρόσβαση στις σελίδες προορισμού και δημιουργήστε έναν επιλογέα σχολιασμού για κάθε σελίδα. Καλέστε τη μέθοδο accept() χρησιμοποιώντας τον καθορισμένο επιλογέα, ανακτήστε τη λίστα των σχολιασμών συνδέσμων και ανακτήστε το URI μεταφέροντάς το στην κλάση GoToURIAction.
Κώδικας για εξαγωγή υπερ-σύνδεσης από PDF σε Java
import com.aspose.pdf.*; | |
import java.util.List; | |
public class Main { | |
public static void main(String[] args) throws Exception {//main() method for fetching URI | |
License license = new License();//Initialize the PDF license | |
license.setLicense("license.lic");//Apply the license | |
Document pdfDocument = new Document("PdfWithLinks.pdf");// Load hyperlinks PDF | |
// Iterate all the pages | |
for (int pageNumber = 1; pageNumber <= pdfDocument.getPages().size(); pageNumber++) { | |
System.out.println("Processing Page " + pageNumber);// Display the current page number | |
Page pdfPage = pdfDocument.getPages().get_Item(pageNumber);// Get the current page | |
// Create an annotation selector to find link annotations on the page | |
AnnotationSelector linkSelector = new AnnotationSelector(new LinkAnnotation(pdfPage, Rectangle.getTrivial())); | |
// Extract all annotations from the current page | |
pdfPage.accept(linkSelector); | |
// Retrieve the list of selected link annotations | |
List<Annotation> linkAnnotations = linkSelector.getSelected(); | |
// Iterate through each link annotation | |
for (Annotation annotation : linkAnnotations) { | |
// Check if the annotation is a LinkAnnotation and has actions | |
if (annotation instanceof LinkAnnotation) { | |
LinkAnnotation linkAnnotation = (LinkAnnotation) annotation; | |
// Check if the LinkAnnotation has any associated actions | |
if (linkAnnotation.getAction() instanceof GoToURIAction) { | |
// Cast the action to a GoToURIAction to access the URI | |
GoToURIAction uriAction = (GoToURIAction) linkAnnotation.getAction(); | |
// Display the extracted URI | |
System.out.println("Found URI: " + uriAction.getURI()); | |
} | |
} | |
} | |
} | |
// Indicate that the process is complete | |
System.out.println("URI extraction completed."); | |
} | |
} |
Ο παραπάνω κώδικας έχει δείξει έναν εξαγωγέα συνδέσμων PDF σε Java. Μπορείτε να παραλείψετε ή να επιλέξετε μια σελίδα αναλύοντας το περιεχόμενό της χρησιμοποιώντας το αντικείμενο της κλάσης Σελίδα ενώ επαναλαμβάνετε τις σελίδες του PDF. Η μέθοδος getAction() χρησιμοποιείται για την ανάκτηση της δράσης URIA που περιέχει το URI του συνδέσμου.
Σε αυτό το άρθρο, μάθαμε τη διαδικασία ανάκτησης υπερσυνδέσμων από ένα PDF. Για να δημιουργήσετε υπερσυνδέσμους σε PDF, ανατρέξτε στο άρθρο στο πώς να δημιουργήσετε υπερσύνδεσμο σε PDF χρησιμοποιώντας Java.