Neste breve artigo de instruções, você aprenderá como extrair links de PDF em Java. Ele contém as configurações do IDE, uma lista de etapas e um código de exemplo para extrair hiperlinks de PDF em Java. Você aprenderá a buscar anotações de tipo de link e transformá-las em URIAction para buscar o URI.
Etapas para extrair URL de PDF em Java
- Defina o IDE para usar Aspose.PDF for Java para extrair links
- Carregue o PDF de origem file, itere por todas as páginas e crie um seletor de anotação para a página
- Extraia todas as anotações da página e salve-as na coleção Selecionada
- Iterar por todas as anotações e converter cada anotação para GoToURIAction
- Invoque o método getURI() para acessar o link e exibi-lo no console
Este guia mostrou como extrair todos os links de PDF em Java. Carregue o arquivo PDF de origem, acesse as páginas de destino e crie um seletor de anotação para cada página. Chame o método accept() usando o seletor definido, busque a lista de anotações de link e busque o URI por typecasting para a classe GoToURIAction.
Código para extrair hiperlink de PDF em Java
import com.aspose.pdf.*; | |
import java.util.List; | |
public class Main { | |
public static void main(String[] args) throws Exception {//main() method for fetching URI | |
License license = new License();//Initialize the PDF license | |
license.setLicense("license.lic");//Apply the license | |
Document pdfDocument = new Document("PdfWithLinks.pdf");// Load hyperlinks PDF | |
// Iterate all the pages | |
for (int pageNumber = 1; pageNumber <= pdfDocument.getPages().size(); pageNumber++) { | |
System.out.println("Processing Page " + pageNumber);// Display the current page number | |
Page pdfPage = pdfDocument.getPages().get_Item(pageNumber);// Get the current page | |
// Create an annotation selector to find link annotations on the page | |
AnnotationSelector linkSelector = new AnnotationSelector(new LinkAnnotation(pdfPage, Rectangle.getTrivial())); | |
// Extract all annotations from the current page | |
pdfPage.accept(linkSelector); | |
// Retrieve the list of selected link annotations | |
List<Annotation> linkAnnotations = linkSelector.getSelected(); | |
// Iterate through each link annotation | |
for (Annotation annotation : linkAnnotations) { | |
// Check if the annotation is a LinkAnnotation and has actions | |
if (annotation instanceof LinkAnnotation) { | |
LinkAnnotation linkAnnotation = (LinkAnnotation) annotation; | |
// Check if the LinkAnnotation has any associated actions | |
if (linkAnnotation.getAction() instanceof GoToURIAction) { | |
// Cast the action to a GoToURIAction to access the URI | |
GoToURIAction uriAction = (GoToURIAction) linkAnnotation.getAction(); | |
// Display the extracted URI | |
System.out.println("Found URI: " + uriAction.getURI()); | |
} | |
} | |
} | |
} | |
// Indicate that the process is complete | |
System.out.println("URI extraction completed."); | |
} | |
} |
O código acima demonstrou um extrator de link PDF em Java. Você pode pular ou selecionar uma página analisando seu conteúdo usando o objeto de classe Page enquanto itera pelas páginas no PDF. O método getAction() é usado para buscar o URIAction que contém o URI do link.
Neste artigo, aprendemos o processo de buscar hyperlinks de um PDF. Para criar hyperlinks em um PDF, consulte o artigo em como criar hiperlink em PDF usando Java.