Bu kısa nasıl yapılır makalesinde, Java’da PDF‘den bağlantıları nasıl çıkaracağınızı öğreneceksiniz. IDE ayarlarını, bir adım listesini ve Java’da PDF’den köprü metinlerini çıkarmak için bir örnek kodu içerir. Bağlantı türü açıklamalarını almayı ve bunları URI’yi almak için URIAction’a dönüştürmeyi öğreneceksiniz.
Java’da PDF’den URL Çıkarma Adımları
- Bağlantıları çıkarmak için IDE’yi Aspose.PDF for Java kullanacak şekilde ayarlayın
- Kaynak PDF’yi file yükleyin, tüm sayfalarda gezinin ve sayfa için bir açıklama seçici oluşturun
- Sayfadaki tüm açıklamaları çıkarın ve Seçili koleksiyona kaydedin
- Tüm açıklamalar arasında gezinin ve her açıklamayı GoToURIAction’e dönüştürün
- Bağlantıya erişmek ve onu konsolda görüntülemek için getURI() yöntemini çağırın
Bu kılavuz, Java’da PDF’den tüm bağlantıları nasıl çıkaracağınızı göstermiştir. Kaynak PDF dosyasını yükleyin, hedef sayfalara erişin ve her sayfa için bir açıklama seçicisi oluşturun. Tanımlı seçiciyi kullanarak accept() yöntemini çağırın, bağlantı açıklamalarının listesini alın ve URI’yi GoToURIAction sınıfına tür dönüştürerek alın.
Java’da PDF’den Köprü Metni Çıkarma Kodu
import com.aspose.pdf.*; | |
import java.util.List; | |
public class Main { | |
public static void main(String[] args) throws Exception {//main() method for fetching URI | |
License license = new License();//Initialize the PDF license | |
license.setLicense("license.lic");//Apply the license | |
Document pdfDocument = new Document("PdfWithLinks.pdf");// Load hyperlinks PDF | |
// Iterate all the pages | |
for (int pageNumber = 1; pageNumber <= pdfDocument.getPages().size(); pageNumber++) { | |
System.out.println("Processing Page " + pageNumber);// Display the current page number | |
Page pdfPage = pdfDocument.getPages().get_Item(pageNumber);// Get the current page | |
// Create an annotation selector to find link annotations on the page | |
AnnotationSelector linkSelector = new AnnotationSelector(new LinkAnnotation(pdfPage, Rectangle.getTrivial())); | |
// Extract all annotations from the current page | |
pdfPage.accept(linkSelector); | |
// Retrieve the list of selected link annotations | |
List<Annotation> linkAnnotations = linkSelector.getSelected(); | |
// Iterate through each link annotation | |
for (Annotation annotation : linkAnnotations) { | |
// Check if the annotation is a LinkAnnotation and has actions | |
if (annotation instanceof LinkAnnotation) { | |
LinkAnnotation linkAnnotation = (LinkAnnotation) annotation; | |
// Check if the LinkAnnotation has any associated actions | |
if (linkAnnotation.getAction() instanceof GoToURIAction) { | |
// Cast the action to a GoToURIAction to access the URI | |
GoToURIAction uriAction = (GoToURIAction) linkAnnotation.getAction(); | |
// Display the extracted URI | |
System.out.println("Found URI: " + uriAction.getURI()); | |
} | |
} | |
} | |
} | |
// Indicate that the process is complete | |
System.out.println("URI extraction completed."); | |
} | |
} |
Yukarıdaki kod, Java’da bir PDF bağlantı çıkarıcısı göstermiştir. PDF’deki sayfalar arasında gezinirken, Page sınıf nesnesini kullanarak içeriklerini analiz ederek bir sayfayı atlayabilir veya seçebilirsiniz. getAction() yöntemi, bağlantının URI’sini içeren URIAction’ı almak için kullanılır.
Bu makalede, bir PDF’den köprü metinleri alma sürecini öğrendik. Bir PDF’de köprü metinleri oluşturmak için Java kullanarak PDF’de köprü metni nasıl oluşturulur makalesine bakın.