در این مقاله کوتاه نحوه ** استخراج پیوندها از PDF در جاوا** را خواهید آموخت. این شامل تنظیمات IDE، فهرستی از مراحل، و یک کد نمونه برای ** استخراج لینک ها از PDF در جاوا است. شما یاد خواهید گرفت که یادداشت های نوع پیوند را واکشی کنید و آنها را برای واکشی URI به URIAction تبدیل کنید.
مراحل استخراج URL از PDF در جاوا
- IDE را طوری تنظیم کنید که از Aspose.PDF for Java برای استخراج پیوندها استفاده کند
- PDF منبع file را بارگیری کنید، در تمام صفحات تکرار کنید و یک انتخابگر حاشیه نویسی برای صفحه ایجاد کنید
- تمام حاشیه نویسی ها را از صفحه استخراج کرده و در مجموعه Selected ذخیره کنید
- تمام حاشیه نویسی ها را تکرار کنید و هر حاشیه نویسی را در GoToURIAction تایپ کنید
- برای دسترسی به لینک و نمایش آن در کنسول، متد getURI() را فراخوانی کنید
این راهنما نحوه استخراج همه پیوندها از PDF در جاوا را نشان داده است. فایل PDF منبع را بارگیری کنید، به صفحات هدف دسترسی داشته باشید و برای هر صفحه یک انتخابگر حاشیه نویسی ایجاد کنید. متد accept() را با استفاده از انتخابگر تعریف شده فراخوانی کنید، لیست حاشیه نویسی پیوند را واکشی کنید و URI را با تایپ کست کردن آن به کلاس GoToURIAction واکشی کنید.
کد برای استخراج هایپرلینک از PDF در جاوا
import com.aspose.pdf.*; | |
import java.util.List; | |
public class Main { | |
public static void main(String[] args) throws Exception {//main() method for fetching URI | |
License license = new License();//Initialize the PDF license | |
license.setLicense("license.lic");//Apply the license | |
Document pdfDocument = new Document("PdfWithLinks.pdf");// Load hyperlinks PDF | |
// Iterate all the pages | |
for (int pageNumber = 1; pageNumber <= pdfDocument.getPages().size(); pageNumber++) { | |
System.out.println("Processing Page " + pageNumber);// Display the current page number | |
Page pdfPage = pdfDocument.getPages().get_Item(pageNumber);// Get the current page | |
// Create an annotation selector to find link annotations on the page | |
AnnotationSelector linkSelector = new AnnotationSelector(new LinkAnnotation(pdfPage, Rectangle.getTrivial())); | |
// Extract all annotations from the current page | |
pdfPage.accept(linkSelector); | |
// Retrieve the list of selected link annotations | |
List<Annotation> linkAnnotations = linkSelector.getSelected(); | |
// Iterate through each link annotation | |
for (Annotation annotation : linkAnnotations) { | |
// Check if the annotation is a LinkAnnotation and has actions | |
if (annotation instanceof LinkAnnotation) { | |
LinkAnnotation linkAnnotation = (LinkAnnotation) annotation; | |
// Check if the LinkAnnotation has any associated actions | |
if (linkAnnotation.getAction() instanceof GoToURIAction) { | |
// Cast the action to a GoToURIAction to access the URI | |
GoToURIAction uriAction = (GoToURIAction) linkAnnotation.getAction(); | |
// Display the extracted URI | |
System.out.println("Found URI: " + uriAction.getURI()); | |
} | |
} | |
} | |
} | |
// Indicate that the process is complete | |
System.out.println("URI extraction completed."); | |
} | |
} |
کد بالا یک * استخراج کننده لینک PDF در جاوا * را نشان می دهد. شما می توانید با تجزیه و تحلیل محتوای آن صفحه با استفاده از شی کلاس Page در حالی که صفحات را در PDF تکرار می کنید، از آن پرش کنید یا آن را انتخاب کنید. متد getAction() برای واکشی URIAction که حاوی URI پیوند است استفاده می شود.
در این مقاله فرآیند واکشی هایپرلینک ها از PDF را یاد گرفته ایم. برای ایجاد هایپرلینک در یک PDF، به مقاله در نحوه ایجاد هایپرلینک در PDF با استفاده از جاوا مراجعه کنید.