این مقاله نحوه ** استخراج پیوندها از PDF با استفاده از C#** را راهنمایی می کند. دارای تنظیمات IDE، مراحل و یک کد نمونه برای توسعه ** استخراج کننده لینک PDF با استفاده از C#**. یاد خواهید گرفت که یادداشت های انتخاب شده را از یک صفحه بازیابی کنید و URI را از حاشیه نویسی های نوع پیوند واکشی کنید.
مراحل استخراج URL از PDF با استفاده از سی شارپ
- IDE را طوری تنظیم کنید که از Aspose.PDF for .NET برای استخراج URI از صفحه PDF استفاده کند
- PDF منبع file را بارگیری کنید و تمام صفحات موجود در آن را حلقه بزنید
- یک annotation selector برای یافتن حاشیه نویسی پیوند در یک صفحه ایجاد کنید
- تمام حاشیه نویسی ها را استخراج کنید و لیست حاشیه نویسی های انتخاب شده را بازیابی کنید
- در هر یادداشت پیوند تکرار کنید و اقدامات مرتبط را بیابید
- برای دسترسی و نمایش URI اقدام به GoToURIAction ارسال کنید
در این مراحل نحوه استخراج لینک ها از PDF با استفاده از C# توضیح داده شده است. یک انتخابگر حاشیه نویسی برای حاشیه نویسی پیوند ایجاد کنید و از آن برای انتخاب لیستی از حاشیه نویسی های هدف استفاده کنید. هر حاشیه نویسی پیوند را به GoToURIAction تایپ کنید و URI را از این عملکرد واکشی کنید.
کد برای استخراج هایپرلینک از PDF با استفاده از سی شارپ
using System; | |
using System.Linq; | |
using Aspose.Pdf; | |
using Aspose.Pdf.Annotations; | |
class PdfLinkExtractor | |
{ | |
static void Main() | |
{ | |
// Initialize and apply the Aspose.PDF license | |
new License().SetLicense("license.lic"); | |
// Load the PDF document containing hyperlinks | |
using (var pdfDocument = new Document("PdfWithLinks.pdf")) | |
{ | |
// Loop through each page in the PDF document | |
foreach (var (pdfPage, pageNumber) in pdfDocument.Pages.Select((page, index) => (page, index + 1))) | |
{ | |
// Display the current page number | |
Console.WriteLine($"Processing Page {pageNumber}"); | |
// Create an annotation selector to find link annotations on the page | |
var linkSelector = new AnnotationSelector(new LinkAnnotation(pdfPage, Rectangle.Trivial)); | |
// Extract all annotations from the current page | |
pdfPage.Accept(linkSelector); | |
// Retrieve the list of selected link annotations | |
var linkAnnotations = linkSelector.Selected; | |
// Iterate through each link annotation | |
foreach (var annotation in linkAnnotations) | |
{ | |
// Check if the annotation has any associated actions | |
if (annotation.Actions.Any()) | |
{ | |
// Cast the action to a GoToURIAction to access the URI | |
var uriAction = (GoToURIAction)((LinkAnnotation)annotation).Action; | |
// Display the extracted URI | |
Console.WriteLine($"Found URI: {uriAction.URI}"); | |
} | |
} | |
} | |
} | |
// Indicate that the process is complete | |
Console.WriteLine("URI extraction completed."); | |
} | |
} |
کد بالا نحوه استخراج همه پیوندها از PDF را با استفاده از C# نشان می دهد. AnnotationSelector یک شی LinkAnnotation را می گیرد که به صفحه و شی مستطیل نیاز دارد. متد Accept() در کلاس Page شیء انتخابگر پیوند را می گیرد و حاشیه نویسی پیوند را در مجموعه Selected ذخیره می کند.
این آموزش سریع فرآیند استخراج لینک ها از صفحه PDF را به ما آموزش داده است. برای حذف هایپرلینک ها از فایل PDF به مقاله نحوه حذف هایپرلینک از PDF در سی شارپ مراجعه کنید.