Trích xuất liên kết từ PDF trong Java

Trong bài viết hướng dẫn ngắn này, bạn sẽ học cách trích xuất liên kết từ PDF trong Java. Bài viết này chứa các thiết lập IDE, danh sách các bước và mã mẫu để trích xuất siêu liên kết từ PDF trong Java. Bạn sẽ học cách lấy chú thích loại liên kết và chuyển đổi chúng thành URIAction để lấy URI.

Các bước trích xuất URL từ PDF trong Java

  1. Đặt IDE để sử dụng Aspose.PDF for Java để trích xuất liên kết
  2. Tải tệp PDF nguồn file, lặp lại tất cả các trang và tạo bộ chọn chú thích cho trang
  3. Trích xuất tất cả các chú thích từ trang và lưu chúng vào bộ sưu tập Đã chọn
  4. Lặp lại tất cả các chú thích và chuyển kiểu từng chú thích thành GoToURIAction
  5. Gọi phương thức getURI() để truy cập liên kết và hiển thị nó trên bảng điều khiển

Hướng dẫn này đã chỉ ra cách trích xuất tất cả các liên kết từ PDF trong Java. Tải tệp PDF nguồn, truy cập các trang đích và tạo bộ chọn chú thích cho từng trang. Gọi phương thức accept() bằng bộ chọn đã xác định, lấy danh sách chú thích liên kết và lấy URI bằng cách ép kiểu thành lớp GoToURIAction.

Mã để trích xuất siêu liên kết từ PDF trong Java

Mã trên đã chứng minh một trình trích xuất liên kết PDF trong Java. Bạn có thể bỏ qua hoặc chọn một trang bằng cách phân tích nội dung của nó bằng đối tượng lớp Page trong khi lặp qua các trang trong PDF. Phương thức getAction() được sử dụng để lấy URIAction chứa URI của liên kết.

Trong bài viết này, chúng ta đã tìm hiểu quy trình lấy siêu liên kết từ PDF. Để tạo siêu liên kết trong PDF, hãy tham khảo bài viết về cách tạo siêu liên kết trong PDF bằng Java.

 Tiếng Việt