Ekstrak Tautan dari PDF menggunakan C#

Artikel ini memberikan panduan tentang cara mengekstrak tautan dari PDF menggunakan C#. Artikel ini berisi pengaturan IDE, langkah-langkah, dan contoh kode untuk mengembangkan pengekstrak tautan PDF menggunakan C#. Anda akan belajar mengambil anotasi terpilih dari halaman dan mengambil URI dari anotasi jenis tautan.

Langkah-langkah untuk Mengekstrak URL dari PDF menggunakan C#

  1. Atur IDE untuk menggunakan Aspose.PDF for .NET untuk mengekstrak URI dari halaman PDF
  2. Muat PDF sumber file dan ulangi semua halaman di dalamnya
  3. Buat annotation selector untuk menemukan anotasi tautan pada halaman
  4. Ekstrak semua anotasi dan ambil daftar anotasi yang dipilih
  5. Ulangi setiap anotasi tautan dan temukan tindakan terkait
  6. Transmisikan tindakan ke GoToURIAction untuk mengakses dan menampilkan URI

Langkah-langkah ini menjelaskan cara mengekstrak hyperlink dari PDF menggunakan C#. Buat pemilih anotasi untuk anotasi tautan dan gunakan untuk memilih daftar anotasi target. Typecast setiap anotasi tautan ke GoToURIAction dan ambil URI dari tindakan ini.

Kode di atas menunjukkan cara mengekstrak semua tautan dari PDF menggunakan C#. AnnotationSelector mengambil objek LinkAnnotation yang memerlukan objek halaman dan persegi panjang. Metode Accept() di kelas Page mengambil objek pemilih tautan dan menyimpan anotasi tautan di koleksi Selected.

Tutorial singkat ini mengajarkan kita proses mengekstrak hyperlink dari halaman PDF. Untuk menghapus hyperlink dari berkas PDF, lihat artikel Cara menghapus hyperlink dari PDF di C#.

 Indonesian