Cách đánh dấu trong PDF bằng Python

Hướng dẫn nhanh này hướng dẫn cách đánh dấu trong PDF bằng Python. Nó chứa tất cả các chi tiết để thiết lập môi trường, danh sách các bước để phát triển ứng dụng và mã mẫu có thể chạy được để phát triển Công cụ đánh dấu PDF bằng Python. Bạn sẽ tìm hiểu quy trình thông qua cách tiếp cận có hệ thống để thực hiện tác vụ này cùng với các tùy chọn để tùy chỉnh văn bản được đánh dấu theo yêu cầu của bạn.

Các bước để tô sáng văn bản trong PDF bằng Python

Định cấu hình môi trường thành sử dụng Aspose.PDF cho Python qua .NET để đánh dấu văn bản
Tải tệp PDF mục tiêu nơi văn bản sẽ được tô sáng bằng cách sử dụng đối tượng lớp Document
Tìm kiếm văn bản trên trang đích bằng lớp TextFragmentAbsorber
Tạo chú thích nổi bật bằng lớp HighlightAnnotation
Chỉ định màu tô sáng và các thuộc tính khác trước khi áp dụng nó
Lưu tệp PDF kết quả với văn bản được đánh dấu

Các bước này hỗ trợ cách đánh dấu tệp PDF bằng Python. Ban đầu, tệp PDF được tải và đối tượng lớp TextFragmentAbsorber được sử dụng để chỉ định văn bản cần tìm kiếm và sau đó tìm tất cả các phiên bản của văn bản đích trên trang đã chọn. Trong các bước tiếp theo, HighlightAnnotation được sử dụng để xác định chú thích tô sáng cho trang đã chọn và phiên bản cụ thể từ tập hợp các chuỗi được tìm thấy trên trang cùng với việc đặt màu chú thích và các thuộc tính khác nếu cần.

Mã để đánh dấu tài liệu PDF bằng Python

	import aspose.pdf as pdf

	# Load the license
	license = pdf.License()
	license.set_license("Aspose.Total.lic")

	# Load the PDF
	doc = pdf.Document("sample_input.pdf")

	# Search target text to highlight
	textFragmentAbsorber = pdf.text.TextFragmentAbsorber("PowerPoint")
	doc.pages[1].accept(textFragmentAbsorber)

	# Create a highlight annotation
	ha = pdf.annotations.HighlightAnnotation(doc.pages[1], textFragmentAbsorber.text_fragments[1].rectangle)

	# Specify highlight color
	ha.color = pdf.Color.yellow

	# Add annotation to highlight text in PDF
	doc.pages[1].annotations.add(ha,True)

	# Save the document
	doc.save("PDF_with_Highlighted_Text.pdf")

	print("Text searched and highlighted successfully")

view raw How to Highlight in PDF using Python.py hosted with ❤ by GitHub

Mã này trình bày cách đánh dấu văn bản trong PDF bằng Python. Nó sử dụng hàm tạo TextFragmentAbsorber để chỉ định chuỗi sẽ được tìm kiếm trong trang đích và sau đó phương thức accept() được sử dụng để tạo một tập hợp các phiên bản của chuỗi này trên trang đích. Tương tự, hàm tạo HighlightAnnotation được sử dụng để chỉ định trang và khu vực nơi chú thích tô sáng sẽ được hiển thị bằng cách sử dụng hình chữ nhật xung quanh chuỗi mục tiêu.

Bài viết này đã dạy chúng tôi cách đánh dấu tài liệu PDF bằng Python. Nếu bạn muốn tìm hiểu quy trình để gạch một số văn bản trong PDF, hãy tham khảo bài viết trên cách gạch bỏ văn bản trong Adobe PDF bằng Python.

Cơ sở tri thức Aspose

Tìm câu trả lời bằng API

Cách đánh dấu trong PDF bằng Python

Các bước để tô sáng văn bản trong PDF bằng Python

Mã để đánh dấu tài liệu PDF bằng Python