Hướng dẫn nhanh này hướng dẫn bạn cách gạch bỏ văn bản trong Adobe PDF bằng Python. Nó chia sẻ tất cả các bước cần thiết để thiết lập môi trường và danh sách các bước cần tuân theo cùng với mã mẫu có thể chạy được minh họa cách tạo ra trong Adobe Acrobat bằng Python. Bạn sẽ tìm hiểu quy trình phát triển ứng dụng từ đầu bằng cách sử dụng một số lệnh gọi API cùng với mô tả về tất cả các bước.
Các bước để gạch bỏ văn bản trong Adobe PDF bằng Python
- Đặt IDE thành sử dụng Aspose.PDF cho Python qua .NET để gạch bỏ văn bản
- Tải tệp PDF nguồn trong đó một số văn bản sẽ bị gạch bỏ bằng cách sử dụng đối tượng lớp Document
- Xác định từ tìm kiếm trong PDF bằng đối tượng lớp TextFragmentAbsorber
- Chạy phương thức visit() trên trang mục tiêu để tìm kiếm các phiên bản của từ mục tiêu
- Tạo một đối tượng StrikeOutAnnotation sử dụng vùng hình chữ nhật của trường hợp đầu tiên của từ được tìm kiếm
- Đặt màu và tiêu đề của chú thích gạch ngang trước khi thêm nó vào bộ sưu tập chú thích của trang
- Lưu tệp PDF kết quả bằng cách gạch bỏ ở lần xuất hiện đầu tiên của từ mong muốn
Các bước này xác định quy trình cách gạch bỏ văn bản trong PDF bằng Python. Nó yêu cầu tải tệp PDF mục tiêu và sau đó tìm kiếm các lần xuất hiện của từ mong muốn sẽ xuất hiện trên một trang cụ thể. Khi quá trình tìm kiếm hoàn tất, khu vực hình chữ nhật của lần xuất hiện đầu tiên được sử dụng để khởi tạo một đối tượng StrikeOutAnnotation sẽ thực sự tạo ra một đường gạch ngang trên văn bản có màu mong muốn và tiêu đề nếu được yêu cầu.
Mã để gạch bỏ văn bản trong PDF bằng Python
Đoạn mã mẫu này có thể được sử dụng làm cơ sở cho một ứng dụng hoàn chỉnh xuất hiện trong Adobe Acrobat bằng Python. Sử dụng lớp TextFragmentAbsorber để tìm kiếm từ mục tiêu trên một trang cụ thể để lấy danh sách tất cả các lần xuất hiện của từ đó. Trong bước tiếp theo, bạn phải tạo một đối tượng StrikeOutAnnotation trong khu vực hình chữ nhật của lần xuất hiện mục tiêu sao cho đường được hiển thị trong hình chữ nhật bao quanh đó.
Hướng dẫn ngắn này đã dạy chúng tôi hiển thị các dòng gạch bỏ trên một hoặc nhiều từ trên trang PDF. Nếu bạn muốn tìm hiểu quy trình chèn bảng vào PDF, hãy tham khảo bài viết trên cách chèn bảng vào PDF bằng Python.