Hướng dẫn ngắn gọn này mô tả cách gạch bỏ văn bản trong PDF bằng Java. Nó chứa tất cả các chi tiết để định cấu hình môi trường và cung cấp mã mẫu đang chạy để gạch bỏ văn bản trong Adobe PDF bằng Java. Bạn sẽ tìm hiểu quy trình tải một tệp PDF và gạch bỏ một phiên bản cụ thể của văn bản hoặc tất cả các phiên bản trong tệp PDF đã tải.
Các bước để gạch bỏ văn bản trong Adobe PDF bằng Java
- Đặt IDE để thêm Aspose.PDF for Java để gạch bỏ văn bản
- Tải tệp PDF đích bằng cách sử dụng đối tượng lớp Document và truy cập vào trang đích để gạch bỏ văn bản
- Tạo đối tượng TextFragmentAbsorber để tìm kiếm văn bản
- Phân tích cú pháp tài liệu PDF để tìm kiếm tất cả các phiên bản của văn bản đã cho và lưu chúng vào bộ sưu tập
- Tạo một đối tượng StrikeOutAnnotation để loại bỏ một trường hợp cụ thể của văn bản được tìm thấy trong tài liệu
- Đặt màu chú thích và tiêu đề
- Lưu tệp PDF kết quả trên đĩa có văn bản bị gạch bỏ trong đó
Các bước này giải thích quy trình cách gạch bỏ văn bản trong Adobe PDF bằng Java. Tất cả các lớp, phương thức và thuộc tính cần thiết được giới thiệu để hoàn thành tác vụ như lớp Tài liệu được sử dụng để tải tệp PDF, đối tượng lớp TextFragmentAbsorber được sử dụng để xác định và tìm kiếm văn bản trong tệp PDF, đối tượng StrikeOutAnnotation được sử dụng để xác định chú thích gạch bỏ và áp dụng nó trên một trường hợp cụ thể của văn bản. Việc tùy chỉnh chú thích gạch bỏ cũng được mô tả trong các bước này.
Mã để gạch bỏ văn bản trong PDF bằng Java
Đoạn mã này trình bày cách viết trong Adobe Acrobat bằng Java. Nó khởi tạo đối tượng TextFragmentAbsorber bằng cách cung cấp dữ liệu chuỗi sẽ được tìm kiếm trên một trang cụ thể trong tệp PDF. Khi bộ sưu tập các phiên bản văn bản đã tìm kiếm đã sẵn sàng, một đối tượng StrikeOutAnnotation được tạo bằng cách cung cấp trang PDF đích và hình chữ nhật cho phiên bản văn bản đã chọn sẽ bị gạch bỏ. Bằng cách này, bạn có thể chỉ loại bỏ các trường hợp đã chọn của văn bản tìm kiếm hoặc phân tích cú pháp qua toàn bộ bộ sưu tập và loại bỏ tất cả các trường hợp.
Bài viết này đã dạy cho chúng tôi một tính năng thú vị để tự động gạch bỏ một văn bản cụ thể trên một trang hoặc tất cả các trang của tệp PDF. Nếu bạn muốn tìm hiểu quy trình tìm và thay thế văn bản trong PDF, hãy tham khảo bài viết trên cách tìm và thay thế văn bản trong PDF bằng Java.