Ten krótki temat opisuje jak usunąć znak wodny z PDF za pomocą Pythona. Obejmuje wszystkie zasoby wymagane do stworzenia środowiska, procedurę tworzenia aplikacji krok po kroku oraz uruchamialny przykładowy kod do usuwania tekstu znaku wodnego z pliku PDF za pomocą języka Python. Doświadczysz także pracy z różnymi typami artefaktów na stronie i filtrowania artefaktów wymaganych typów.
Kroki, aby usunąć znak wodny z pliku PDF za pomocą Pythona
- Stwórz środowisko, aby dodać Aspose.PDF dla Pythona przez .NET do swojego projektu, aby usunąć znak wodny
- Uzyskaj dostęp do źródłowego pliku PDF za pomocą obiektu klasy Document, aby usunąć znak wodny
- Przejrzyj wszystkie artifacts na każdej stronie dokumentu i sporządź listę artefaktów typu znak wodny
- Usuń wszystkie znaki wodne, gdy lista zostanie wypełniona żądanymi artefaktami
- Zapisz wygenerowany plik PDF na dysku po usunięciu znaków wodnych
Powyższe kroki wyjaśniają procedurę usuwania znaku wodnego z dokumentu PDF za pomocą Pythona poprzez ujawnienie ważnych zasobów, klas, metod i właściwości wymaganych podczas tworzenia tej aplikacji. Początkowo źródłowy plik PDF jest ładowany przy użyciu obiektu klasy Dokument, a następnie przeglądane są wszystkie jego strony. Dla każdej strony odpowiednie artefakty są sprawdzane pod kątem typu znaku wodnego i zapisywane na liście do usunięcia na końcu przeglądania.
Kod do usuwania znaku wodnego z pliku PDF za pomocą Pythona
import aspose.pdf as pdf | |
# Set the source directory path | |
filePath = "C://Words//" | |
# Load the license in your application to remove watermark | |
pdfWatermarkLicense = pdf.License() | |
pdfWatermarkLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic") | |
#Open the source PDF file with a watermark on it | |
document = pdf.Document(filePath + "watermarked.pdf") | |
#Create an array to save the watermark-type artifacts | |
artifactsToBeDeleted = [] | |
#Parse through all the pages inside the loaded PDF file | |
for page in document.pages: | |
#Parse through all the artifacts inside the current page | |
for item in page.artifacts: | |
#Check if the type of the artifact is a watermark | |
if item.sub_type == pdf.Artifact.artifact_subtype.WATERMARK: | |
#Save the artifact reference in the array for deletion | |
artifactsToBeDeleted.add(item) | |
#Parse all the artifacts to be deleted | |
for item in artifactsToBeDeleted: | |
# Delete the current artifact | |
page.artifacts.delete(item) | |
#Save the resultant PDF file having no watermark in it | |
document.save(filePath + "withoutWatermark.pdf") | |
print("Watermark removed from PDF") |
Ten kod przedstawia procedurę tworzenia usuwania znaków wodnych w formacie PDF przy użyciu języka Python. Uzyskuje dostęp do kolekcji Page.artifacts w celu zidentyfikowania artefaktów typu znaku wodnego przez porównanie właściwości Subtype z wartością modułu wyliczającego Artifact.artifact_subtype.WATERMARK. Gdy wszystkie artefakty znaku wodnego zostaną przejrzane i zebrane na liście, ta lista jest następnie analizowana, a odpowiednie znaki wodne są usuwane z każdej strony osobno.
Ten szybki temat poprowadził nas do usuwania znaku wodnego z pliku PDF za pomocą Pythona. Jeśli chcesz poznać proces usuwania podpisu z pliku PDF, zapoznaj się z artykułem na stronie jak usunąć podpis z pliku PDF za pomocą Pythona.