Ova kratka tema opisuje kako ukloniti vodeni žig s PDF pomoću Pythona. Obuhvaća sve resurse potrebne za uspostavljanje okruženja, postupak korak po korak za razvoj aplikacije i primjer koda za uklanjanje teksta vodenog žiga iz PDF-a pomoću Pythona. Također ćete iskusiti rad s različitim vrstama artefakata na stranici i filtriranje artefakata potrebnih vrsta.
Koraci za brisanje vodenog žiga iz PDF-a pomoću Pythona
- Uspostavite okruženje za dodavanje Aspose.PDF za Python putem .NET-a u svoj projekt kako biste uklonili vodeni žig
- Pristupite izvornoj PDF datoteci pomoću objekta klase Document za brisanje vodenog žiga
- Prođite kroz sve artifact na svakoj stranici dokumenta i napravite popis artefakata tipa vodenog žiga
- Izbrišite sve vodene žigove nakon što se popis popuni željenim artefaktima
- Spremite generiranu PDF datoteku na disk nakon uklanjanja vodenih žigova
Prethodno navedeni koraci objašnjavaju proceduru uklanjanja vodenog žiga s PDF dokumenta pomoću Pythona izlažući važne resurse, klase, metode i svojstva potrebna tijekom razvoja ove aplikacije. U početku se izvorna PDF datoteka učitava pomoću objekta klase Document, a zatim se obilaze sve njezine stranice. Za svaku stranicu, odgovarajući artefakti se provjeravaju za vrstu vodenog žiga i spremaju unutar popisa za uklanjanje na kraju obilaska.
Kod za uklanjanje vodenog žiga iz PDF-a pomoću Pythona
import aspose.pdf as pdf | |
# Set the source directory path | |
filePath = "C://Words//" | |
# Load the license in your application to remove watermark | |
pdfWatermarkLicense = pdf.License() | |
pdfWatermarkLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic") | |
#Open the source PDF file with a watermark on it | |
document = pdf.Document(filePath + "watermarked.pdf") | |
#Create an array to save the watermark-type artifacts | |
artifactsToBeDeleted = [] | |
#Parse through all the pages inside the loaded PDF file | |
for page in document.pages: | |
#Parse through all the artifacts inside the current page | |
for item in page.artifacts: | |
#Check if the type of the artifact is a watermark | |
if item.sub_type == pdf.Artifact.artifact_subtype.WATERMARK: | |
#Save the artifact reference in the array for deletion | |
artifactsToBeDeleted.add(item) | |
#Parse all the artifacts to be deleted | |
for item in artifactsToBeDeleted: | |
# Delete the current artifact | |
page.artifacts.delete(item) | |
#Save the resultant PDF file having no watermark in it | |
document.save(filePath + "withoutWatermark.pdf") | |
print("Watermark removed from PDF") |
Ovaj kôd prikazuje postupak za razvoj uklanjača vodenih žigova u PDF-u pomoću Pythona. Pristupa kolekciji Page.artifacts kako bi identificirao artefakte tipa vodenog žiga uspoređujući svojstvo Subtype s vrijednošću popisivača Artifact.artifact_subtype.WATERMARK. Nakon što se prođu svi artefakti vodenog žiga i sakupe unutar popisa, taj se popis zatim analizira i odgovarajući se vodeni žigovi brišu sa svake stranice zasebno.
Ova nas je kratka tema vodila do brisanja vodenog žiga iz PDF-a pomoću Pythona. Ako želite naučiti postupak uklanjanja potpisa iz PDF-a, pogledajte članak na kako ukloniti potpis iz PDF-a pomoću Pythona.