Kaip pašalinti vandenženklį iš PDF naudojant Python

Šioje trumpoje temoje aprašoma, kaip pašalinti vandenženklį iš PDF naudojant Python. Ji apima visus išteklius, reikalingus aplinkai sukurti, nuoseklią programos kūrimo procedūrą ir paleidžiamą kodo pavyzdį, skirtą pašalinti vandenženklio tekstą iš PDF naudojant Python. Taip pat patirsite darbą su įvairių tipų artefaktais puslapyje ir išfiltruosite reikiamų tipų artefaktus.

Veiksmai, kaip ištrinti vandenženklį iš PDF naudojant Python

  1. Sukurkite aplinką, kad pridėtumėte Aspose.PDF, skirtas Python per .NET į savo projektą, kad pašalintumėte vandens ženklą
  2. Norėdami ištrinti vandens ženklą, pasiekite šaltinio PDF failą naudodami Document klasės objektą
  3. Peržiūrėkite visus artifacts kiekviename dokumento puslapyje ir sudarykite vandens ženklo tipo artefaktų sąrašą
  4. Ištrinkite visus vandens ženklus, kai tik sąrašas bus užpildytas norimais artefaktais
  5. Pašalinę vandens ženklus, išsaugokite sugeneruotą PDF failą diske

Pirmiau minėti veiksmai paaiškina vandenženklio pašalinimo iš PDF dokumento naudojant Python procedūrą, atskleidžiant svarbius išteklius, klases, metodus ir ypatybes, kurių reikia kuriant šią programą. Iš pradžių šaltinio PDF failas įkeliamas naudojant dokumento klasės objektą, o tada perkeliami visi jo puslapiai. Kiekviename puslapyje tikrinami atitinkami artefaktai, ar nėra tipo vandens ženklo, ir išsaugomi sąraše, kad juos būtų galima pašalinti perėjimo pabaigoje.

Kodas vandens ženklui pašalinti iš PDF naudojant Python

import aspose.pdf as pdf
# Set the source directory path
filePath = "C://Words//"
# Load the license in your application to remove watermark
pdfWatermarkLicense = pdf.License()
pdfWatermarkLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic")
#Open the source PDF file with a watermark on it
document = pdf.Document(filePath + "watermarked.pdf")
#Create an array to save the watermark-type artifacts
artifactsToBeDeleted = []
#Parse through all the pages inside the loaded PDF file
for page in document.pages:
#Parse through all the artifacts inside the current page
for item in page.artifacts:
#Check if the type of the artifact is a watermark
if item.sub_type == pdf.Artifact.artifact_subtype.WATERMARK:
#Save the artifact reference in the array for deletion
artifactsToBeDeleted.add(item)
#Parse all the artifacts to be deleted
for item in artifactsToBeDeleted:
# Delete the current artifact
page.artifacts.delete(item)
#Save the resultant PDF file having no watermark in it
document.save(filePath + "withoutWatermark.pdf")
print("Watermark removed from PDF")

Šiame kode aprašyta procedūra, kaip sukurti vandens žymių šalinimo priemonę PDF formatu naudojant Python. Jis pasiekia kolekciją Page.artifacts, kad nustatytų vandens ženklo tipo artefaktus, lyginant ypatybę Subtype su skaitiklio reikšme Artifact.artifact_subtype.WATERMARK. Kai visi vandens ženklų artefaktai yra perkeliami ir surenkami sąraše, šis sąrašas išanalizuojamas ir atitinkami vandens ženklai ištrinami iš kiekvieno puslapio atskirai.

Ši trumpa tema padėjo mums ištrinti vandenženklį iš PDF naudojant Python. Jei norite sužinoti, kaip pašalinti parašą iš PDF, žr. straipsnį kaip pašalinti parašą iš PDF naudojant Python.

 Latviski