Hur man tar bort vattenstämpel från PDF med Python

Det här korta ämnet beskriver hur man tar bort vattenstämpel från PDF med Python. Den omfattar alla resurser som krävs för att etablera miljön, en steg-för-steg-procedur för att utveckla applikationen och en körbar exempelkod för att ta bort vattenstämpeltext från PDF med Python. Du kommer också att uppleva att arbeta med olika typer av artefakter på en sida och filtrera bort artefakter av de typer som krävs.

Steg för att ta bort vattenstämpel från PDF med Python

  1. Skapa miljön för att lägga till Aspose.PDF för Python via .NET i ditt projekt för att ta bort vattenstämpeln
  2. Gå till PDF-källfilen med klassobjektet Document för att ta bort vattenstämpeln
  3. Gå igenom alla artifacts på varje sida i dokumentet och gör en lista över artefakter av vattenstämpeltyp
  4. Ta bort alla vattenstämplar när listan är fylld med de önskade artefakterna
  5. Spara den genererade PDF-filen på disken efter att du tagit bort vattenstämplarna

Ovannämnda steg förklarar proceduren för att ta bort vattenstämpel från PDF-dokument med Python genom att exponera de viktiga resurserna, klasserna, metoderna och egenskaperna som krävs under utvecklingen av denna applikation. Inledningsvis laddas käll-PDF-filen med hjälp av klassobjektet Document och sedan korsas alla dess sidor. För varje sida kontrolleras respektive artefakter för typen vattenstämpel och sparas i en lista för borttagning i slutet av genomgången.

Kod för att ta bort vattenstämpel från PDF med Python

import aspose.pdf as pdf
# Set the source directory path
filePath = "C://Words//"
# Load the license in your application to remove watermark
pdfWatermarkLicense = pdf.License()
pdfWatermarkLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic")
#Open the source PDF file with a watermark on it
document = pdf.Document(filePath + "watermarked.pdf")
#Create an array to save the watermark-type artifacts
artifactsToBeDeleted = []
#Parse through all the pages inside the loaded PDF file
for page in document.pages:
#Parse through all the artifacts inside the current page
for item in page.artifacts:
#Check if the type of the artifact is a watermark
if item.sub_type == pdf.Artifact.artifact_subtype.WATERMARK:
#Save the artifact reference in the array for deletion
artifactsToBeDeleted.add(item)
#Parse all the artifacts to be deleted
for item in artifactsToBeDeleted:
# Delete the current artifact
page.artifacts.delete(item)
#Save the resultant PDF file having no watermark in it
document.save(filePath + "withoutWatermark.pdf")
print("Watermark removed from PDF")

Den här koden visar proceduren för att utveckla en vattenmärkesborttagare i PDF med Python. Den får åtkomst till Page.artifacts-samlingen för att identifiera artefakter av vattenstämpeltyp genom att jämföra egenskapen Subtype med enumeratorvärdet Artifact.artifact_subtype.WATERMARK. När alla artefakter för vattenstämpeln har passerats och samlats in i en lista, analyseras denna lista och respektive vattenstämpel tas bort från varje sida separat.

Detta snabba ämne har väglett oss att radera vattenstämpel från PDF med Python. Om du vill lära dig processen för att ta bort signaturen från PDF, se artikeln om hur man tar bort signatur från PDF med Python.

 Svenska