Como remover marca d'água de PDF usando Python

Este breve tópico descreve como remover marca d’água de PDF usando Python. Ele engloba todos os recursos necessários para estabelecer o ambiente, um procedimento passo a passo para desenvolver o aplicativo e um código de amostra executável para remover o texto da marca d’água do PDF usando Python. Você também experimentará trabalhar com diferentes tipos de artefatos em uma página e filtrar os artefatos dos tipos necessários.

Etapas para excluir marca d’água de PDF usando Python

  1. Estabeleça o ambiente para adicionar Aspose.PDF para Python via .NET ao seu projeto para remover a marca d’água
  2. Acesse o arquivo PDF de origem usando o objeto de classe Document para excluir a marca d’água
  3. Percorra todos os artifacts em cada página do documento e faça uma lista de artefatos do tipo marca d’água
  4. Exclua todas as marcas d’água, assim que a lista for preenchida com os artefatos desejados
  5. Salve o arquivo PDF gerado no disco depois de remover as marcas d’água

As etapas mencionadas explicam o procedimento para remover marca d’água do documento PDF usando Python, expondo os recursos, classes, métodos e propriedades importantes necessários durante o desenvolvimento deste aplicativo. Inicialmente, o arquivo PDF de origem é carregado usando o objeto de classe Document e, em seguida, todas as suas páginas são percorridas. Para cada página, os respectivos artefatos são verificados quanto ao tipo marca d’água e salvos em uma lista para remoção no final da travessia.

Código para remover marca d’água de PDF usando Python

import aspose.pdf as pdf
# Set the source directory path
filePath = "C://Words//"
# Load the license in your application to remove watermark
pdfWatermarkLicense = pdf.License()
pdfWatermarkLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic")
#Open the source PDF file with a watermark on it
document = pdf.Document(filePath + "watermarked.pdf")
#Create an array to save the watermark-type artifacts
artifactsToBeDeleted = []
#Parse through all the pages inside the loaded PDF file
for page in document.pages:
#Parse through all the artifacts inside the current page
for item in page.artifacts:
#Check if the type of the artifact is a watermark
if item.sub_type == pdf.Artifact.artifact_subtype.WATERMARK:
#Save the artifact reference in the array for deletion
artifactsToBeDeleted.add(item)
#Parse all the artifacts to be deleted
for item in artifactsToBeDeleted:
# Delete the current artifact
page.artifacts.delete(item)
#Save the resultant PDF file having no watermark in it
document.save(filePath + "withoutWatermark.pdf")
print("Watermark removed from PDF")

Este código exibe o procedimento para desenvolver um removedor de marca d’água em PDF usando Python. Ele acessa a coleção Page.artifacts para identificar os artefatos do tipo marca d’água comparando a propriedade Subtype com o valor do enumerador Artifact.artifact_subtype.WATERMARK. Depois que todos os artefatos de marca d’água são percorridos e coletados dentro de uma lista, essa lista é analisada e as respectivas marcas d’água são excluídas de cada página separadamente.

Este tópico rápido nos guiou para apagar marca d’água de PDF usando Python. Se você quiser aprender o processo para remover a assinatura do PDF, consulte o artigo em como remover assinatura de PDF usando Python.

 Português