Este breve tópico descreve como remover marca d’água de PDF usando Python. Ele engloba todos os recursos necessários para estabelecer o ambiente, um procedimento passo a passo para desenvolver o aplicativo e um código de amostra executável para remover o texto da marca d’água do PDF usando Python. Você também experimentará trabalhar com diferentes tipos de artefatos em uma página e filtrar os artefatos dos tipos necessários.
Etapas para excluir marca d’água de PDF usando Python
- Estabeleça o ambiente para adicionar Aspose.PDF para Python via .NET ao seu projeto para remover a marca d’água
- Acesse o arquivo PDF de origem usando o objeto de classe Document para excluir a marca d’água
- Percorra todos os artifacts em cada página do documento e faça uma lista de artefatos do tipo marca d’água
- Exclua todas as marcas d’água, assim que a lista for preenchida com os artefatos desejados
- Salve o arquivo PDF gerado no disco depois de remover as marcas d’água
As etapas mencionadas explicam o procedimento para remover marca d’água do documento PDF usando Python, expondo os recursos, classes, métodos e propriedades importantes necessários durante o desenvolvimento deste aplicativo. Inicialmente, o arquivo PDF de origem é carregado usando o objeto de classe Document e, em seguida, todas as suas páginas são percorridas. Para cada página, os respectivos artefatos são verificados quanto ao tipo marca d’água e salvos em uma lista para remoção no final da travessia.
Código para remover marca d’água de PDF usando Python
import aspose.pdf as pdf | |
# Set the source directory path | |
filePath = "C://Words//" | |
# Load the license in your application to remove watermark | |
pdfWatermarkLicense = pdf.License() | |
pdfWatermarkLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic") | |
#Open the source PDF file with a watermark on it | |
document = pdf.Document(filePath + "watermarked.pdf") | |
#Create an array to save the watermark-type artifacts | |
artifactsToBeDeleted = [] | |
#Parse through all the pages inside the loaded PDF file | |
for page in document.pages: | |
#Parse through all the artifacts inside the current page | |
for item in page.artifacts: | |
#Check if the type of the artifact is a watermark | |
if item.sub_type == pdf.Artifact.artifact_subtype.WATERMARK: | |
#Save the artifact reference in the array for deletion | |
artifactsToBeDeleted.add(item) | |
#Parse all the artifacts to be deleted | |
for item in artifactsToBeDeleted: | |
# Delete the current artifact | |
page.artifacts.delete(item) | |
#Save the resultant PDF file having no watermark in it | |
document.save(filePath + "withoutWatermark.pdf") | |
print("Watermark removed from PDF") |
Este código exibe o procedimento para desenvolver um removedor de marca d’água em PDF usando Python. Ele acessa a coleção Page.artifacts para identificar os artefatos do tipo marca d’água comparando a propriedade Subtype com o valor do enumerador Artifact.artifact_subtype.WATERMARK. Depois que todos os artefatos de marca d’água são percorridos e coletados dentro de uma lista, essa lista é analisada e as respectivas marcas d’água são excluídas de cada página separadamente.
Este tópico rápido nos guiou para apagar marca d’água de PDF usando Python. Se você quiser aprender o processo para remover a assinatura do PDF, consulte o artigo em como remover assinatura de PDF usando Python.