Ինչպես հեռացնել ջրանիշը PDF-ից Python-ի միջոցով

Այս կարճ թեման նկարագրում է ինչպես հեռացնել ջրանիշը PDF-ից` օգտագործելով Python: Այն ներառում է բոլոր ռեսուրսները, որոնք անհրաժեշտ են միջավայր ստեղծելու համար, հավելվածը մշակելու քայլ առ քայլ ընթացակարգ և գործարկվող կոդ՝ PDF-ից ջրի մակարդակի նշագծի տեքստը Python-ի միջոցով** հեռացնելու համար: Դուք նաև փորձ կունենաք աշխատել տարբեր տեսակի արտեֆակտների հետ էջի վրա և զտել պահանջվող տեսակների արտեֆակտները:

Փիթոնի միջոցով PDF-ից ջրանիշը ջնջելու քայլեր

  1. Ստեղծեք միջավայր՝ Aspose.PDF Python-ի համար .NET-ի միջոցով ավելացնելու համար ձեր նախագծում՝ ջրի մակարդակի նշագիծը հեռացնելու համար
  2. Մուտք գործեք սկզբնաղբյուր PDF ֆայլը՝ օգտագործելով Document դասի օբյեկտը ջրի մակարդակի նշագիծը ջնջելու համար
  3. Անցեք փաստաթղթի յուրաքանչյուր էջի բոլոր artifact-ով և կազմեք ջրանիշի տիպի արտեֆակտների ցուցակ
  4. Ջնջել բոլոր ջրանիշերը, երբ ցանկը լրացվի ցանկալի արտեֆակտներով
  5. Ստեղծված PDF ֆայլը ջրանիշները հեռացնելուց հետո պահեք սկավառակի վրա

Վերոհիշյալ քայլերը բացատրում են փայտոն փաստաթղթից ջրանիշը հեռացնելու ընթացակարգը՝ օգտագործելով Python՝ բացահայտելով այս հավելվածը մշակելիս պահանջվող կարևոր ռեսուրսները, դասերը, մեթոդները և հատկությունները: Սկզբում սկզբնաղբյուր PDF ֆայլը բեռնվում է Document դասի օբյեկտի միջոցով, այնուհետև դրա բոլոր էջերը անցնում են: Յուրաքանչյուր էջի համար համապատասխան արտեֆակտները ստուգվում են ջրանիշի տիպի համար և պահվում ցանկի մեջ՝ անցման վերջում հեռացնելու համար:

Կոդ՝ ջրի մակարդակի նշագիծը PDF-ից Python-ի միջոցով հեռացնելու համար

import aspose.pdf as pdf
# Set the source directory path
filePath = "C://Words//"
# Load the license in your application to remove watermark
pdfWatermarkLicense = pdf.License()
pdfWatermarkLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic")
#Open the source PDF file with a watermark on it
document = pdf.Document(filePath + "watermarked.pdf")
#Create an array to save the watermark-type artifacts
artifactsToBeDeleted = []
#Parse through all the pages inside the loaded PDF file
for page in document.pages:
#Parse through all the artifacts inside the current page
for item in page.artifacts:
#Check if the type of the artifact is a watermark
if item.sub_type == pdf.Artifact.artifact_subtype.WATERMARK:
#Save the artifact reference in the array for deletion
artifactsToBeDeleted.add(item)
#Parse all the artifacts to be deleted
for item in artifactsToBeDeleted:
# Delete the current artifact
page.artifacts.delete(item)
#Save the resultant PDF file having no watermark in it
document.save(filePath + "withoutWatermark.pdf")
print("Watermark removed from PDF")

Այս ծածկագիրը ցույց է տալիս PDF-ում ջրի նշանները հեռացնող սարք մշակելու ընթացակարգը՝ օգտագործելով Python: Այն մուտք է գործում Page.artifacts հավաքածու՝ ջրի մակարդակի նշագծի տիպի արտեֆակտները նույնականացնելու համար՝ համեմատելով Subtype հատկությունը թվարկիչի Artifact.artifact_subtype.WATERMARK արժեքի հետ: Երբ ջրանիշի բոլոր արտեֆակտները անցնում են և հավաքվում ցանկի ներսում, այս ցուցակն այնուհետև վերլուծվում է, և համապատասխան ջրանիշները ջնջվում են յուրաքանչյուր էջից առանձին:

Այս արագ թեման մեզ առաջնորդեց ջնջել ջրի մակարդակի նշագիծը PDF-ից Python-ի միջոցով: Եթե ցանկանում եք սովորել ստորագրությունը PDF-ից հեռացնելու գործընթացը, տես ինչպես հեռացնել ստորագրությունը PDF-ից Python-ի միջոցով-ի հոդվածը:

 Հայերեն