Այս կարճ թեման նկարագրում է ինչպես հեռացնել ջրանիշը PDF-ից` օգտագործելով Python: Այն ներառում է բոլոր ռեսուրսները, որոնք անհրաժեշտ են միջավայր ստեղծելու համար, հավելվածը մշակելու քայլ առ քայլ ընթացակարգ և գործարկվող կոդ՝ PDF-ից ջրի մակարդակի նշագծի տեքստը Python-ի միջոցով** հեռացնելու համար: Դուք նաև փորձ կունենաք աշխատել տարբեր տեսակի արտեֆակտների հետ էջի վրա և զտել պահանջվող տեսակների արտեֆակտները:
Փիթոնի միջոցով PDF-ից ջրանիշը ջնջելու քայլեր
- Ստեղծեք միջավայր՝ Aspose.PDF Python-ի համար .NET-ի միջոցով ավելացնելու համար ձեր նախագծում՝ ջրի մակարդակի նշագիծը հեռացնելու համար
- Մուտք գործեք սկզբնաղբյուր PDF ֆայլը՝ օգտագործելով Document դասի օբյեկտը ջրի մակարդակի նշագիծը ջնջելու համար
- Անցեք փաստաթղթի յուրաքանչյուր էջի բոլոր artifact-ով և կազմեք ջրանիշի տիպի արտեֆակտների ցուցակ
- Ջնջել բոլոր ջրանիշերը, երբ ցանկը լրացվի ցանկալի արտեֆակտներով
- Ստեղծված PDF ֆայլը ջրանիշները հեռացնելուց հետո պահեք սկավառակի վրա
Վերոհիշյալ քայլերը բացատրում են փայտոն փաստաթղթից ջրանիշը հեռացնելու ընթացակարգը՝ օգտագործելով Python՝ բացահայտելով այս հավելվածը մշակելիս պահանջվող կարևոր ռեսուրսները, դասերը, մեթոդները և հատկությունները: Սկզբում սկզբնաղբյուր PDF ֆայլը բեռնվում է Document դասի օբյեկտի միջոցով, այնուհետև դրա բոլոր էջերը անցնում են: Յուրաքանչյուր էջի համար համապատասխան արտեֆակտները ստուգվում են ջրանիշի տիպի համար և պահվում ցանկի մեջ՝ անցման վերջում հեռացնելու համար:
Կոդ՝ ջրի մակարդակի նշագիծը PDF-ից Python-ի միջոցով հեռացնելու համար
import aspose.pdf as pdf | |
# Set the source directory path | |
filePath = "C://Words//" | |
# Load the license in your application to remove watermark | |
pdfWatermarkLicense = pdf.License() | |
pdfWatermarkLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic") | |
#Open the source PDF file with a watermark on it | |
document = pdf.Document(filePath + "watermarked.pdf") | |
#Create an array to save the watermark-type artifacts | |
artifactsToBeDeleted = [] | |
#Parse through all the pages inside the loaded PDF file | |
for page in document.pages: | |
#Parse through all the artifacts inside the current page | |
for item in page.artifacts: | |
#Check if the type of the artifact is a watermark | |
if item.sub_type == pdf.Artifact.artifact_subtype.WATERMARK: | |
#Save the artifact reference in the array for deletion | |
artifactsToBeDeleted.add(item) | |
#Parse all the artifacts to be deleted | |
for item in artifactsToBeDeleted: | |
# Delete the current artifact | |
page.artifacts.delete(item) | |
#Save the resultant PDF file having no watermark in it | |
document.save(filePath + "withoutWatermark.pdf") | |
print("Watermark removed from PDF") |
Այս ծածկագիրը ցույց է տալիս PDF-ում ջրի նշանները հեռացնող սարք մշակելու ընթացակարգը՝ օգտագործելով Python: Այն մուտք է գործում Page.artifacts հավաքածու՝ ջրի մակարդակի նշագծի տիպի արտեֆակտները նույնականացնելու համար՝ համեմատելով Subtype հատկությունը թվարկիչի Artifact.artifact_subtype.WATERMARK արժեքի հետ: Երբ ջրանիշի բոլոր արտեֆակտները անցնում են և հավաքվում ցանկի ներսում, այս ցուցակն այնուհետև վերլուծվում է, և համապատասխան ջրանիշները ջնջվում են յուրաքանչյուր էջից առանձին:
Այս արագ թեման մեզ առաջնորդեց ջնջել ջրի մակարդակի նշագիծը PDF-ից Python-ի միջոցով: Եթե ցանկանում եք սովորել ստորագրությունը PDF-ից հեռացնելու գործընթացը, տես ինչպես հեռացնել ստորագրությունը PDF-ից Python-ի միջոցով-ի հոդվածը: