Այս արագ ձեռնարկը ձեզ ուղղորդում է ինչպես ջնջել տեքստը Adobe PDF-ում` օգտագործելով Python: Այն կիսում է բոլոր անհրաժեշտ քայլերը շրջակա միջավայրը հաստատելու համար և քայլերի ցանկը, որոնք պետք է հետևել, ինչպես նաև գործարկվող օրինակելի կոդը, որը ցույց է տալիս ինչպես հարվածել Adobe Acrobat-ում Python-ի միջոցով: Դուք կսովորեք հավելվածը զրոյից մշակելու գործընթացը՝ օգտագործելով API-ի մի քանի զանգեր, ինչպես նաև բոլոր քայլերի նկարագրությունը:
Adobe PDF-ում Python-ի միջոցով տեքստը հեռացնելու քայլեր
- Տեքստը ջնջելու համար IDE-ն դրեք օգտագործել Aspose.PDF-ը Python-ի համար .NET-ի միջոցով
- Բեռնել սկզբնաղբյուր PDF ֆայլը, որտեղ որոշ տեքստ պետք է ջնջվի Document դասի օբյեկտի միջոցով
- Սահմանեք որոնման բառը PDF-ում՝ օգտագործելով TextFragmentAbsorber դասի օբյեկտը
- Գործարկեք visit() մեթոդը նպատակային էջում՝ թիրախ բառի օրինակները որոնելու համար
- Ստեղծեք StrikeOutAnnotation օբյեկտ՝ օգտագործելով որոնված բառի առաջին օրինակի ուղղանկյուն տարածքը
- Նախքան այն էջի ծանոթագրությունների հավաքածուին ավելացնելը, սահմանեք գրված ծանոթագրության գույնը և վերնագիրը
- Պահպանեք ստացված PDF ֆայլը՝ ցանկալի բառի առաջին հայտնման դեպքում
Այս քայլերը սահմանում են ինչպես հեռացնել տեքստը PDF-ում Python-ի միջոցով: Այն պահանջում է բեռնել թիրախային PDF ֆայլը և այնուհետև փնտրել ցանկալի բառի երևույթները, որը պետք է ջնջվի որոշակի էջում: Որոնումն ավարտվելուց հետո առաջին երևույթի ուղղանկյուն տարածքն օգտագործվում է StrikeOutAnnotation օբյեկտի օրինականացման համար, որն իրականում կստեղծի ցանկալի գույն ունեցող տեքստի վրա գրված տող, և անհրաժեշտության դեպքում վերնագիր:
Կոդ՝ PDF-ում տեքստը հեռացնելու համար Python-ի միջոցով
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Load the PDF file | |
pdfDocument = pdf.Document("SamplePdfFile.pdf") | |
# Define search word in TextFragmentAbsorber object | |
tfa = pdf.text.TextFragmentAbsorber("Signature") | |
# Search all occurrences of the word | |
tfa.visit(pdfDocument.pages[1]) | |
# Instantiate a StrikeOutAnnotation object and set its properties | |
strikeOutAnnotation = pdf.annotations.StrikeOutAnnotation(pdfDocument.pages[1],tfa.text_fragments[1].rectangle) | |
strikeOutAnnotation.title = "KB Aspose user" | |
strikeOutAnnotation.color = pdf.Color.red | |
# Add strike out annotation to the page | |
pdfDocument.pages[1].annotations.add(strikeOutAnnotation, True) | |
# Save the PDF | |
pdfDocument.save("PdfWithStrikeText.pdf") | |
print("PDF text strike operation completed successfully") |
Կոդի այս նմուշը կարող է օգտագործվել որպես ամբողջական հավելվածի հիմք՝ *Adobe Acrobat-ում Python-ի միջոցով * հարվածելու համար: Օգտագործեք TextFragmentAbsorber դասը որոշակի էջում թիրախ բառը որոնելու համար՝ այդ բառի բոլոր երևույթների ցանկը ստանալու համար: Հաջորդ քայլում դուք պետք է ստեղծեք StrikeOutAnnotation օբյեկտ թիրախի առաջացման ուղղանկյուն հատվածում, որպեսզի գիծը ցուցադրվի այդ ընդգրկող ուղղանկյունի ներսում:
Այս կարճ ուղեցույցը մեզ սովորեցրել է PDF էջի վրա մեկ կամ մի քանի բառերի վրա ցուցադրել տողեր: Եթե ցանկանում եք սովորել PDF-ում աղյուսակ տեղադրելու գործընթացը, տես ինչպես տեղադրել աղյուսակ PDF-ում Python-ի միջոցով-ի հոդվածը: