Այս արագ ձեռնարկը ուղեցույց է տալիս ինչպես գտնել և փոխարինել տեքստը PDF-ում Python-ի միջոցով: Այն պարունակում է տեղեկատվություն IDE-ի կազմաձևման, քայլ առ քայլ մանրամասն գործընթացի և գործարկվող օրինակելի կոդ՝ բառը pdf-ում Python-ի միջոցով գտնելու և փոխարինելու համար: Դուք նաև կսովորեք տեքստը որոնելու և փոխարինելու տարբերակները PDF-ի բոլոր էջերում կամ որոշակի էջի վրա՝ ըստ հավելվածի պահանջների:
PDF-ում Python-ի միջոցով գտնելու և փոխարինելու քայլեր
- Տեքստը փոխարինելու համար միջավայրը դրեք օգտագործել Aspose.PDF-ը Python-ի համար .NET-ի միջոցով
- Ներբեռնեք թիրախային PDF ֆայլը՝ օգտագործելով Document դասի օբյեկտը, որտեղ տվյալները պետք է որոնվեն և փոխարինվեն։
- Սահմանեք տեքստը, որը պետք է որոնվի՝ օգտագործելով TextFragmentAbsorber դասի օբյեկտը
- Կիրառեք TextAbsorber-ը PDF-ի բոլոր էջերի համար՝ օգտագործելով Document.pages.accept() մեթոդը:
- Մուտք գործեք PDF-ի բոլոր որոնված տարրերի հավաքածուն TextFragmentAbsorber.text_fragments հատկության միջոցով
- Կրկնեք բոլոր որոնված տեքստի հատվածները և սահմանեք նոր արժեքներ՝ ըստ ձեր պահանջների
- Պահպանեք թարմացված PDF ֆայլը սկավառակի վրա՝ թարմացված տեքստով
Այս քայլերն ամփոփում են *բոլորը PDF-ում Python-ի միջոցով * գտնելու և փոխարինելու գործընթացը: TextFragmentAbsorber օբյեկտը հայտարարվում է՝ տրամադրելով տող, որը պետք է որոնվի, և այնուհետև կանչվում է Document.pages.accept() մեթոդը՝ PDF-ի բոլոր էջերը վերլուծելու և թիրախ բառը պարունակող տեքստի հատվածները հավաքելու համար: Երբ գտնված բառերի հավաքածուն պատրաստ է, այժմ դուք կարող եք փոխարինել բոլոր կամ ընտրված հատվածները նոր բառերով՝ ըստ ձեր կարիքների:
Կոդ՝ Python-ի միջոցով PDF-ում տեքստ գտնելու և փոխարինելու համար
Այս կոդը ցույց է տալիս PDF որոնման առանձնահատկությունն իրականացնելու և Python-ի միջոցով տեքստը փոխարինելու գործընթացը: Այս կոդը օգտագործել է Document.pages.accept()մեթոդը՝ ամբողջ PDF-ում տեքստը որոնելու համար, սակայն եթե ցանկանում եք որոնել և փոխարինել տեքստը միայն որոշակի էջում, կարող եք ընտրել էջը՝ տրամադրելով էջի ինդեքսը Document.pages հավաքածուում: ապա զանգահարեք Page.accept() մեթոդը: Դուք կարող եք նաև օգտագործել TextSearchOptions դասի օբյեկտը որպես երկրորդ արգումենտ՝ TextFragmentAbsorber օբյեկտի օրինականացման ժամանակ որոնման գործողությունը հարմարեցնելու համար:
Այս հոդվածը մեզ սովորեցրել է գտնել և փոխարինել տեքստը PDF-ում: Եթե ցանկանում եք սովորել PDF-ում տեքստ գտնելու և ընդգծելու գործընթացը, տես ինչպես նշել PDF-ում Python-ի միջոցով-ի հոդվածը: