Այս արագ ձեռնարկը ուղեցույց է տալիս ինչպես գտնել և փոխարինել տեքստը PDF-ում Python-ի միջոցով: Այն պարունակում է տեղեկատվություն IDE-ի կազմաձևման, քայլ առ քայլ մանրամասն գործընթացի և գործարկվող օրինակելի կոդ՝ բառը pdf-ում Python-ի միջոցով գտնելու և փոխարինելու համար: Դուք նաև կսովորեք տեքստը որոնելու և փոխարինելու տարբերակները PDF-ի բոլոր էջերում կամ որոշակի էջի վրա՝ ըստ հավելվածի պահանջների:
PDF-ում Python-ի միջոցով գտնելու և փոխարինելու քայլեր
- Տեքստը փոխարինելու համար միջավայրը դրեք օգտագործել Aspose.PDF-ը Python-ի համար .NET-ի միջոցով
- Ներբեռնեք թիրախային PDF ֆայլը՝ օգտագործելով Document դասի օբյեկտը, որտեղ տվյալները պետք է որոնվեն և փոխարինվեն։
- Սահմանեք տեքստը, որը պետք է որոնվի՝ օգտագործելով TextFragmentAbsorber դասի օբյեկտը
- Կիրառեք TextAbsorber-ը PDF-ի բոլոր էջերի համար՝ օգտագործելով Document.pages.accept() մեթոդը:
- Մուտք գործեք PDF-ի բոլոր որոնված տարրերի հավաքածուն TextFragmentAbsorber.text_fragments հատկության միջոցով
- Կրկնեք բոլոր որոնված տեքստի հատվածները և սահմանեք նոր արժեքներ՝ ըստ ձեր պահանջների
- Պահպանեք թարմացված PDF ֆայլը սկավառակի վրա՝ թարմացված տեքստով
Այս քայլերն ամփոփում են *բոլորը PDF-ում Python-ի միջոցով * գտնելու և փոխարինելու գործընթացը: TextFragmentAbsorber օբյեկտը հայտարարվում է՝ տրամադրելով տող, որը պետք է որոնվի, և այնուհետև կանչվում է Document.pages.accept() մեթոդը՝ PDF-ի բոլոր էջերը վերլուծելու և թիրախ բառը պարունակող տեքստի հատվածները հավաքելու համար: Երբ գտնված բառերի հավաքածուն պատրաստ է, այժմ դուք կարող եք փոխարինել բոլոր կամ ընտրված հատվածները նոր բառերով՝ ըստ ձեր կարիքների:
Կոդ՝ Python-ի միջոցով PDF-ում տեքստ գտնելու և փոխարինելու համար
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Open the PDF document | |
inputPDFFile = pdf.Document("input.pdf") | |
# Instantiate a TextFragmentAbsorber object | |
txtAbsorber = pdf.text.TextFragmentAbsorber("my_data") | |
# Search text | |
inputPDFFile.pages.accept(txtAbsorber) | |
# Get reference to the found list | |
textFragmentCollection = txtAbsorber.text_fragments | |
# Parse all the searched text fragments | |
for txtFragment in textFragmentCollection: | |
txtFragment.text = "MY_DATA" | |
# Save the output PDF | |
inputPDFFile.save("output.pdf") | |
print("Text found and replaced successfully") |
Այս կոդը ցույց է տալիս PDF որոնման առանձնահատկությունն իրականացնելու և Python-ի միջոցով տեքստը փոխարինելու գործընթացը: Այս կոդը օգտագործել է Document.pages.accept()մեթոդը՝ ամբողջ PDF-ում տեքստը որոնելու համար, սակայն եթե ցանկանում եք որոնել և փոխարինել տեքստը միայն որոշակի էջում, կարող եք ընտրել էջը՝ տրամադրելով էջի ինդեքսը Document.pages հավաքածուում: ապա զանգահարեք Page.accept() մեթոդը: Դուք կարող եք նաև օգտագործել TextSearchOptions դասի օբյեկտը որպես երկրորդ արգումենտ՝ TextFragmentAbsorber օբյեկտի օրինականացման ժամանակ որոնման գործողությունը հարմարեցնելու համար:
Այս հոդվածը մեզ սովորեցրել է գտնել և փոխարինել տեքստը PDF-ում: Եթե ցանկանում եք սովորել PDF-ում տեքստ գտնելու և ընդգծելու գործընթացը, տես ինչպես նշել PDF-ում Python-ի միջոցով-ի հոդվածը: