Այս արագ ձեռնարկը ուղեցույց է տալիս ինչպես ընդգծել PDF-ում Python-ի միջոցով: Այն պարունակում է բոլոր մանրամասները շրջակա միջավայրը հաստատելու համար, հավելվածը մշակելու քայլերի ցանկ և գործարկվող կոդ՝ PDF ընդգծող սարք մշակելու համար Python-ի միջոցով: Դուք կսովորեք գործընթացը համակարգված մոտեցման միջոցով՝ այս առաջադրանքը կատարելու համար, ինչպես նաև ընդգծված տեքստը ձեր պահանջներին համապատասխան հարմարեցնելու տարբերակները:
Python-ի միջոցով PDF-ում տեքստը ընդգծելու քայլեր
- Կազմաձևեք միջավայրը օգտագործել Aspose.PDF-ը Python-ի համար .NET-ի միջոցով՝ տեքստն ընդգծելու համար
- Բեռնեք թիրախային PDF ֆայլը, որտեղ տեքստը պետք է ընդգծվի՝ օգտագործելով Document դասի օբյեկտը
- Որոնեք տեքստը նպատակային էջում՝ օգտագործելով TextFragmentAbsorber դասը
- Ստեղծեք ընդգծված անոտացիա՝ օգտագործելով HighlightAnnotation դասը
- Նշեք ընդգծման գույնը և այլ հատկությունները նախքան այն կիրառելը
- Պահպանեք ստացված PDF ֆայլը ընդգծված տեքստով
Այս քայլերը օգնում են ինչպես ընդգծել PDF ֆայլը Python-ի միջոցով: Սկզբում PDF ֆայլը բեռնվում է, և TextFragmentAbsorber դասի օբյեկտը օգտագործվում է որոնվող տեքստը նշելու և այնուհետև ընտրված էջում գտնելու թիրախային տեքստի բոլոր օրինակները: Հետագա քայլերում HighlightAnnotation-ն օգտագործվում է ընտրված էջի և հատուկ օրինակի համար ընդգծված ծանոթագրություն սահմանելու համար էջում հայտնաբերված տողերի հավաքածուից, ինչպես նաև նշում է անոտացիայի գույնը և անհրաժեշտության դեպքում այլ հատկություններ:
Կոդ՝ Python-ի միջոցով PDF փաստաթուղթը ընդգծելու համար
import aspose.pdf as pdf | |
# Load the license | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Load the PDF | |
doc = pdf.Document("sample_input.pdf") | |
# Search target text to highlight | |
textFragmentAbsorber = pdf.text.TextFragmentAbsorber("PowerPoint") | |
doc.pages[1].accept(textFragmentAbsorber) | |
# Create a highlight annotation | |
ha = pdf.annotations.HighlightAnnotation(doc.pages[1], textFragmentAbsorber.text_fragments[1].rectangle) | |
# Specify highlight color | |
ha.color = pdf.Color.yellow | |
# Add annotation to highlight text in PDF | |
doc.pages[1].annotations.add(ha,True) | |
# Save the document | |
doc.save("PDF_with_Highlighted_Text.pdf") | |
print("Text searched and highlighted successfully") |
Այս կոդը ցույց է տալիս ինչպես ընդգծել տեքստը PDF-ում՝ օգտագործելով Python: Այն օգտագործում է TextFragmentAbsorber կոնստրուկտորը, որպեսզի նշի այն տողը, որը պետք է որոնվի նպատակային էջում, իսկ այնուհետև ընդունել() մեթոդը օգտագործվում է նպատակային էջում այս տողի օրինակների հավաքածու ստեղծելու համար: Նմանապես, HighlightAnnotation կոնստրուկտորն օգտագործվում է նշելու այն էջը և տարածքը, որտեղ պետք է ցուցադրվի ընդգծված անոտացիան՝ օգտագործելով թիրախ տողի շուրջ ուղղանկյունը:
Այս հոդվածը մեզ սովորեցրել է ինչպես կարևորել PDF փաստաթուղթը Python-ի միջոցով: Եթե ցանկանում եք սովորել PDF-ում որոշ տեքստ տպելու գործընթացը, տես ինչպես ջնջել տեքստը Adobe PDF-ում Python-ի միջոցով-ի հոդվածը: