Този бърз урок ръководи как да маркирате в PDF с помощта на Python. Той съдържа всички подробности за установяване на средата, списък със стъпки за разработване на приложението и изпълним примерен код за разработване на PDF маркер с помощта на Python. Ще научите процеса чрез систематичен подход за изпълнение на тази задача заедно с опциите за персонализиране на маркирания текст според вашите изисквания.
Стъпки за маркиране на текст в PDF с помощта на Python
- Конфигурирайте средата на използвайте Aspose.PDF за Python чрез .NET, за да маркирате текст
- Заредете целевия PDF файл, където текстът трябва да бъде маркиран, като използвате обекта на клас Document
- Търсете текста на целевата страница с помощта на класа TextFragmentAbsorber
- Създайте подчертаващата анотация с помощта на клас HighlightAnnotation
- Посочете цвета за осветяване и други свойства, преди да го приложите
- Запазете получения PDF файл с маркиран текст
Тези стъпки помагат как да маркирате PDF файл с помощта на Python. В началото PDF файлът се зарежда и обектът от клас TextFragmentAbsorber се използва за указване на текста за търсене и след това намиране на всички екземпляри на целевия текст на избраната страница. В следващите стъпки HighlightAnnotation се използва за дефиниране на подчертаваща анотация за избраната страница и конкретен екземпляр от колекцията от низове, намерени на страницата, заедно със задаване на цвят на анотацията и други свойства, ако е необходимо.
Код за маркиране на PDF документ с помощта на Python
import aspose.pdf as pdf | |
# Load the license | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Load the PDF | |
doc = pdf.Document("sample_input.pdf") | |
# Search target text to highlight | |
textFragmentAbsorber = pdf.text.TextFragmentAbsorber("PowerPoint") | |
doc.pages[1].accept(textFragmentAbsorber) | |
# Create a highlight annotation | |
ha = pdf.annotations.HighlightAnnotation(doc.pages[1], textFragmentAbsorber.text_fragments[1].rectangle) | |
# Specify highlight color | |
ha.color = pdf.Color.yellow | |
# Add annotation to highlight text in PDF | |
doc.pages[1].annotations.add(ha,True) | |
# Save the document | |
doc.save("PDF_with_Highlighted_Text.pdf") | |
print("Text searched and highlighted successfully") |
Този код демонстрира как да маркирате текст в PDF с помощта на Python. Той използва конструктора TextFragmentAbsorber, за да посочи низа, който трябва да се търси в целевата страница и след това методът accept() се използва за създаване на колекция от екземпляри на този низ на целевата страница. По подобен начин конструкторът HighlightAnnotation се използва за указване на страницата и областта, където трябва да се покаже подчертаващата анотация, като се използва правоъгълникът около целевия низ.
Тази статия ни научи как да маркираме PDF документ с помощта на Python. Ако искате да научите процеса за зачеркване на текст в PDF, вижте статията на как да зачертаете текст в Adobe PDF с помощта на Python.