Jak wyróżnić w pliku PDF za pomocą Pythona

Ten krótki samouczek pokazuje jak wyróżniać w PDF za pomocą Pythona. Zawiera wszystkie szczegóły potrzebne do ustanowienia środowiska, listę kroków potrzebnych do opracowania aplikacji oraz przykładowy kod do wykonania w celu opracowania zakreślacza PDF przy użyciu języka Python. Nauczysz się tego procesu poprzez systematyczne podejście do wykonywania tego zadania wraz z opcjami dostosowania podświetlonego tekstu do swoich wymagań.

Kroki, aby wyróżnić tekst w pliku PDF za pomocą Pythona

  1. Skonfiguruj środowisko do użyj Aspose.PDF dla Pythona przez .NET do podświetlania tekstu
  2. Załaduj docelowy plik PDF, w którym tekst ma być podświetlony, używając obiektu klasy Document
  3. Przeszukaj tekst na stronie docelowej za pomocą klasy TextFragmentAbsorber
  4. Utwórz adnotację wyróżnienia, używając klasy HighlightAnnotation
  5. Określ kolor podświetlenia i inne właściwości przed jego zastosowaniem
  6. Zapisz wynikowy plik PDF z podświetlonym tekstem

Te kroki pomagają wyróżnić plik PDF za pomocą Pythona. Na początku ładowany jest plik PDF i za pomocą obiektu klasy TextFragmentAbsorber określany jest tekst do wyszukania, a następnie odnajdywane są wszystkie wystąpienia tekstu docelowego na wybranej stronie. W kolejnych krokach funkcja HighlightAnnotation służy do zdefiniowania adnotacji podświetlenia dla wybranej strony i konkretnej instancji ze zbioru ciągów znalezionych na stronie wraz z ustawieniem koloru adnotacji i innych właściwości, jeśli jest to wymagane.

Kod do wyróżnienia dokumentu PDF za pomocą Pythona

import aspose.pdf as pdf
# Load the license
license = pdf.License()
license.set_license("Aspose.Total.lic")
# Load the PDF
doc = pdf.Document("sample_input.pdf")
# Search target text to highlight
textFragmentAbsorber = pdf.text.TextFragmentAbsorber("PowerPoint")
doc.pages[1].accept(textFragmentAbsorber)
# Create a highlight annotation
ha = pdf.annotations.HighlightAnnotation(doc.pages[1], textFragmentAbsorber.text_fragments[1].rectangle)
# Specify highlight color
ha.color = pdf.Color.yellow
# Add annotation to highlight text in PDF
doc.pages[1].annotations.add(ha,True)
# Save the document
doc.save("PDF_with_Highlighted_Text.pdf")
print("Text searched and highlighted successfully")

Ten kod demonstruje jak wyróżniać tekst w PDF za pomocą Pythona. Używa konstruktora TextFragmentAbsorber do określenia ciągu, który ma być przeszukiwany na stronie docelowej, a następnie metoda accept() jest używana do utworzenia kolekcji instancji tego ciągu na stronie docelowej. Podobnie konstruktor HighlightAnnotation jest używany do określenia strony i obszaru, w którym ma być wyświetlana adnotacja podświetlająca, za pomocą prostokąta wokół ciągu docelowego.

Ten artykuł nauczył nas jak wyróżniać dokument PDF za pomocą Pythona. Jeśli chcesz poznać proces przekreślania tekstu w pliku PDF, zapoznaj się z artykułem jak przekreślić tekst w Adobe PDF za pomocą Pythona.

 Polski