Ten krótki samouczek zawiera instrukcje dotyczące znajdowania i zastępowania tekstu w formacie PDF przy użyciu języka Python. Zawiera informacje o konfigurowaniu środowiska IDE, szczegółowy proces krok po kroku oraz przykładowy kod, który można uruchomić w celu znajdowania i zastępowania słów w formacie PDF przy użyciu języka Python. Poznasz również opcje wyszukiwania i zastępowania tekstu na wszystkich stronach PDF lub na określonej stronie zgodnie z wymaganiami aplikacji.
Kroki, aby znaleźć i zamienić w pliku PDF za pomocą Pythona
- Ustaw środowisko na użyj Aspose.PDF dla Pythona przez .NET, aby zastąpić tekst
- Załaduj docelowy plik PDF za pomocą obiektu klasy Document, w którym dane mają zostać wyszukane i zastąpione
- Zdefiniuj tekst, który ma być przeszukiwany za pomocą obiektu klasy TextFragmentAbsorber
- Zastosuj TextAbsorber do wszystkich stron w pliku PDF za pomocą metody Document.pages.accept()
- Uzyskaj dostęp do kolekcji wszystkich wyszukiwanych elementów w pliku PDF za pomocą właściwości TextFragmentAbsorber.text_fragments
- Przejrzyj wszystkie wyszukane fragmenty tekstu i ustaw nowe wartości zgodnie ze swoimi wymaganiami
- Zapisz zaktualizowany plik PDF na dysku ze zaktualizowanym tekstem
Te kroki podsumowują proces znajdowania i zastępowania wszystkiego w formacie PDF przy użyciu języka Python. Obiekt TextFragmentAbsorber jest deklarowany poprzez podanie ciągu, który ma zostać przeszukany, a następnie wywoływana jest metoda Document.pages.accept() w celu przeanalizowania wszystkich stron w pliku PDF i zebrania fragmentów tekstu zawierających słowo docelowe. Gdy kolekcja znalezionych słów jest gotowa, możesz teraz zastąpić wszystkie lub wybrane fragmenty nowymi słowami zgodnie z własnymi potrzebami.
Kod do znajdowania i zamieniania tekstu w formacie PDF przy użyciu języka Python
Ten kod demonstruje proces implementacji funkcji wyszukiwania i zastępowania tekstu w plikach PDF przy użyciu języka Python. Ten kod wykorzystał metodę Document.pages.accept() do wyszukiwania tekstu w całym pliku PDF, jednak jeśli chcesz wyszukać i zamienić tekst tylko na określonej stronie, możesz wybrać stronę, podając indeks strony w kolekcji Document.pages a następnie wywołaj metodę Page.accept(). Możesz także użyć obiektu klasy TextSearchOptions jako drugiego argumentu podczas tworzenia wystąpienia obiektu TextFragmentAbsorber w celu dostosowania operacji wyszukiwania.
Ten artykuł nauczył nas znajdowania i zastępowania tekstu w pliku PDF. Jeśli chcesz poznać proces znajdowania i wyróżniania tekstu w pliku PDF, zapoznaj się z artykułem jak wyróżnić w PDF za pomocą Pythona.