Tento rychlý výukový program jak najít a nahradit text v PDF pomocí Pythonu. Obsahuje informace o konfiguraci IDE, podrobný postup po krocích a spustitelný ukázkový kód pro vyhledání a nahrazení slova v pdf pomocí Pythonu. Dozvíte se také možnosti vyhledávání a nahrazování textu na všech stránkách PDF nebo na konkrétní stránce podle požadavků aplikace.
Kroky k nalezení a nahrazení v PDF pomocí Pythonu
- Chcete-li text nahradit, nastavte prostředí na použijte Aspose.PDF pro Python přes .NET
- Načtěte cílový soubor PDF pomocí objektu třídy Document, kde mají být data prohledávána a nahrazena
- Definujte text, který se má prohledávat, pomocí objektu třídy TextFragmentAbsorber
- Použijte TextAbsorber pro všechny stránky v PDF pomocí metody Document.pages.accept().
- Získejte přístup ke sbírce všech vyhledaných položek v PDF prostřednictvím vlastnosti TextFragmentAbsorber.text_fragments
- Iterujte všechny hledané textové fragmenty a nastavte nové hodnoty podle vašich požadavků
- Uložte aktualizovaný soubor PDF na disk s aktualizovaným textem
Tyto kroky shrnují proces najít a nahradit vše v PDF pomocí Pythonu. Objekt TextFragmentAbsorber je deklarován poskytnutím řetězce, který má být prohledán, a poté je zavolána metoda Document.pages.accept(), která analyzuje všechny stránky v PDF a shromáždí textové fragmenty obsahující cílové slovo. Jakmile je kolekce nalezených slov připravena, nyní můžete nahradit všechny nebo vybrané fragmenty novými slovy podle svých potřeb.
Kód pro vyhledání a nahrazení textu v PDF pomocí Pythonu
Tento kód demonstruje proces implementace funkce PDF vyhledávání a nahrazování textu pomocí Pythonu. Tento kód používá metodu Document.pages.accept() k prohledávání textu v celém PDF, pokud však chcete hledat a nahradit text pouze na konkrétní stránce, můžete stránku vybrat poskytnutím indexu stránky v kolekci Document.pages. a pak zavolejte metodu Page.accept(). Můžete také použít objekt třídy TextSearchOptions jako druhý argument při vytváření instance objektu TextFragmentAbsorber k přizpůsobení operace vyhledávání.
Tento článek nás naučil najít a nahradit text v PDF. Pokud se chcete naučit proces hledání a zvýraznění textu v PDF, přečtěte si článek na jak zvýraznit v PDF pomocí Pythonu.