Jak získat obrázky z PDF v Pythonu

Toto téma obsahuje podrobnosti o tom, jak získat obrázky z PDF v Pythonu s pomocí konfiguračních kroků a spustitelného ukázkového kódu. Sdílí se kompletní programový kód, který lze použít k vývoji této aplikace, protože jsou poskytovány všechny požadované třídy a metody, které jsou potřeba k získání obrázků z PDF v Pythonu v různých formátech, jako je PNG, JPEG atd. Budete také pozorovat různé možnosti vylepšení procesu přizpůsobením generovaných obrázků poté, co k nim přistoupíte ze souboru PDF.

Kroky k získání obrázků PDF v Pythonu

  1. Nakonfigurujte IDE pro použití Aspose.PDF pro Python přes .NET k extrahování obrázků z PDF
  2. Získejte přístup ke zdrojovému souboru PDF s obrázky pomocí objektu třídy Document
  3. Získejte přístup ke konkrétnímu obrázku uvnitř zdrojů stránky pomocí objektu třídy XImage
  4. Vygenerujte nový datový proud souboru pomocí názvu požadovaného obrázku
  5. Uložte obrázek jako soubor JPEG na disk

Tyto kroky zahrnují jak získat obrázek z PDF v Pythonu vystavením přístupu krok za krokem, kdy nejprve otevřeme zdrojový soubor PDF a poté přistoupíme na konkrétní stránku v PDF. Pro každou stránku PDF existuje kolekce zdrojů včetně obrázků, na které lze odkazovat pomocí rejstříku. Jakmile je požadovaný odkaz na obrázek zpřístupněn pomocí instance objektu třídy XImage, lze jej uložit jako obrázek na disk pomocí instance toku paměti.

Kód pro získání obrázku z PDF v Pythonu

Tento kód ukazuje postup pro získání obrázku z PDF v Pythonu přístupem do objektu třídy Document a následným načtením přístupu k požadovanému obrázku na konkrétní stránce přístupem k jeho seznamu zdrojů Jakmile máme přístup k požadovanému obrázku, může jej přejmenovat a může také provádět změny v odkazech v dokumentu. Můžete také přistupovat k různým vlastnostem, jako je název, šířka a výška, pro filtrování obrázků před jejich uložením jako soubor na disk.

Tento příklad nás navedl k extrahování obrázků ze stránky PDF. Pokud se chcete dozvědět o procesu přidání vodoznaku do souboru PDF, přečtěte si článek na jak přidat vodoznak do PDF v Pythonu.

 Čeština