Jak extrahovat všechny obrázky z dokumentu Word v Pythonu

Tento rychlý tutoriál obsahuje informace o tom, jak extrahovat všechny obrázky z dokumentu Word v Pythonu. Poskytuje všechny prostředky pro konfiguraci prostředí a zavádí důležité konstrukce API, které jsou nutné ke splnění úkolu, včetně názvů tříd, metod a vlastností. Můžete postupovat podle kroků a napsat kompletní program pro extrahování obrázků z dokumentu Word v pythonu, jako je extrahování obrázků ze souboru DOCX a jeho uložení jako typ obrázku PNG, JPG atd. na disku.

Kroky k extrahování obrázků ze souboru Word v Pythonu

  1. Nakonfigurujte prostředí tak, aby k extrahování obrázků používalo Aspose.Words pro Python přes .NET
  2. Načtěte zdrojový soubor aplikace Word s obrázky pomocí objektu třídy Document
  3. Získejte seznam všech tvarů z načteného dokumentu pomocí metody get_child_nodes()
  4. Analyzujte všechny prvky v kolekci tvarů a detekujte obrázky
  5. Vytvořte jedinečné názvy souborů pro každý detekovaný obrázek v kolekci tvarů
  6. Uložte extrahovaný obrázek na disk s jedinečným názvem

Tyto kroky popisují proces extrahování obrázků z dokumentu Word v Pythonu sdílením konfigurace prostředí a kroků k napsání programu. Po vytvoření prostředí načtěte soubor aplikace Word s obrázky pomocí objektu třídy Document a získejte z něj kolekci všech tvarů. Protože třída Shape má metody pro detekci obrázků, můžete obrázky extrahovat a uložit na disk se zadaným názvem.

Kód pro extrahování fotografií z dokumentu Word v Pythonu

Zde je uveden kód, který demonstruje proces extrahování obrázku z Wordu v Pythonu načtením zdrojového souboru pomocí objektu třídy Document, který má mnoho funkcí, jako je poskytnutí hesla pro chráněné soubory, nastavení kódování a připojení varování. zpětná volání pro řízení procesu načítání. Podobně se metoda get_child_nodes() používá k extrahování tvarů, ale můžete načíst i další uzly, jako jsou záhlaví, zápatí, tabulky, komentáře, poznámky pod čarou a tělo atd.

Tento článek nás navedl k načtení všech fotografií ze souboru Word v Pythonu. Pokud se chcete naučit proces vložení fotografie do souboru aplikace Word, přečtěte si článek na jak vložit obrázek do Wordu pomocí Pythonu.

 Čeština