Tento článek popisuje, jak extrahovat tabulku z PDF do Excel pomocí Pythonu. Obsahuje všechny podrobnosti pro využití obou produktů, tj. Aspose.PDF a Aspose.Buňky, seznam kroků a ukázkový kód pro extrahování tabulky Excel z PDF pomocí Pythonu. Ukázkový kód demonstruje kompletní proces přenesením tabulky z PDF stránky do listu Excel.
Kroky k extrakci tabulky z PDF do Excelu pomocí Pythonu
- Nastavte prostředí pro instalaci Aspose.Total For Python via .NET
- Použijte licenci pro příslušné importované knihovny, tj. Aspose.Buňky a Aspose.PDF
- Načtěte zdrojový PDF soubor s tabulkami pomocí objektu třídy Document
- Vytvořte prázdný soubor Excel pomocí třídy Workbook a nastavte název první listu
- Procházejte každou stránku ve sbírce stránek v PDF souboru
- Přistupte ke kolekci tabulek a projděte každou buňku v tabulce
- Načtěte text z buňky PDF a zkopírujte jej do příslušné buňky v listu Excelu
- Uložte soubor Excel na disk s tabulkovými daty z PDF
Tyto kroky zahrnují proces extrahování dat z PDF tabulky do Excelu pomocí Pythonu. Načtěte potřebné knihovny, načtěte zdrojový PDF soubor, přistupte k jednotlivým stránkám a kolekci tabulek v něm a projděte všechny tabulky. Nakonec přistupte k jednotlivým buňkám v PDF tabulce a uložte jejich obsah do odpovídající buňky ve výstupním listu Excelu.
Kód pro načtení tabulky z PDF do Excelu pomocí Pythonu
Tento kód ukazuje, jak získat tabulku z PDF do Excelu pomocí Pythonu. Můžete vyzkoušet jiný engine pro rozpoznávání tabulek pomocí možnosti use_flow_engine ve třídě TableAbsorber k detekci tabulek bez okrajů v PDF. Použijte text_state v absorbované buňce k získání názvu písma, velikosti, barvy pozadí, barvy popředí a tučného kurzívního stylu pro přizpůsobení formátu cílové buňky v Excelu, aby formát tabulek byl podobný v obou souborech.
Tento článek pomohl pochopit proces převodu tabulky PDF do Excelu. Pro instalaci Pythonu k spuštění Aspose.PDF pro Python přes ..NET – podívejte se na článek „Jak nainstalovat Python pro spuštění Aspose“.PDF pro Python přes .NET]( https://kb.aspose.com/ cs/total/python/how-to-install-python-to-run-aspose-pdf-for-python-via-net/).