Extraer una tabla de PDF a Excel usando Python

Este artículo describe cómo extraer una tabla de PDF a Excel usando Python. Contiene todos los detalles para utilizar ambos productos, es decir, Aspose.PDF y Aspose.Cells, una lista de pasos y un código de ejemplo para extraer una tabla de Excel de un PDF usando Python. El código de ejemplo demostrará el proceso completo al transferir la tabla de una página PDF a una hoja de Excel.

Pasos para extraer una tabla de PDF a Excel usando Python.

  1. Configura el entorno para instalar Aspose.Total For Python via .NET
  2. Aplique la licencia para las bibliotecas importadas relevantes, es decir, Aspose.Celdas y Aspose.PDF
  3. Carga el archivo PDF de origen con tablas usando el objeto de clase Document
  4. Crea un archivo Excel vacío usando la clase Workbook y establece un nombre para la primera hoja
  5. Recorrer cada página en la colección de páginas del archivo PDF
  6. Acceda a la colección de tablas y analice cada celda de la tabla
  7. Obtén el texto de la celda PDF y cópialo en la celda correspondiente de la hoja de Excel
  8. Guarda el archivo Excel en el disco con los datos de la tabla del PDF

Estos pasos implican el proceso para extraer datos de una tabla PDF a Excel usando Python. Importa las bibliotecas necesarias, carga el archivo PDF de origen, accede a cada página y a la colección de tablas en ella, y recorre todas las tablas. Finalmente, accede a cada celda en una tabla PDF y guarda su contenido en la celda correspondiente en la hoja de cálculo Excel de salida.

Código para extraer tabla de PDF a Excel usando Python

Este código demuestra cómo obtener tabla de PDF a Excel usando Python. Puede probar un motor de reconocimiento de tablas diferente usando la opción use_flow_engine en la clase TableAbsorber para detectar tablas sin bordes en el PDF. Utiliza el text_state en la celda absorbida para obtener el nombre de la fuente, el tamaño, el color de fondo, el color de primer plano y el estilo de negrita y cursiva, y así personalizar el formato de la celda de destino en Excel, manteniendo el formato de las tablas similar en ambos archivos.

Este artículo ha ayudado a comprender el proceso de transferir una tabla PDF a Excel. Para instalar Python y ejecutar Aspose.PDF para Python a través de .NET, consulte el artículo [Cómo instalar Python para ejecutar Aspose].PDF para Python a través de .NET]( https://kb.aspose.com/ es/total/python/how-to-install-python-to-run-aspose-pdf-for-python-via-net/).

 Español