Este tutorial rápido explica cómo leer metadatos PDF usando Python. Contiene información detallada para configurar el entorno para desarrollar la aplicación, un procedimiento paso a paso y un código de muestra ejecutable para extraer metadatos de PDF usando Python. Aprenderá lo fácil que es escribir la aplicación y acceder a la información de metadatos desde PDF utilizando muy pocas llamadas a la API sin instalar ninguna herramienta de terceros en ninguno de los entornos compatibles con Python.
Pasos para leer metadatos de PDF usando Python
- Establezca el entorno en use Aspose.PDF para Python a través de .NET para leer metadatos
- Cargue el archivo PDF de origen utilizando el objeto de clase Document para obtener metadatos
- Obtenga acceso al objeto de clase DocumentInfo que contiene los metadatos del PDF
- Acceda a algunas propiedades de información y muéstrelas en la consola
Estos pasos describen el proceso para ver metadatos PDF usando Python. Primero, debe cargar el archivo PDF de destino y luego acceder a la propiedad DocumentInfo denominada ‘Info’ en la clase Document. Este objeto tiene todos los metadatos del PDF, como el creador, la zona horaria de modificación, el productor, la fecha de creación y la fecha de modificación.
Código para obtener metadatos PDF usando Python
Este código simplemente demuestra el procedimiento para obtener metadatos PDF usando Python. Se accede al objeto de la clase DocumentInfo desde el documento cargado que tiene una cantidad de información de metadatos, como el indicador atrapado, el título, el asunto, las palabras clave del documento y el autor. Si desea agregar estas propiedades, puede usar el método DocumentInfo.add(), use el método clear() para borrar los metadatos y use el método remove() para eliminar solo los metadatos especificados.
Este artículo ha descrito el proceso para recuperar metadatos del PDF. Si desea conocer el proceso para leer el contenido de PDF, consulte el artículo sobre cómo leer contenido PDF en Python.