Comment lire les métadonnées PDF en utilisant Python

Ce didacticiel rapide explique comment lire les métadonnées PDF à l’aide de Python. Il contient des informations détaillées pour définir l’environnement de développement de l’application, une procédure par étapes et un exemple de code exécutable pour extraire les métadonnées du PDF à l’aide de Python. Vous apprendrez à quel point il est facile d’écrire l’application et d’accéder aux informations de métadonnées à partir de PDF en utilisant très peu d’appels d’API sans installer d’outil tiers dans l’un des environnements pris en charge par Python.

Étapes pour lire les métadonnées PDF à l’aide de Python

  1. Établir l’environnement de utiliser Aspose.PDF pour Python via .NET pour lire les métadonnées
  2. Chargez le fichier PDF source à l’aide de l’objet de classe Document pour récupérer les métadonnées
  3. Accédez à l’objet de classe DocumentInfo contenant les métadonnées PDF
  4. Accéder à quelques propriétés d’informations et les afficher sur la console

Ces étapes décrivent le processus pour afficher les métadonnées PDF à l’aide de Python. Tout d’abord, vous devez charger le fichier PDF cible, puis accéder à la propriété DocumentInfo nommée Info dans la classe Document. Cet objet contient toutes les métadonnées du PDF telles que le créateur, le fuseau horaire de modification, le producteur, la date de création et la date de modification.

Code pour obtenir des métadonnées PDF en utilisant Python

Ce code illustre simplement la procédure pour récupérer les métadonnées PDF à l’aide de Python. L’objet de classe DocumentInfo est accessible à partir du document chargé qui contient un certain nombre d’informations de métadonnées telles que l’indicateur piégé, le titre, le sujet, les mots-clés du document et l’auteur. Si vous souhaitez ajouter ces propriétés, vous pouvez utiliser la méthode DocumentInfo.add(), utiliser la méthode clear() pour effacer les métadonnées et utiliser la méthode remove() pour supprimer uniquement les métadonnées spécifiées.

Cet article a décrit le processus de récupération des métadonnées du PDF. Si vous souhaitez apprendre le processus de lecture du contenu PDF, reportez-vous à l’article sur comment lire le contenu PDF en Python.

 Français