Comment obtenir des images à partir d'un PDF en Python

Cette rubrique couvre les détails sur comment obtenir des images à partir d’un PDF en Python à l’aide d’étapes de configuration et d’un exemple de code exécutable. Le code de programme complet est partagé et peut être utilisé pour développer cette application car toutes les classes et méthodes requises sont fournies pour obtenir des images à partir de PDF en Python dans différents formats tels que PNG, JPEG, etc. Vous observerez également différentes options pour améliorer le processus en personnalisant les images générées après y avoir accédé à partir du fichier PDF.

Étapes pour obtenir des images PDF en Python

  1. Configurez l’IDE pour utiliser Aspose.PDF pour Python via .NET afin d’extraire des images d’un PDF
  2. Accédez au fichier PDF source contenant des images à l’aide de l’objet de classe Document
  3. Accéder à une image particulière dans les ressources de la page à l’aide de l’objet de classe XImage
  4. Générer un nouveau flux de fichier en utilisant le nom de l’image souhaitée
  5. Enregistrez l’image en tant que fichier JPEG sur le disque

Ces étapes impliquent * comment obtenir une image à partir d’un PDF en Python * en exposant une approche étape par étape où nous ouvrons d’abord le fichier PDF source, puis accédons à une page particulière à l’intérieur du PDF. Pour chaque page PDF, il existe une collection de ressources comprenant des images auxquelles il est possible de se référer à l’aide d’un index. Une fois que la référence d’image requise est accessible à l’aide d’une instance de l’objet de classe XImage, elle peut être enregistrée en tant qu’image sur le disque à l’aide d’une instance du flux de mémoire.

Code pour obtenir une image à partir d’un PDF en Python

Ce code présente la procédure pour extraire l’image d’un PDF en Python en y accédant dans l’objet de classe Document, puis en chargeant l’accès à l’image souhaitée sur une page particulière en accédant à sa liste de ressources Une fois que nous avons accès à l’image souhaitée, nous peut le renommer et peut également apporter des modifications aux références dans le document. Vous pouvez également accéder à différentes propriétés telles que le nom, la largeur et la hauteur pour filtrer les images avant de les enregistrer sous forme de fichier sur le disque.

Cet exemple nous a guidé pour extraire des images d’une page PDF. Si vous souhaitez en savoir plus sur le processus d’ajout d’un filigrane dans un fichier PDF, consultez l’article sur comment ajouter un filigrane au PDF en Python.

 Français