Comment obtenir des images à partir d'un PDF en Python

Cette rubrique couvre les détails sur comment obtenir des images à partir d’un PDF en Python à l’aide d’étapes de configuration et d’un exemple de code exécutable. Le code de programme complet est partagé et peut être utilisé pour développer cette application car toutes les classes et méthodes requises sont fournies pour obtenir des images à partir de PDF en Python dans différents formats tels que PNG, JPEG, etc. Vous observerez également différentes options pour améliorer le processus en personnalisant les images générées après y avoir accédé à partir du fichier PDF.

Étapes pour obtenir des images PDF en Python

Configurez l’IDE pour utiliser Aspose.PDF pour Python via .NET afin d’extraire des images d’un PDF
Accédez au fichier PDF source contenant des images à l’aide de l’objet de classe Document
Accéder à une image particulière dans les ressources de la page à l’aide de l’objet de classe XImage
Générer un nouveau flux de fichier en utilisant le nom de l’image souhaitée
Enregistrez l’image en tant que fichier JPEG sur le disque

Ces étapes impliquent * comment obtenir une image à partir d’un PDF en Python * en exposant une approche étape par étape où nous ouvrons d’abord le fichier PDF source, puis accédons à une page particulière à l’intérieur du PDF. Pour chaque page PDF, il existe une collection de ressources comprenant des images auxquelles il est possible de se référer à l’aide d’un index. Une fois que la référence d’image requise est accessible à l’aide d’une instance de l’objet de classe XImage, elle peut être enregistrée en tant qu’image sur le disque à l’aide d’une instance du flux de mémoire.

Code pour obtenir une image à partir d’un PDF en Python

	import aspose.pdf as pdf
	import aspose.pydrawing as drawing

	# Set the source directory path
	filePath = "C://Words//"

	# Load the license in your application to get images PDF
	pdfImageLicense = pdf.License()
	pdfImageLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic")

	#Load the PDF file to get the images
	pdfDocImage = pdf.Document(filePath + "PdfWithImage.pdf")

	#Get the desired image from the pages
	xImage = pdfDocImage.pages[1].resources.images[1]

	#Create a memory stream object to save image
	with open(filePath+"output.jpg", "wb") as stream:
	# Save the slide image as SVG on disk
	xImage.save(stream, drawing.imaging.ImageFormat.jpeg)

	print("Image saved from PDF")

view raw How to get Images from a PDF in Python.py hosted with ❤ by GitHub

Ce code présente la procédure pour extraire l’image d’un PDF en Python en y accédant dans l’objet de classe Document, puis en chargeant l’accès à l’image souhaitée sur une page particulière en accédant à sa liste de ressources Une fois que nous avons accès à l’image souhaitée, nous peut le renommer et peut également apporter des modifications aux références dans le document. Vous pouvez également accéder à différentes propriétés telles que le nom, la largeur et la hauteur pour filtrer les images avant de les enregistrer sous forme de fichier sur le disque.

Cet exemple nous a guidé pour extraire des images d’une page PDF. Si vous souhaitez en savoir plus sur le processus d’ajout d’un filigrane dans un fichier PDF, consultez l’article sur comment ajouter un filigrane au PDF en Python.

Aspose Base de connaissances

Trouver des réponses par l'API

Comment obtenir des images à partir d'un PDF en Python

Étapes pour obtenir des images PDF en Python

Code pour obtenir une image à partir d’un PDF en Python