Come ottenere immagini da un PDF in Python

Questo argomento copre i dettagli su come ottenere immagini da un PDF in Python con l’aiuto di passaggi di configurazione e un codice di esempio eseguibile. Viene condiviso il codice completo del programma che può essere utilizzato per sviluppare questa applicazione poiché vengono fornite tutte le classi e i metodi richiesti necessari per ottenere immagini da PDF in Python in diversi formati come PNG, JPEG, ecc. Osserverai anche diverse opzioni per migliorare il processo personalizzando le immagini generate dopo avervi effettuato l’accesso dal file PDF.

Passaggi per ottenere immagini PDF in Python

  1. Configura l’IDE per utilizzare Aspose.PDF per Python tramite .NET per estrarre le immagini da un PDF
  2. Accedi al file PDF di origine contenente le immagini utilizzando l’oggetto di classe Document
  3. Accedi a una particolare immagine all’interno delle risorse della pagina utilizzando l’oggetto di classe XImage
  4. Genera un nuovo flusso di file utilizzando il nome dell’immagine desiderata
  5. Salva l’immagine come file JPEG sul disco

Questi passaggi implicano come ottenere un’immagine da PDF in Python esponendo un approccio passo-passo in cui prima apriamo il file PDF di origine e quindi accediamo a una particolare pagina all’interno del PDF. Per ogni pagina PDF, esiste una raccolta di risorse che include immagini a cui è possibile fare riferimento con l’aiuto di un indice. Una volta che si accede al riferimento all’immagine richiesto utilizzando un’istanza dell’oggetto della classe XImage, è possibile salvarlo come immagine sul disco utilizzando un’istanza del flusso di memoria.

Codice per ottenere un’immagine da un PDF in Python

import aspose.pdf as pdf
import aspose.pydrawing as drawing
# Set the source directory path
filePath = "C://Words//"
# Load the license in your application to get images PDF
pdfImageLicense = pdf.License()
pdfImageLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic")
#Load the PDF file to get the images
pdfDocImage = pdf.Document(filePath + "PdfWithImage.pdf")
#Get the desired image from the pages
xImage = pdfDocImage.pages[1].resources.images[1]
#Create a memory stream object to save image
with open(filePath+"output.jpg", "wb") as stream:
# Save the slide image as SVG on disk
xImage.save(stream, drawing.imaging.ImageFormat.jpeg)
print("Image saved from PDF")

Questo codice mostra la procedura per ottenere l’immagine dal PDF in Python accedendo ad esso nell’oggetto della classe Document e quindi caricando l’accesso all’immagine desiderata su una pagina particolare accedendo al suo elenco di risorse Una volta ottenuto l’accesso all’immagine desiderata, può rinominarlo e può anche apportare modifiche ai riferimenti all’interno del documento. Puoi anche accedere a diverse proprietà come nome, larghezza e altezza per filtrare le immagini prima di salvarle come file sul disco.

Questo esempio ci ha guidato ad estrarre immagini da una pagina PDF. Se sei interessato a conoscere il processo per aggiungere una filigrana in un file PDF, fai riferimento all’articolo su come aggiungere filigrana al PDF in Python.

 Italiano