Hoe afbeeldingen uit een PDF in Python te krijgen

Dit onderwerp behandelt details over hoe u afbeeldingen uit een PDF kunt halen in Python met behulp van configuratiestappen en een uitvoerbare voorbeeldcode. Volledige programmacode wordt gedeeld die kan worden gebruikt om deze applicatie te ontwikkelen, aangezien alle vereiste klassen en methoden worden verstrekt die nodig zijn om afbeeldingen uit PDF in Python te krijgen in verschillende formaten zoals PNG, JPEG, enz. Je zult ook verschillende opties zien om het proces te verbeteren door de gegenereerde afbeeldingen aan te passen nadat je ze hebt geopend vanuit het PDF-bestand.

Stappen om PDF-afbeeldingen in Python te krijgen

  1. Configureer de IDE om Aspose.PDF voor Python via .NET te gebruiken om afbeeldingen uit een PDF te extraheren
  2. Open het bron-PDF-bestand met afbeeldingen erin met behulp van het Document klasse-object
  3. Toegang tot een bepaalde afbeelding binnen de paginabronnen met behulp van het XImage klasse-object
  4. Genereer een nieuwe bestandsstroom met de naam van de gewenste afbeelding
  5. Sla de afbeelding op als JPEG-bestand op de schijf

Deze stappen houden in * hoe een afbeelding uit PDF in Python te krijgen * door een stapsgewijze aanpak bloot te leggen waarbij we eerst het PDF-bronbestand openen en vervolgens een bepaalde pagina in de PDF openen. Voor elke PDF-pagina is er een verzameling bronnen inclusief afbeeldingen waarnaar kan worden verwezen met behulp van een index. Zodra de vereiste afbeeldingsreferentie is geopend met behulp van een instantie van het XImage-klasseobject, kan deze worden opgeslagen als een afbeelding op de schijf met behulp van een instantie van de geheugenstroom.

Code om een afbeelding van een PDF in Python te krijgen

Deze code toont de procedure om * afbeelding uit PDF in Python te halen * door deze te openen in het documentklasseobject en vervolgens te laden toegang te krijgen tot de gewenste afbeelding op een bepaalde pagina door toegang te krijgen tot de lijst met bronnen Zodra we toegang hebben tot de gewenste afbeelding, we kan het hernoemen en kan ook wijzigingen aanbrengen in de verwijzingen in het document. U hebt ook toegang tot verschillende eigenschappen, zoals naam, breedte en hoogte, om de afbeeldingen te filteren voordat u ze opslaat als een bestand op de schijf.

Dit voorbeeld heeft ons geholpen om afbeeldingen uit een PDF-pagina te extraheren. Als je meer wilt weten over het proces om een watermerk toe te voegen aan een PDF-bestand, raadpleeg dan het artikel op hoe watermerk aan PDF toe te voegen in Python.

 Nederlands