Deze korte handleiding bevat informatie over hoe u alle afbeeldingen uit een Word-document in Python kunt extraheren. Het biedt alle middelen om de omgeving te configureren en introduceert de belangrijke API-constructies die nodig zijn om de taak te volbrengen, inclusief de klassenamen, methoden en eigenschappen. U kunt de stappen volgen en een compleet programma schrijven om afbeeldingen uit een Word-document in python te extraheren, zoals het extraheren van afbeeldingen uit een DOCX-bestand en het opslaan als een afbeeldingstype PNG, JPG, enz. op de schijf.
Stappen om afbeeldingen uit een Word-bestand in Python te extraheren
- Configureer de omgeving om Aspose.Words voor Python via .NET te gebruiken om afbeeldingen te extraheren
- Laad het Word-bronbestand met afbeeldingen met behulp van het Document klasseobject
- Krijg een lijst van alle vormen van het geladen document met behulp van de get_child_nodes() methode
- Doorzoek alle elementen in de vormencollectie en detecteer afbeeldingen
- Maak unieke bestandsnamen voor elke gedetecteerde afbeelding in de vormenverzameling
- Sla de uitgepakte afbeelding op de schijf op met de unieke naam
Deze stappen beschrijven het proces om afbeeldingen uit een Word-document in Python te extraheren door de omgevingsconfiguratie en stappen om het programma te schrijven te delen. Nadat u de omgeving hebt ingesteld, laadt u het Word-bestand met afbeeldingen met behulp van het klasseobject Document en haalt u de verzameling van alle vormen eruit. Omdat de Shape-klasse methoden heeft om afbeeldingen te detecteren, kunt u de afbeeldingen extraheren en opslaan op de schijf met de opgegeven naam.
Code om foto’s uit Word-document in Python te extraheren
Hier wordt de code gepresenteerd die het proces demonstreert om * een afbeelding uit Word in Python * te extraheren door het bronbestand te laden met behulp van het Document-klasse-object dat veel functies heeft, zoals het verstrekken van het wachtwoord voor beveiligde bestanden, het instellen van de codering en het toevoegen van de waarschuwing callbacks om het laadproces te controleren. Op dezelfde manier wordt de methode get_child_nodes() gebruikt om vormen te extraheren, maar u kunt ook andere knooppunten ophalen, zoals kopteksten, voetteksten, tabellen, opmerkingen, voetnoten en hoofdtekst, enz.
Dit artikel heeft ons geholpen om alle foto’s uit een Word-bestand in Python op te halen. Als je het proces wilt leren om een foto in een Word-bestand in te voegen, raadpleeg dan het artikel op hoe een afbeelding in Word in te voegen met Python.