Ovaj kratki vodič sadrži informacije o kako izdvojiti sve slike iz Word dokumenta u Pythonu. Pruža sve resurse za konfiguriranje okruženja i predstavlja važne API konstrukcije koje su potrebne za izvršenje zadatka, uključujući nazive klasa, metode i svojstva. Možete slijediti korake i napisati kompletan program za ekstrahiranje slika iz Word dokumenta u pythonu kao što je ekstrahiranje slika iz datoteke DOCX i spremanje kao vrsta slike PNG, JPG, itd. na disku.
Koraci za izdvajanje slika iz Word datoteke u Pythonu
- Konfigurirajte okruženje za korištenje Aspose.Words za Python putem .NET-a za izdvajanje slika
- Učitajte izvornu Word datoteku sa slikama pomoću objekta klase Document
- Dobijte popis svih oblika iz učitanog dokumenta pomoću metode get_child_nodes()
- Raščlanite sve elemente u zbirci oblika i otkrijte slike
- Stvorite jedinstvena imena datoteka za svaku otkrivenu sliku u zbirci oblika
- Spremite izdvojenu sliku na disk pod jedinstvenim imenom
Ovi koraci opisuju postupak izdvajanja slika iz Word dokumenta u Python dijeljenjem konfiguracije okruženja i koraka za pisanje programa. Nakon uspostavljanja okruženja, učitajte Word datoteku sa slikama pomoću objekta klase Document i preuzmite zbirku svih oblika iz nje. Budući da klasa Shape ima metode za otkrivanje slika, možete izdvojiti slike i spremiti ih na disk s navedenim imenom.
Kod za izdvajanje fotografija iz Word dokumenta u Pythonu
import aspose.words as aw | |
# Load the license | |
wordProtected = aw.License() | |
wordProtected.set_license("Aspose.Total.lic") | |
# Load a document | |
wordDocument = aw.Document("WordFileWithImages.docx") | |
# Get shapes collection | |
allShapes = wordDocument.get_child_nodes(aw.NodeType.SHAPE, True) | |
# Declare counter for images | |
index = 0 | |
# Iterate through all the shapes to detect and save images | |
for shape in allShapes: | |
# Type cast the node object to shape | |
shape = shape.as_shape() | |
if(shape.has_image): | |
index = index + 1 | |
# Prepare file name using the image counter and image type in the shape object | |
image_file_name = f"File.extract_images.{index}{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}" | |
# Save the extracted image on the disk | |
shape.image_data.save(image_file_name) | |
print ("Images extracted successfully from the Word file") |
Ovdje je predstavljen kod koji demonstrira proces ekstrahiranja slike iz Worda u Pythonu učitavanjem izvorne datoteke pomoću objekta klase dokumenta koji ima puno značajki kao što je davanje lozinke za zaštićene datoteke, postavljanje kodiranja i prilaganje upozorenja povratne pozive za kontrolu procesa učitavanja. Slično tome, metoda get_child_nodes() koristi se za izdvajanje oblika, međutim, možete dohvatiti i druge čvorove kao što su zaglavlja, podnožja, tablice, komentari, bilješke i tijelo itd.
Ovaj nas je članak vodio kako dohvatiti sve fotografije iz Word datoteke u Pythonu. Ako želite naučiti postupak umetanja fotografije u Word datoteku, pogledajte članak na kako umetnuti sliku u Word koristeći Python.