Kako izdvojiti sve slike iz Word dokumenta u Pythonu

Ovaj kratki vodič sadrži informacije o kako izdvojiti sve slike iz Word dokumenta u Pythonu. Pruža sve resurse za konfiguriranje okruženja i predstavlja važne API konstrukcije koje su potrebne za izvršenje zadatka, uključujući nazive klasa, metode i svojstva. Možete slijediti korake i napisati kompletan program za ekstrahiranje slika iz Word dokumenta u pythonu kao što je ekstrahiranje slika iz datoteke DOCX i spremanje kao vrsta slike PNG, JPG, itd. na disku.

Koraci za izdvajanje slika iz Word datoteke u Pythonu

  1. Konfigurirajte okruženje za korištenje Aspose.Words za Python putem .NET-a za izdvajanje slika
  2. Učitajte izvornu Word datoteku sa slikama pomoću objekta klase Document
  3. Dobijte popis svih oblika iz učitanog dokumenta pomoću metode get_child_nodes()
  4. Raščlanite sve elemente u zbirci oblika i otkrijte slike
  5. Stvorite jedinstvena imena datoteka za svaku otkrivenu sliku u zbirci oblika
  6. Spremite izdvojenu sliku na disk pod jedinstvenim imenom

Ovi koraci opisuju postupak izdvajanja slika iz Word dokumenta u Python dijeljenjem konfiguracije okruženja i koraka za pisanje programa. Nakon uspostavljanja okruženja, učitajte Word datoteku sa slikama pomoću objekta klase Document i preuzmite zbirku svih oblika iz nje. Budući da klasa Shape ima metode za otkrivanje slika, možete izdvojiti slike i spremiti ih na disk s navedenim imenom.

Kod za izdvajanje fotografija iz Word dokumenta u Pythonu

import aspose.words as aw
# Load the license
wordProtected = aw.License()
wordProtected.set_license("Aspose.Total.lic")
# Load a document
wordDocument = aw.Document("WordFileWithImages.docx")
# Get shapes collection
allShapes = wordDocument.get_child_nodes(aw.NodeType.SHAPE, True)
# Declare counter for images
index = 0
# Iterate through all the shapes to detect and save images
for shape in allShapes:
# Type cast the node object to shape
shape = shape.as_shape()
if(shape.has_image):
index = index + 1
# Prepare file name using the image counter and image type in the shape object
image_file_name = f"File.extract_images.{index}{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}"
# Save the extracted image on the disk
shape.image_data.save(image_file_name)
print ("Images extracted successfully from the Word file")

Ovdje je predstavljen kod koji demonstrira proces ekstrahiranja slike iz Worda u Pythonu učitavanjem izvorne datoteke pomoću objekta klase dokumenta koji ima puno značajki kao što je davanje lozinke za zaštićene datoteke, postavljanje kodiranja i prilaganje upozorenja povratne pozive za kontrolu procesa učitavanja. Slično tome, metoda get_child_nodes() koristi se za izdvajanje oblika, međutim, možete dohvatiti i druge čvorove kao što su zaglavlja, podnožja, tablice, komentari, bilješke i tijelo itd.

Ovaj nas je članak vodio kako dohvatiti sve fotografije iz Word datoteke u Pythonu. Ako želite naučiti postupak umetanja fotografije u Word datoteku, pogledajte članak na kako umetnuti sliku u Word koristeći Python.

 Hrvatski