Как да извлечете всички изображения от Word документ в Python

Този бърз урок съдържа информация за как да извлечете всички изображения от документ на Word в Python. Той предоставя всички ресурси за конфигуриране на средата и въвежда важните API конструкции, които са необходими за изпълнение на задачата, включително имената на класовете, методите и свойствата. Можете да следвате стъпките и да напишете пълна програма за извличане на изображения от документ на Word в python като извличане на изображения от файл DOCX и запазването му като тип изображение PNG, JPG и т.н. на диска.

Стъпки за извличане на изображения от Word файл в Python

  1. Конфигурирайте средата да използва Aspose.Words за Python чрез .NET за извличане на изображения
  2. Заредете изходния Word файл с изображения, като използвате обекта от клас Document
  3. Вземете списък с всички фигури от заредения документ, като използвате метода get_child_nodes()
  4. Анализирайте всички елементи в колекцията от форми и открийте изображения
  5. Създайте уникални имена на файлове за всяко открито изображение в колекцията от форми
  6. Запазете извлеченото изображение на диска с уникалното име

Тези стъпки описват процеса за извличане на картини от документ на Word в Python чрез споделяне на конфигурацията на средата и стъпки за написване на програмата. След като създадете средата, заредете файла на Word с изображения, като използвате обекта на класа на документа и вземете колекцията от всички форми от него. Тъй като класът Shape има методи за откриване на изображения, можете да извлечете изображенията и да ги запишете на диска с указаното име.

Код за извличане на снимки от Word документ в Python

Тук е представен кодът, който демонстрира процеса за извличане на картина от Word в Python чрез зареждане на изходния файл с помощта на обекта на класа на документа, който има много функции като предоставяне на паролата за защитени файлове, настройка на кодирането и прикачване на предупреждение обратни извиквания за контрол на процеса на зареждане. По подобен начин методът get_child_nodes() се използва за извличане на фигури, но можете да извлечете други възли, като например заглавки, долни колонтитули, таблици, коментари, бележки под линия и тяло и т.н.

Тази статия ни напътства да извлечем всички снимки от файл на Word в Python. Ако искате да научите процеса за вмъкване на снимка във файл на Word, вижте статията на как да вмъкнете картина в Word с помощта на Python.

 Български