Как извлечь все изображения из документа Word в Python

Этот краткий учебник содержит информацию о том, как извлечь все изображения из документа Word в Python. Он предоставляет все ресурсы для настройки среды и представляет важные конструкции API, необходимые для выполнения задачи, включая имена классов, методы и свойства. Вы можете выполнить шаги и написать полную программу для извлечения изображений из документа Word в python, например, для извлечения изображений из файла DOCX и сохранения его в качестве типа изображения PNG, JPG и т. д. на диске.

Шаги по извлечению изображений из файла Word в Python

  1. Настройте среду для использования Aspose.Words для Python через .NET для извлечения изображений.
  2. Загрузите исходный файл Word с изображениями, используя объект класса Document
  3. Получить список всех фигур из загруженного документа с помощью метода get_child_nodes()
  4. Проанализируйте все элементы в коллекции фигур и найдите изображения.
  5. Создайте уникальные имена файлов для каждого обнаруженного изображения в коллекции фигур.
  6. Сохраните извлеченный образ на диск под уникальным именем

Эти шаги описывают процесс извлечения изображений из документа Word в Python путем совместного использования конфигурации среды и шагов по написанию программы. После установки среды загрузите файл Word с изображениями с помощью объекта класса Document и получите из него коллекцию всех фигур. Поскольку класс Shape имеет методы для обнаружения изображений, вы можете извлекать изображения и сохранять их на диске с указанным именем.

Код для извлечения фотографий из документа Word в Python

Здесь представлен код, демонстрирующий процесс извлечения изображения из Word в Python путем загрузки исходного файла с использованием объекта класса Document, который имеет множество функций, таких как предоставление пароля для защищенных файлов, установка кодировки и прикрепление предупреждения. обратные вызовы для управления процессом загрузки. Точно так же метод get_child_nodes() используется для извлечения фигур, однако вы можете извлекать и другие узлы, такие как заголовки, нижние колонтитулы, таблицы, комментарии, сноски, тело и т. д.

Эта статья помогла нам получить все фотографии из файла Word в Python. Если вы хотите узнать, как вставить фотографию в файл Word, обратитесь к статье как вставить картинку в Word с помощью Python.

 Русский