Цей короткий посібник пояснює, як читати метадані PDF за допомогою Python. Він містить детальну інформацію про налаштування середовища для розробки програми, поетапну процедуру та приклад коду для вилучення метаданих із PDF за допомогою Python. Ви дізнаєтеся, як легко писати програму та отримувати доступ до інформації метаданих із PDF за допомогою невеликої кількості викликів API, не встановлюючи сторонніх інструментів у будь-якому середовищі, що підтримується Python.
Кроки для читання метаданих PDF за допомогою Python
- Створіть середовище використовуйте Aspose.PDF для Python через .NET для читання метаданих
- Завантажте вихідний PDF-файл за допомогою об’єкта класу Document, щоб отримати метадані
- Отримайте доступ до об’єкта класу DocumentInfo, що містить метадані PDF
- Доступ до кількох властивостей інформації та відображення їх на консолі
Ці кроки описують процес перегляду метаданих PDF за допомогою Python. Спочатку вам потрібно завантажити цільовий файл PDF, а потім отримати доступ до властивості DocumentInfo під назвою «Info» у класі Document. Цей об’єкт містить усі метадані у PDF-файлі, як-от автор, часовий пояс модифікації, виробник, дата створення та дата модифікації.
Код для отримання метаданих PDF за допомогою Python
Цей код просто демонструє процедуру отримання метаданих PDF за допомогою Python. Доступ до об’єкта класу DocumentInfo здійснюється із завантаженого документа, який містить низку метаданих, як-от прапорець захоплення, заголовок, тему, ключові слова документа та автора. Якщо ви хочете додати ці властивості, ви можете використовувати метод DocumentInfo.add(), метод clear() для очищення метаданих і метод remove() для видалення лише зазначених метаданих.
У цій статті описано процес отримання метаданих із PDF-файлу. Якщо ви хочете дізнатися, як читати вміст PDF-файлу, перегляньте статтю на як читати вміст PDF на Python.