يشرح هذا البرنامج التعليمي السريع ** كيفية قراءة البيانات الوصفية في PDF باستخدام Python **. يحتوي على معلومات مفصلة لتعيين البيئة لتطوير التطبيق ، وإجراء متدرج ، وعينة رمز قابلة للتشغيل ** لاستخراج البيانات الوصفية من PDF باستخدام Python **. سوف تتعلم مدى سهولة كتابة التطبيق والوصول إلى معلومات البيانات الوصفية من PDF باستخدام عدد قليل جدًا من استدعاءات واجهة برمجة التطبيقات دون تثبيت أي أداة خارجية في أي من البيئات المدعومة من Python.
خطوات قراءة بيانات PDF الوصفية باستخدام Python
- قم بتهيئة البيئة لـ استخدم Aspose.PDF لبايثون عبر .NET لقراءة البيانات الوصفية
- قم بتحميل ملف PDF المصدر باستخدام كائن فئة Document لجلب البيانات الوصفية
- احصل على حق الوصول إلى كائن فئة DocumentInfo الذي يحتوي على بيانات تعريف PDF
- الوصول إلى بعض خصائص المعلومات وعرضها على وحدة التحكم
تصف هذه الخطوات عملية * عرض البيانات الوصفية لـ PDF باستخدام Python *. أولاً ، تحتاج إلى تحميل ملف PDF الهدف ثم الوصول إلى خاصية DocumentInfo المسماة Info في فئة Document. يحتوي هذا الكائن على جميع البيانات الوصفية في ملف PDF مثل المنشئ والمنطقة الزمنية للتعديل والمنتج وتاريخ الإنشاء وتاريخ التعديل.
كود للحصول على بيانات تعريف PDF باستخدام Python
يوضح هذا الرمز ببساطة إجراء جلب البيانات الوصفية * PDF باستخدام Python *. يتم الوصول إلى كائن فئة DocumentInfo من المستند الذي تم تحميله والذي يحتوي على عدد من معلومات البيانات الوصفية مثل العلامة المحاصرة والعنوان والموضوع والكلمات الأساسية للمستند والمؤلف. إذا كنت ترغب في إضافة هذه الخصائص ، فيمكنك استخدام طريقة DocumentInfo.add () ، واستخدام طريقة clear () لمسح البيانات الوصفية ، واستخدام طريقة remove () لإزالة البيانات الوصفية المحددة فقط.
وصفت هذه المقالة عملية استرداد البيانات الأولية من ملف PDF. إذا كنت تريد التعرف على عملية قراءة محتويات PDF ، فراجع المقالة على كيف تقرأ محتوى PDF في بايثون.