استخراج جدول من PDF إلى Excel باستخدام بايثون

هذه المقالة تصف كيفية استخراج جدول من PDF إلى Excel باستخدام بايثون. تحتوي على جميع التفاصيل لاستخدام كلا المنتجين، أي Aspose.PDF و Aspose.Cells، قائمة بالخطوات، وعينة كود لاستخراج جدول إكسل من PDF باستخدام بايثون. ستظهر عينة الكود العملية الكاملة بنقل الجدول من صفحة PDF إلى ورقة إكسل.

خطوات استخراج الجدول من PDF إلى Excel باستخدام Python

  1. اضبط البيئة لتثبيت Aspose.Total For Python via .NET
  2. تطبيق الترخيص للمكتبات المستوردة ذات الصلة، أي Aspose.الخلايا و AsposePDF
  3. تحميل ملف PDF المصدر مع الجداول باستخدام كائن الفئة Document
  4. إنشاء ملف Excel فارغ باستخدام الفئة Workbook وتعيين اسم للورقة الأولى
  5. تكرار عبر كل صفحة في مجموعة الصفحات في ملف PDF
  6. الوصول إلى مجموعة الجداول وتحليل كل خلية في الجدول
  7. جلب النص من خلية PDF ونسخه إلى الخلية المقابلة في ورقة Excel
  8. احفظ ملف Excel على القرص مع بيانات الجدول من ملف PDF

تتضمن هذه الخطوات عملية استخراج البيانات من جدول PDF إلى Excel باستخدام Python. استيراد المكتبات الضرورية، تحميل ملف PDF المصدر، الوصول إلى كل صفحة ومجموعة الجداول الموجودة فيها، وتحليل جميع الجداول. أخيرًا، الوصول إلى كل خلية في جدول PDF وحفظ محتواها في الخلية المقابلة في ورقة عمل Excel الناتجة.

كود لسحب جدول من PDF إلى Excel باستخدام Python

هذا الكود يوضح كيفية استخراج جدول من ملف PDF إلى Excel باستخدام بايثون. يمكنك تجربة محرك التعرف على الجداول مختلف باستخدام خيار use_flow_engine في فئة TableAbsorber لاكتشاف الجداول بدون حدود في PDF. استخدم text_state في الخلية الممتصة لجلب اسم الخط، الحجم، لون الخلفية، لون المقدمة، والنمط الغامق المائل لتخصيص تنسيق خلية Excel الوجهة للحفاظ على تنسيق الجداول متشابهًا في كلا الملفين.

لقد ساعدت هذه المقالة في فهم عملية نقل جدول PDF إلى Excel. لتثبيت Python لتشغيل Aspose.PDF للبايثون عبر.NET، راجع المقالة كيفية تثبيت Python لتشغيل Aspose.PDF للبايثون عبر.نت.

 عربي