هذه المقالة تصف كيفية استخراج جدول من PDF إلى Excel باستخدام بايثون. تحتوي على جميع التفاصيل لاستخدام كلا المنتجين، أي Aspose.PDF و Aspose.Cells، قائمة بالخطوات، وعينة كود لاستخراج جدول إكسل من PDF باستخدام بايثون. ستظهر عينة الكود العملية الكاملة بنقل الجدول من صفحة PDF إلى ورقة إكسل.

خطوات استخراج الجدول من PDF إلى Excel باستخدام Python

اضبط البيئة لتثبيت Aspose.Total For Python via .NET
تطبيق الترخيص للمكتبات المستوردة ذات الصلة، أي Aspose.الخلايا و AsposePDF
تحميل ملف PDF المصدر مع الجداول باستخدام كائن الفئة Document
إنشاء ملف Excel فارغ باستخدام الفئة Workbook وتعيين اسم للورقة الأولى
تكرار عبر كل صفحة في مجموعة الصفحات في ملف PDF
الوصول إلى مجموعة الجداول وتحليل كل خلية في الجدول
جلب النص من خلية PDF ونسخه إلى الخلية المقابلة في ورقة Excel
احفظ ملف Excel على القرص مع بيانات الجدول من ملف PDF

تتضمن هذه الخطوات عملية استخراج البيانات من جدول PDF إلى Excel باستخدام Python. استيراد المكتبات الضرورية، تحميل ملف PDF المصدر، الوصول إلى كل صفحة ومجموعة الجداول الموجودة فيها، وتحليل جميع الجداول. أخيرًا، الوصول إلى كل خلية في جدول PDF وحفظ محتواها في الخلية المقابلة في ورقة عمل Excel الناتجة.

كود لسحب جدول من PDF إلى Excel باستخدام Python

هذا الكود يوضح كيفية استخراج جدول من ملف PDF إلى Excel باستخدام بايثون. يمكنك تجربة محرك التعرف على الجداول مختلف باستخدام خيار use_flow_engine في فئة TableAbsorber لاكتشاف الجداول بدون حدود في PDF. استخدم text_state في الخلية الممتصة لجلب اسم الخط، الحجم، لون الخلفية، لون المقدمة، والنمط الغامق المائل لتخصيص تنسيق خلية Excel الوجهة للحفاظ على تنسيق الجداول متشابهًا في كلا الملفين.

لقد ساعدت هذه المقالة في فهم عملية نقل جدول PDF إلى Excel. لتثبيت Python لتشغيل Aspose.PDF للبايثون عبر.NET، راجع المقالة كيفية تثبيت Python لتشغيل Aspose.PDF للبايثون عبر.نت.

Aspose قاعدة المعرفة

ابحث عن إجابات من API

استخراج جدول من PDF إلى Excel باستخدام بايثون

خطوات استخراج الجدول من PDF إلى Excel باستخدام Python

كود لسحب جدول من PDF إلى Excel باستخدام Python