كيفية تحويل PDF إلى نص باستخدام Python

يشرح هذا البرنامج التعليمي السريع ** كيفية تحويل PDF إلى Text باستخدام Python **. يغطي تفاصيل تكوين النظام والعملية التدريجية جنبًا إلى جنب مع نموذج التعليمات البرمجية لإجراء تحويل مستند إلى ** PDF إلى Text Python **. علاوة على ذلك ، يمكنك كتابة النص المستخرج إلى الملف أو في وحدة التحكم وفقًا لمتطلباتك.

خطوات تحويل PDF إلى نص في Python

  1. تكوين النظام عن طريق تثبيت مكتبة Aspose.PDF لـ Python عبر .NET
  2. قم بتحميل ملف PDF المصدر باستخدام فئة Document لتحويله إلى ملف نصي
  3. قم بإنشاء كائن فئة TextAbsorber لجلب النص باستخدام طريقة Page.Accept ()
  4. قم بإنشاء ملف نصي واكتب سلسلة نص الإخراج في الملف

تلخص هذه الخطوات كيفية استخدام تحويل * Python PDF إلى TXT * مع بضع مكالمات API. في الخطوة الأولى ، قم بتحميل ملف PDF للإدخال وتهيئة كائن TextAbsorber والذي يمكن استخدامه لجلب النص من الصفحات. ثم تحتاج إلى الحصول على النص المستخرج وكتابته في ملف TXT أثناء تحديد مسار الملف واسمه.

كود لتحويل PDF إلى نص في Python

يوضح مقتطف الشفرة هذا كيفية إنشاء * محول PDF إلى نص باستخدام Python *. يقوم بتحميل مستند PDF المصدر باستخدام فئة المستند. بعد ذلك ، يمكنك جلب النص من جميع صفحات ملف PDF باستخدام طريقة القبول أو قراءة سلسلة النص من صفحة معينة عن طريق تحديد رقم الصفحة. أخيرًا ، اكتب السلسلة النصية في ملف وقم بتصدير الملف النصي إلى القرص.

في هذه المقالة ، تعلمنا كيف يمكن استخدام عرض * Python PDF to Text * مع تطبيقاتك. ومع ذلك ، إذا كنت تريد تعلم تحويل PDF إلى Word ، فاقرأ البرنامج التعليمي على كيفية تحويل PDF إلى Word باستخدام Python.

 عربي