این آموزش سریع شما را در مورد نحوه خواندن فایل DOCX در پایتون راهنمایی می کند. این شامل کل اطلاعات مورد نیاز برای پیکربندی محیط، مراحلی که باید هنگام نوشتن کد دنبال شود و یک نمونه کد پایتون قابل اجرا است. همچنین میتوانید فایل DOC را در پایتون** و همچنین سایر فایلهای پشتیبانی شده از MS Word را با استفاده از دستورالعملهای مشابه بخوانید.
مراحل خواندن فایل DOCX در پایتون
- محیط توسعه را طوری تنظیم کنید که از Aspose.Words برای پایتون از طریق دات نت برای خواندن یک فایل DOCX استفاده کند
- فضای نام aspose.words را وارد کنید و یک نام مستعار برای آن تعیین کنید
- فایل ورودی DOCX را در شیء کلاس Document که قرار است با استفاده از پایتون خوانده شود، بارگیری کنید
- یک حلقه برای واکشی تمام گره های پاراگراف از DOCX بارگذاری شده اجرا کنید
- هر گره را به یک پاراگراف ارسال کنید
- مطالب را از هر پاراگراف استخراج کنید و آنها را به رشته ای برای نمایش تبدیل کنید
این مراحل به این سوال پاسخ می دهند که چگونه پایتون می تواند سند ورد را بخواند با به اشتراک گذاشتن پیکربندی و سایر جزئیات ضروری. به وارد کردن فضاهای نام ضروری، روشهایی برای بارگذاری فایل DOCX، تکرار در تمام گرههای یک نوع خاص مانند پاراگراف در این کد نمونه، و سپس تبدیل هر محتوای پاراگراف به رشتهای برای نمایش در کنسول، راهنمایی میکند.
کد برای خواندن فایل ورد در پایتون
این کد در پایتون فایل Word را با بارگیری و سپس تکرار در تمام محتویات آن می خواند. همچنین میتوانید متن انتخابشده را بین پاراگرافها بخوانید و به انواع مختلفی از گرهها مانند بخش، بدنه، جدول، شکل، نظر و فوتر سرصفحه دسترسی داشته باشید تا تعدادی از آنها را فهرست کنید. همچنین میتوانید با تکرار از طریق مجموعه Document.built_in_document_properties و استفاده از ویژگیهای «name» و «value» هر مورد، اطلاعاتی مانند ویژگیهای داخلی را دریافت کنید.
این مقاله خواندن یک فایل Word در پایتون را نشان داده است. اگر علاقه مند به ایجاد فایل Word هستید، به مقاله نحوه ایجاد سند ورد با استفاده از پایتون مراجعه کنید.