استخراج متن از سند ورد در سی شارپ

با این آموزش مختصر می توانید Text را از سند Word در سی شارپ ** استخراج کنید. این شامل مراحل تنظیم محیط توسعه، گردش کار گام به گام و یک کد نمونه کار فعلی برای تبدیل DOCX به TXT در C# است. برنامه توسعه‌یافته را می‌توان در هر برنامه‌ای که از چارچوب دات نت در لینوکس، MS Windows یا macOS پشتیبانی می‌کند، ادغام کرد.

مراحل استخراج متن از سند ورد در سی شارپ

  1. سیستم را با نصب Aspose.Words for .NET برای تبدیل یک فایل DOCX به یک فایل TXT با استفاده از C# ایجاد کنید.
  2. با استفاده از نمونه ای از کلاس Document به سند منبع Word دسترسی پیدا کنید
  3. نمونه کلاس TxtSaveOptions را نمونه‌سازی کنید و ویژگی‌های مورد نیاز را تنظیم کنید
  4. با استفاده از روش Save فایل Word را به صورت TXT روی دیسک ذخیره کنید

این مراحل مختصر در *C# با استفاده از چند تماس API، متن را از سند Word استخراج می کند. ابتدا فایل سند منبع Word را از روی دیسک بارگیری کنید، سپس با استفاده از نمونه کلاس TxtSaveOptions گزینه های خروجی صادرات فایل TXT را تنظیم کنید. در نهایت، DOCX بارگذاری شده به عنوان یک فایل TXT روی دیسک با استفاده از روش Save ذخیره می شود.

کد برای تبدیل DOCX به TXT در سی شارپ

برای * استخراج متن از سند Word API مبتنی بر C#* به طور موثر در این قطعه کد استفاده شده است. می توانید سند Word را بدون استفاده از نمونه کلاس اختیاری TxtSaveOptions در TXT ذخیره کنید. با این حال، اگر باید فایل TXT خروجی را بیشتر سفارشی کنید، می‌توانید از ویژگی‌های مختلفی که توسط کلاس TxtSaveOptions در معرض دید قرار گرفته‌اند، از جمله تنظیمات Encoding، ForcePageBreaks، MaxCharactersPerLine، ParagraphBreak و PrettyFormat استفاده کنید.

این مقاله اطلاعاتی را برای توسعه یک تبدیل Word به TXT با استفاده از C# توضیح داده است. اگر می خواهید اسناد PDF را با هم مقایسه کنید، به مقاله مقایسه اسناد PDF با استفاده از C# مراجعه کنید.

 فارسی