این آموزش مختصر اطلاعاتی را در مورد نحوه خواندن سند Word در جاوا با ارائه یک روش گام به گام دقیق و یک کد جاوا قابل اجرا برای خواندن سند نمونه به روش های مختلف ارائه می دهد. کلاس های لازم را معرفی می کند که برای خواندن یک فایل Word و دسترسی به بخش های مختلف آن استفاده می شود. هنگام خواندن سند Word در کد جاوا مانند DOCX، DOC، یا سایر فایلهای پشتیبانی شده از MS Word، از طریق گرههای فرزند مختلف سند را تکرار میکنید و هر کدام را بر اساس نیاز خود پردازش میکنید.
مراحل خواندن فایل Word در جاوا
- برای خواندن فایل DOCX، Aspose.Words for Java را با استفاده از مخزن Maven نصب کنید
- فایل منبع DOCX را برای خواندن در جاوا در شی کلاس Document بارگیری کنید
- در تمام گره های نوع Paragraph در سند تکرار کنید
- هر متن پاراگراف را به یک رشته تبدیل کنید و آن را در کنسول نمایش دهید
- در تمام گره های نوع Run در سند تکرار کنید
- هر گره را به نوع Run تبدیل کنید و به نام فونت، اندازه و متن Run دسترسی پیدا کنید
- هر متن اجرا شده را روی کنسول نمایش دهید
این مراحل نحوه خواندن فایل Word در جاوا را با به اشتراک گذاشتن پیوند به صفحه پیکربندی و سپس راهنمایی برای بارگیری سند منبع Word شرح می دهد. هنگامی که فایل Word بارگذاری می شود، مدل شی سند آن (DOM) یعنی ساختار منطقی نیز بارگذاری می شود و می تواند به روش های مختلف تجزیه شود. این مراحل به تهیه دو مجموعه اصلی که پاراگراف ها و اجراها هستند برای دسترسی به بخش های مختلف سند ورد بارگذاری شده کمک می کند.
کد برای خواندن فایل DOCX در جاوا
این کد جاوا برای خواندن سند ورد تجزیه DOM را با استفاده از فیلترهای مختلف نشان می دهد، به عنوان مثال در وهله اول همه گره های پاراگراف را واکشی می کنیم. کلاس Paragraph تابع toString() را ارائه می دهد که متن را از کل پاراگراف از جمله جداول و غیره استخراج می کند و آن را در یک متغیر رشته ذخیره می کند. به طور مشابه، وقتی سند را برای واکشی همه اجراها تجزیه میکنیم، محتواها را بر اساس سبک، فونت، نوع گره و غیره جدا میکند و یک پاراگراف را به چند بخش بر اساس سبک فونت متن تقسیم میکند، مانند متن پررنگ به طور جداگانه، مورب ارائه میشود. متن جداگانه و غیره.
این آموزش ما را راهنمایی کرده است که یک فایل DOCX را بخوانیم، اما اگر میخواهید نوعی تبدیل مانند Word به PDF را انجام دهید، به مقاله نحوه تبدیل Word به PDF در جاوا مراجعه کنید.