Извличане на текст от Word документ в C#

Можете да Извлечете Text от документ на Word в C# с този кратък урок. Той включва стъпки за настройка на средата за разработка, работен процес стъпка по стъпка и настоящ работещ примерен код за конвертиране на DOCX в TXT в C#. Разработеното приложение може да бъде интегрирано във всяко приложение, поддържащо .NET framework в Linux, MS Windows или macOS.

Стъпки за извличане на текст от Word документ в C#

  1. Установете системата, като инсталирате Aspose.Words for .NET, за да конвертирате DOCX файл в TXT файл с помощта на C#
  2. Осъществете достъп до изходния документ на Word, като използвате екземпляр от класа Document
  3. Създайте екземпляр на класа TxtSaveOptions и задайте необходимите свойства
  4. Запазете Word файла като TXT на диска, като използвате метода Save

Тези кратки стъпки в C# извличат текст от Word Document с помощта на няколко извиквания на API. Първо, заредете изходния файл с документ на Word от диска, което след това е последвано от настройка на опциите за експортиране на изходния TXT файл с помощта на екземпляра на класа TxtSaveOptions. Накрая зареденият DOCX се записва като TXT файл на диска с помощта на метода Save.

Код за конвертиране на DOCX в TXT в C#

За извличане на текст от документ на Word C# базиран API е ефективно използван в този кодов фрагмент. Можете да запишете документа на Word в TXT, без да използвате незадължителния екземпляр на класа TxtSaveOptions. Въпреки това, ако трябва допълнително да персонализирате изходния TXT файл, можете да използвате различни свойства, изложени от класа TxtSaveOptions, включително настройка на Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak и PrettyFormat, за да назовем само няколко.

Тази статия обяснява информацията за разработване на Word към TXT конвертор с помощта на C#. Ако искате да сравните PDF документите, вижте статията на Сравнете PDF документи с C#.

 Български