Izdvojite tekst iz Word dokumenta u C#

Možete Izvući Text iz Word dokumenta u C# pomoću ovog kratkog vodiča. Obuhvaća korake za postavljanje razvojnog okruženja, tijek rada korak po korak i sadašnji radni uzorak koda za konvertiranje DOCX u TXT u C#. Razvijena aplikacija može se integrirati u bilo koju aplikaciju koja podržava .NET framework u Linuxu, MS Windows ili macOS.

Koraci za izdvajanje teksta iz Word dokumenta u C#

  1. Uspostavite sustav instaliranjem Aspose.Words for .NET za pretvaranje DOCX datoteke u TXT pomoću C#
  2. Pristupite izvornom Word dokumentu pomoću instance klase Document
  3. Instancirajte instancu klase TxtSaveOptions i postavite potrebna svojstva
  4. Spremite Word datoteku kao TXT na disk pomoću metode Spremi

Ovi sažeti koraci u C# izdvajaju tekst iz Word dokumenta pomoću nekoliko API poziva. Prvo učitajte izvornu datoteku Word dokumenta s diska, nakon čega slijedi postavljanje opcija izvoza izlazne TXT datoteke pomoću instance klase TxtSaveOptions. Na kraju, učitani DOCX sprema se kao TXT datoteka na disk metodom Spremi.

Kod za pretvaranje DOCX u TXT u C#

Za izdvajanje teksta iz Wordovog dokumenta C# temeljen API učinkovito je korišten u ovom isječku koda. Wordov dokument možete spremiti u TXT bez korištenja dodatne instance klase TxtSaveOptions. Međutim, ako biste trebali dodatno prilagoditi izlaznu TXT datoteku, možete koristiti različita svojstva izložena u klasi TxtSaveOptions uključujući postavljanje Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak i PrettyFormat da spomenemo samo neke.

Ovaj članak je objasnio informacije za razvoj pretvarača Word u TXT koristeći C#. Ako želite usporediti PDF dokumente, pogledajte članak na Usporedite PDF dokumente koristeći C#.

 Hrvatski