Možete Izvući Text iz Word dokumenta u C# pomoću ovog kratkog vodiča. Obuhvaća korake za postavljanje razvojnog okruženja, tijek rada korak po korak i sadašnji radni uzorak koda za konvertiranje DOCX u TXT u C#. Razvijena aplikacija može se integrirati u bilo koju aplikaciju koja podržava .NET framework u Linuxu, MS Windows ili macOS.
Koraci za izdvajanje teksta iz Word dokumenta u C#
- Uspostavite sustav instaliranjem Aspose.Words for .NET za pretvaranje DOCX datoteke u TXT pomoću C#
- Pristupite izvornom Word dokumentu pomoću instance klase Document
- Instancirajte instancu klase TxtSaveOptions i postavite potrebna svojstva
- Spremite Word datoteku kao TXT na disk pomoću metode Spremi
Ovi sažeti koraci u C# izdvajaju tekst iz Word dokumenta pomoću nekoliko API poziva. Prvo učitajte izvornu datoteku Word dokumenta s diska, nakon čega slijedi postavljanje opcija izvoza izlazne TXT datoteke pomoću instance klase TxtSaveOptions. Na kraju, učitani DOCX sprema se kao TXT datoteka na disk metodom Spremi.
Kod za pretvaranje DOCX u TXT u C#
Za izdvajanje teksta iz Wordovog dokumenta C# temeljen API učinkovito je korišten u ovom isječku koda. Wordov dokument možete spremiti u TXT bez korištenja dodatne instance klase TxtSaveOptions. Međutim, ako biste trebali dodatno prilagoditi izlaznu TXT datoteku, možete koristiti različita svojstva izložena u klasi TxtSaveOptions uključujući postavljanje Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak i PrettyFormat da spomenemo samo neke.
Ovaj članak je objasnio informacije za razvoj pretvarača Word u TXT koristeći C#. Ako želite usporediti PDF dokumente, pogledajte članak na Usporedite PDF dokumente koristeći C#.