Ištraukite tekstą iš Word dokumento C#

Galite išskleisti Text iš Word dokumento C# naudodami šią trumpą mokymo programą. Tai apima kūrimo aplinkos nustatymo veiksmus, nuoseklią darbo eigą ir esamą darbo pavyzdinį kodą, skirtą konvertuoti DOCX į TXT C#. Sukurta programa gali būti integruota į bet kurią programą, palaikančią .NET sistemą Linux, MS Windows ar macOS.

Veiksmai, kaip ištraukti tekstą iš Word dokumento C#

  1. Sukurkite sistemą įdiegdami Aspose.Words for .NET, kad konvertuotumėte DOCX failą į TXT failą naudodami C#
  2. Pasiekite šaltinio Word dokumentą naudodami Document klasės egzempliorių
  3. Sukurkite TxtSaveOptions klasės egzempliorių ir nustatykite reikiamas ypatybes
  4. Išsaugokite Word failą kaip TXT diske naudodami išsaugojimo metodą

Šie glausti žingsniai C# ištraukia tekstą iš Word dokumento naudojant kelis API iškvietimus. Pirmiausia iš disko įkelkite šaltinio Word dokumento failą, o po to nustatykite išvesties TXT failo eksportavimo parinktis naudodami TxtSaveOptions klasės egzempliorių. Galiausiai įkeltas DOCX išsaugomas kaip TXT failas diske naudojant Įrašymo metodą.

Kodas konvertuoti DOCX į TXT C#

Šiame kodo fragmente buvo veiksmingai naudojamas išskleisti tekstą iš Word dokumento C#. Galite įrašyti Word dokumentą į TXT nenaudodami pasirenkamo TxtSaveOptions klasės egzemplioriaus. Tačiau, jei turėtumėte toliau tinkinti išvesties TXT failą, galite naudoti skirtingas TxtSaveOptions klasės ypatybes, įskaitant nustatymą Encoding, ForcePageBreaks, MaxCharactersPerLine, paragraphBreak ir PrettyFormat.

Šiame straipsnyje paaiškinta informacija, kaip sukurti Word į TXT keitiklį naudojant C#. Jei norite palyginti PDF dokumentus, žr. straipsnį Palyginkite PDF dokumentus naudodami C#.

 Latviski