Šioje trumpoje pamokoje išmoksime kaip skaityti Word dokumentą C#, naudodamiesi išsamia aplinkos konfigūravimo informacija, veiksmų sąrašu ir paleidžiamu kodu. Kodas parodys Word failo skaitymą įvairiais būdais. Sužinosite, kaip C# skaito Word dokumentą, įkeldami Word failą, pvz., DOCX, DOC, RTF arba HTML ir t. t., tada pasiekite skirtingus jo elementus, kad galėtumėte apdoroti ar peržiūrėti.
Veiksmai, kaip nuskaityti duomenis iš Word dokumento C#
- Sukonfigūruokite projekto aplinką naudoti Aspose.Words iš NuGet paketų tvarkyklės
- Įkelkite įvesties DOCX failą į Document klasės objektą
- Gaukite visus Paragraph tipo mazgus iš dokumento
- Konvertuokite kiekvieną pastraipą į eilutę ir parodykite ją konsolėje
- Gaukite visus Run tipo mazgus iš dokumento
- Konvertuokite kiekvieną Vykdymo elementą į eilutę ir parodykite ją kartu su šrifto pavadinimu ir dydžiu
Šie veiksmai suteikia išsamią informaciją, reikalingą aplinkai ir užduotims, kurias reikia atlikti rašant Word failų skaitymo programą, konfigūruoti. Jame parodyta, kaip C# nuskaito DOCX failą, įkeliant šaltinio failą į dokumentų klasės egzempliorių ir tada pasiekiant visas jo pastraipas, kad būtų rodomas tekstas. Taip pat aprašomas duomenų skaitymas iš pastraipų, lentelių ir pan., kad kiekvienas skirtingo stiliaus teksto segmentas būtų atskirtas arba kiekviena lentelės langelio reikšmė būtų atskirai pasiekiama apdorojimui.
Kodas, skirtas skaityti Word failą C#
Šis kodas parodo, kaip skaityti Word failą C# naudojant Document.GetChildNodes() funkciją, kuriai reikalingas mazgo tipas, pvz., pastraipa, vykdymas, sekcija, turinys, antraštės poraštė, komentaras ir kt. Pasiekus antrinį mazgą , turite perkelti jį į atitinkamą tipą, kad galėtumėte naudoti jo metodus ir savybes. Pavyzdžiui, dokumentą perskaitėme du kartus taip, kad pirmiausia būtų rodomas visas viso dokumento tekstas, neatsižvelgiant į įprastą pastraipą ar lentelę ir pan., o antrą kartą jis skaitomas atsižvelgiant į bet kokius stiliaus ir turinio tipo pokyčius.
Šiame straipsnyje išmokome skaityti Word failus, tačiau jei norite išmokti konvertuoti Word dokumentus į HTML, žr. straipsnį kaip konvertuoti Word dokumentą į HTML naudojant C#.