Այս կարճ ձեռնարկում մենք կսովորենք ինչպես կարդալ Word փաստաթուղթը C#-ում շրջակա միջավայրի կազմաձևման մանրամասների, քայլերի ցանկի և գործարկվող կոդի օգնությամբ: Կոդը ցույց կտա Word ֆայլի ընթերցումը տարբեր ձևերով: Դուք կսովորեք, թե ինչպես է C#-ը կարդում Word փաստաթուղթը՝ բեռնելով Word ֆայլ, ինչպիսիք են DOCX, DOC, RTF կամ HTML և այլն, և այնուհետև մուտք գործելով դրա տարբեր տարրեր՝ մշակելու կամ դիտելու համար:
Word փաստաթղթից տվյալները C#-ում կարդալու քայլեր
- Կազմաձևեք նախագծի միջավայրը՝ օգտագործելու Aspose.Words NuGet փաթեթի կառավարիչից
- Ներբեռնեք մուտքագրված DOCX ֆայլը Document դասի օբյեկտի մեջ
- Ստացեք Paragraph տիպի բոլոր հանգույցները փաստաթղթից
- Յուրաքանչյուր պարբերություն փոխարկեք տողի և ցուցադրեք այն վահանակի վրա
- Ստացեք բոլոր Run տիպի հանգույցները փաստաթղթից
- Փոխարկեք յուրաքանչյուր Run տարրը տողի և ցուցադրեք այն տառատեսակի անվան և չափի հետ միասին
Այս քայլերը տրամադրում են մանրամասն տեղեկատվություն, որն անհրաժեշտ է Word ֆայլերի ընթերցման ծրագիր գրելիս միջավայրը և առաջադրանքները կարգավորելու համար: Այն ցույց է տալիս, թե ինչպես է C#-ը կարդում DOCX ֆայլը՝ սկզբնաղբյուրը բեռնելով Document դասի օրինակում և այնուհետև մուտք գործելով դրա բոլոր պարբերությունները՝ տեքստը ցուցադրելու համար: Այն նաև նկարագրում է պարբերություններից, աղյուսակներից և այլնի տվյալների ընթերցումը այնպես, որ տարբեր ոճով տեքստի յուրաքանչյուր հատված առանձնացված է կամ աղյուսակի յուրաքանչյուր բջիջի արժեքն առանձին հասանելի է մշակման համար:s
Կոդ՝ Word ֆայլը C#-ում կարդալու համար
using System; | |
using Aspose.Words; | |
namespace ReadWordDocumentInCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) // Main function to read Word document in C# | |
{ | |
// Create and load license to read DOCX without trial limits | |
License licRotateImage = new License(); | |
licRotateImage.SetLicense("Aspose.Word.lic"); | |
// Load the source Word file to be read | |
Document doc = new Document("input.docx"); | |
// Read all the paragraph in the document and display its contents | |
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true)) | |
Console.WriteLine(para.ToString(SaveFormat.Text)); | |
// Read all the Runs in the document and display style and text | |
foreach (Run run in doc.GetChildNodes(NodeType.Run, true)) | |
{ | |
Font font = run.Font; | |
Console.WriteLine(font.Name + "," + font.Size.ToString()); | |
Console.WriteLine(run.Text); | |
} | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
Այս կոդը ցույց է տալիս *ինչպես կարդալ Word ֆայլը C#-ում` օգտագործելով Document.GetChildNodes() ֆունկցիան, որը պահանջում է բեռնել մի տեսակի հանգույց, ինչպիսիք են Paragraph, Run, Section, Body, HeaderFooter, Comment և այլն: Երբ երեխան մուտք է գործում հանգույց: , դուք պետք է այն գցեք համապատասխան տեսակի՝ դրա մեթոդներն ու հատկությունները օգտագործելու համար։ Օրինակ, մենք փաստաթուղթը երկու անգամ ենք կարդացել այնպես, որ նախ ամբողջ փաստաթղթի ամբողջ տեքստը ցուցադրվի՝ անկախ սովորական պարբերությունից կամ աղյուսակից և այլն, իսկ երկրորդ անգամ այն կարդացվում է ոճի և բովանդակության տեսակի փոփոխության հիման վրա:
Այս հոդվածը մեզ սովորեցրել է կարդալ Word ֆայլերը: Այնուամենայնիվ, եթե ցանկանում եք սովորել Word փաստաթղթերի փոխակերպումը HTML-ի, տես ինչպես փոխարկել Word փաստաթուղթը HTML-ի՝ օգտագործելով C#-ի հոդվածը: