In deze korte zelfstudie leren we hoe een Word-document in C# te lezen met behulp van details over de configuratie van de omgeving, een lijst met stappen en een uitvoerbare code. De code zal op verschillende manieren het lezen van een Word-bestand demonstreren. U leert hoe C# een Word-document leest door een Word-bestand zoals DOCX, DOC, RTF of HTML, enz. te laden en vervolgens toegang te krijgen tot de verschillende elementen om te verwerken of te bekijken.
Stappen om gegevens uit Word-document in C# te lezen
- Configureer de projectomgeving om Aspose.Words te gebruiken vanuit de NuGet-pakketbeheerder
- Laad het invoer-DOCX-bestand in het Document klasseobject
- Haal alle knooppunten van het type Paragraph uit het document
- Converteer elke alinea naar een tekenreeks en geef deze weer op de console
- Haal alle knooppunten van het type Uitvoeren uit het document
- Converteer elk Run-item naar een tekenreeks en geef het weer samen met de naam en grootte van het lettertype
Deze stappen bieden de gedetailleerde informatie die nodig is om de omgeving en taken te configureren die moeten worden uitgevoerd tijdens het schrijven van een Word-bestandslezerprogramma. Het laat zien hoe C# het DOCX-bestand leest door het bronbestand in de documentklasse-instantie te laden en vervolgens alle paragrafen te openen om de tekst weer te geven. Het beschrijft ook het lezen van gegevens uit alinea’s, tabellen, enz. zodat elk tekstsegment met een andere stijl wordt gescheiden of dat elke tabelcelwaarde afzonderlijk wordt geopend voor verwerking.s
Code om Word-bestand te lezen in C#
Deze code demonstreert hoe u een Word-bestand in C# kunt lezen met behulp van de functie Document.GetChildNodes() waarvoor een type knooppunt moet worden opgehaald, zoals Paragraaf, Uitvoeren, Sectie, Hoofdtekst, HeaderFooter, Commentaar, enz. Zodra het onderliggende knooppunt is geopend , moet u het naar het respectieve type casten om de methoden en eigenschappen ervan te gebruiken. We hebben het document bijvoorbeeld twee keer gelezen, zodat eerst alle tekst uit het hele document wordt weergegeven, ongeacht een normale alinea of een tabel, enz., en de tweede keer dat het wordt gelezen op basis van een wijziging in stijl en inhoudstype.
Dit artikel heeft ons geleerd om Word-bestanden te lezen, maar als u de conversie van Word-documenten naar HTML wilt leren, raadpleeg dan het artikel op hoe een Word-document naar HTML te converteren met C#.