Comment lire un document Word en C#

Dans ce court didacticiel, nous apprendrons ** comment lire un document Word en C# ** à l’aide de détails sur la configuration de l’environnement, d’une liste d’étapes et d’un code exécutable. Le code démontrera la lecture du fichier Word de différentes manières. Vous apprendrez comment C# lit un document Word en chargeant un fichier Word tel que DOCX, DOC, RTF ou HTML, etc., puis en accédant à ses différents éléments à traiter ou à afficher.

Étapes pour lire les données d’un document Word en C#

  1. Configurez l’environnement du projet pour utiliser Aspose.Words à partir du gestionnaire de packages NuGet
  2. Chargez le fichier DOCX d’entrée dans l’objet de classe Document
  3. Obtenir tous les nœuds de type Paragraph du document
  4. Convertissez chaque paragraphe en chaîne et affichez-le sur la console
  5. Obtenir tous les nœuds de type Run à partir du document
  6. Convertissez chaque élément Run en une chaîne et affichez-le avec le nom et la taille de la police

Ces étapes fournissent les informations détaillées requises pour configurer l’environnement et les tâches à effectuer lors de l’écriture d’un programme de lecture de fichiers Word. Il montre comment C# lit le fichier DOCX en chargeant le fichier source dans l’instance de classe Document, puis en accédant à tous ses paragraphes pour afficher le texte. Il décrit également la lecture de données à partir de paragraphes, de tableaux, etc. de sorte que chaque segment de texte avec un style différent soit séparé ou que chaque valeur de cellule de tableau soit accessible séparément pour le traitement.s

Code pour lire un fichier Word en C#

Ce code montre comment lire un fichier Word en C# en utilisant la fonction Document.GetChildNodes() qui nécessite l’extraction d’un type de nœud comme Paragraphe, Exécuter, Section, Corps, En-tête, Pied de page, Commentaire, etc. Une fois le nœud enfant accédé , vous devez le convertir en type respectif pour utiliser ses méthodes et ses propriétés. Par exemple, nous avons lu le document deux fois de sorte que tout le texte de l’ensemble du document est affiché indépendamment d’un paragraphe normal ou d’un tableau, etc., et la deuxième fois, il est lu en fonction de tout changement de style et de type de contenu.

Cet article nous a appris à lire les fichiers Word cependant si vous voulez apprendre la conversion de documents Word en HTML, référez-vous à l’article sur comment convertir un document Word en HTML en utilisant C#.

 Français