Vous pouvez Extraire Text d’un document Word en C# avec ce bref didacticiel. Il comprend les étapes de configuration de l’environnement de développement, un flux de travail étape par étape et un exemple de code fonctionnel pour convertir DOCX en TXT en C#. L’application développée peut être intégrée à n’importe quelle application prenant en charge le framework .NET sous Linux, MS Windows ou macOS.
Étapes pour extraire le texte d’un document Word en C#
- Établissez le système en installant Aspose.Words for .NET pour convertir un fichier DOCX en fichier TXT à l’aide de C#
- Accédez au document Word source à l’aide d’une instance de la classe Document
- Instanciez l’instance de classe TxtSaveOptions et définissez les propriétés requises
- Enregistrez le fichier Word au format TXT sur le disque en utilisant la méthode Save
Ces étapes concises en C# extraient le texte d’un document Word à l’aide de quelques appels API. Tout d’abord, chargez le fichier de document Word source à partir du disque, puis définissez les options d’exportation du fichier TXT de sortie à l’aide de l’instance de classe TxtSaveOptions. Enfin, le DOCX chargé est enregistré sous forme de fichier TXT sur le disque à l’aide de la méthode Save.
Code pour convertir DOCX en TXT en C#
Pour extraire le texte d’un document Word, l’API basée sur C# a été utilisée efficacement dans cet extrait de code. Vous pouvez enregistrer le document Word au format TXT sans utiliser l’instance de classe facultative TxtSaveOptions. Toutefois, si vous devez personnaliser davantage le fichier TXT de sortie, vous pouvez utiliser différentes propriétés exposées par la classe TxtSaveOptions, notamment les paramètres Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak et PrettyFormat, pour n’en nommer que quelques-unes.
Cet article a expliqué les informations nécessaires pour développer un convertisseur Word vers TXT en utilisant C#. Si vous souhaitez comparer les documents PDF, reportez-vous à l’article sur Comparez des documents PDF en utilisant C#.