Comment convertir un PDF en fichier texte à l'aide de C#

Ce didacticiel de base vous explique comment convertir un fichier PDF en fichier texte à l’aide de C#, y compris les paramètres de configuration et un extrait de code exécutable. Il montre comment l’utilisation du convertisseur C# PDF vers texte peut être créée avec quelques appels d’API. Il vous suffit de charger le document source PDF et d’enregistrer le fichier de sortie Text.

Étapes pour convertir un PDF en fichier texte à l’aide de C#

  1. Ajoutez une référence à Aspose.PDF for .NET dans votre application pour convertir un PDF en fichier texte
  2. Chargez le fichier PDF source à l’aide de l’instance de classe Document pour créer un fichier texte
  3. Créez une instance de la classe TextAbsorber et extrayez le texte de toutes les pages
  4. Enregistrer le fichier texte de sortie

Pour l’écriture d’une configuration d’application basée sur PDF en texte C# dans le framework .NET et une procédure étape par étape est fournie ici. Dans un premier temps, configurez rapidement l’API et chargez le fichier PDF d’entrée. Ensuite, nous procédons à l’extraction du texte de toutes ses pages et écrivons le texte extrait dans un fichier ou un flux selon les exigences.

Extrait de code pour convertir un PDF en texte à l’aide de C#

L’utilisation de la fonction C# convert PDF to Text peut être intégrée dans vos applications avec le contrôle de la lecture du texte à partir du PDF source, comme vous pouvez lire le texte de toutes les pages ou d’une page spécifiée. De même, si vous souhaitez lire du texte à partir d’une zone rectangulaire particulière sur la page PDF, vous avez également la liberté de définir cette zone rectangulaire. Différents modes peuvent également être définis pour convertir un PDF en texte comme Pure, Raw et MemorySaving.

Dans cet article, nous avons appris comment le code PDF to Text C# peut être utilisé dans vos applications .NET. Toutefois, si vous souhaitez explorer la conversion de documents PDF en documents HTML, reportez-vous à l’article sur comment convertir un PDF en HTML en utilisant C#.

 Français