Dans ce didacticiel, nous allons apprendre à lire le fichier PDF en C++. Vous pouvez extraire du texte ou des images de n’importe quelle page ou document entier du fichier PDF avec de simples appels d’API en C++. La fonctionnalité ne dépend pas d’Adobe Acrobat ou de toute application de lecture de PDF sur les plates-formes Windows ou Linux.
Étapes pour lire un fichier PDF en C++
- Installez le Aspose.Pdf for C++ à partir de l’outil de gestion de packages NuGet
- Ajouter la référence à l’espace de noms Aspose::Pdf
- Charger le PDF d’entrée à l’aide de Document Class
- Initialiser une instance de classe TextFragmentAbsorber
- Imprimer le texte extrait sur la console
- Parcourez chaque page et chaque image du document
- Enregistrez l’image de sortie extraite en tant que fichier JPG
Vous pouvez ouvrir et lire un fichier pdf en C++ avec quelques lignes de code simples. Il peut extraire efficacement tout le texte et les images du fichier PDF.
Code pour lire un fichier PDF en C++
Dans le sujet précédent, nous avons exploré Comment aplatir les champs de formulaire PDF en C#. Cette rubrique se concentre sur la façon de lire le texte d’un fichier PDF en C++.