La lectura de diferentes tipos de documentos mediante programación es una práctica común en estos días. En esta guía práctica, aprenderá a leer el archivo PDF en C# siguiendo los sencillos pasos que se indican a continuación.
Pasos para leer un archivo PDF en C#
- Cree una aplicación de consola C# vacía en Visual Studio
- Agregue una referencia a Aspose.PDF for .NET instalándolo desde NuGet.org
- Cargue un archivo PDF existente en el objeto Documento
- Inicialice la clase TextAbsorber para leer el archivo PDF
- Extraiga el texto del PDF y escríbalo en la salida de la Consola
- Iterar a través de la página PDF Resources para encontrar imágenes
- Crear objeto FileStream con imagen encontrada
- Guardar la imagen en el disco local
A continuación, el fragmento de código explica cómo abrir y leer un archivo PDF en C#. Podrá leer texto y extraer imágenes de un archivo PDF usándolo. La API ofrece la clase TextAbsorber que se usa para leer texto de un archivo PDF y puede lograr los resultados extraídos a través del objeto Text. También es posible encontrar imágenes y guardarlas en el disco local recorriendo los recursos de la página PDF como se muestra a continuación.
Código para leer archivo PDF en C#
En el tema anterior, aprendiste cómo procesar archivos PDF grandes en C#. La información anterior y el ejemplo de código le permitirán abrir y leer archivos PDF en C# para extraer texto e imágenes.