Cómo leer un archivo PDF en C#

La lectura de diferentes tipos de documentos mediante programación es una práctica común en estos días. En esta guía práctica, aprenderá a leer el archivo PDF en C# siguiendo los sencillos pasos que se indican a continuación.

Pasos para leer un archivo PDF en C#

  1. Cree una aplicación de consola C# vacía en Visual Studio
  2. Agregue una referencia a Aspose.PDF for .NET instalándolo desde NuGet.org
  3. Cargue un archivo PDF existente en el objeto Documento
  4. Inicialice la clase TextAbsorber para leer el archivo PDF
  5. Extraiga el texto del PDF y escríbalo en la salida de la Consola
  6. Iterar a través de la página PDF Resources para encontrar imágenes
  7. Crear objeto FileStream con imagen encontrada
  8. Guardar la imagen en el disco local

A continuación, el fragmento de código explica cómo abrir y leer un archivo PDF en C#. Podrá leer texto y extraer imágenes de un archivo PDF usándolo. La API ofrece la clase TextAbsorber que se usa para leer texto de un archivo PDF y puede lograr los resultados extraídos a través del objeto Text. También es posible encontrar imágenes y guardarlas en el disco local recorriendo los recursos de la página PDF como se muestra a continuación.

Código para leer archivo PDF en C#

En el tema anterior, aprendiste cómo procesar archivos PDF grandes en C#. La información anterior y el ejemplo de código le permitirán abrir y leer archivos PDF en C# para extraer texto e imágenes.

 Español