Como ler arquivo PDF em C#

Ler diferentes tipos de documentos programaticamente é uma prática comum nos dias de hoje. Neste guia de instruções, você aprenderá a ler PDF Arquivo em C# seguindo as etapas simples abaixo.

Etapas para ler o arquivo PDF em C#

  1. Criar um aplicativo de console C# vazio no Visual Studio
  2. Adicione referência a Aspose.PDF for .NET instalando-o do NuGet.org
  3. Carregar um arquivo PDF existente no objeto Documento
  4. Inicialize a classe TextAbsorber para ler o arquivo PDF
  5. Extraia o texto do PDF e grave-o na saída do console
  6. Iterar na página PDF Resources para encontrar imagens
  7. Criar objeto FileStream com imagem encontrada
  8. Salve a imagem no disco local

Abaixo, o trecho de código explica como abrir e ler o arquivo PDF em C#. Você poderá ler texto e extrair imagens de um arquivo PDF usando-o. A API oferece a classe TextAbsorber que é usada para ler o texto do arquivo PDF e você pode obter os resultados extraídos por meio do objeto Text. Encontrar imagens e salvá-las no disco local também é possível percorrendo os recursos da página PDF, conforme mostrado abaixo.

Código para ler arquivo PDF em C#

No tópico anterior, você aprendeu como processar grandes arquivos PDF em C#. As informações acima e o exemplo de código permitirão que você abra e leia arquivos PDF em C# para extrair texto e imagens.

 Português