Ler diferentes tipos de documentos programaticamente é uma prática comum nos dias de hoje. Neste guia de instruções, você aprenderá a ler PDF Arquivo em C# seguindo as etapas simples abaixo.
Etapas para ler o arquivo PDF em C#
- Criar um aplicativo de console C# vazio no Visual Studio
- Adicione referência a Aspose.PDF for .NET instalando-o do NuGet.org
- Carregar um arquivo PDF existente no objeto Documento
- Inicialize a classe TextAbsorber para ler o arquivo PDF
- Extraia o texto do PDF e grave-o na saída do console
- Iterar na página PDF Resources para encontrar imagens
- Criar objeto FileStream com imagem encontrada
- Salve a imagem no disco local
Abaixo, o trecho de código explica como abrir e ler o arquivo PDF em C#. Você poderá ler texto e extrair imagens de um arquivo PDF usando-o. A API oferece a classe TextAbsorber que é usada para ler o texto do arquivo PDF e você pode obter os resultados extraídos por meio do objeto Text. Encontrar imagens e salvá-las no disco local também é possível percorrendo os recursos da página PDF, conforme mostrado abaixo.
Código para ler arquivo PDF em C#
No tópico anterior, você aprendeu como processar grandes arquivos PDF em C#. As informações acima e o exemplo de código permitirão que você abra e leia arquivos PDF em C# para extrair texto e imagens.