Neste tutorial, aprenderemos a ler o arquivo PDF em C++. Você pode extrair texto ou imagens de qualquer página ou documento inteiro do arquivo PDF com simples chamadas de API em C++. O recurso não depende do Adobe Acrobat ou de qualquer aplicativo para leitura de PDF nas plataformas Windows ou Linux.
Etapas para ler o arquivo PDF em C++
- Instale o Aspose.Pdf for C++ da ferramenta gerenciador de pacotes NuGet
- Adicione a referência ao namespace Aspose::Pdf
- Carregar PDF de entrada usando Document Class
- Inicializar uma instância da classe TextFragmentAbsorber
- Imprima o texto extraído no console
- Iterar através de cada página e imagem do documento
- Salve a imagem de saída extraída como um arquivo JPG
Você pode abrir e ler arquivos pdf em C++ com algumas linhas simples de código. Ele pode extrair com eficiência todo o texto e imagens do arquivo PDF.
Código para ler arquivo PDF em C++
No tópico anterior, exploramos Como achatar campos de formulário PDF em C#. Este tópico se concentra em como ler texto de um arquivo PDF em C++.