Converter PDF digitalizado em PDF editável usando Java

Este breve tutorial orienta sobre como converter PDF digitalizado em PDF editável usando Java. Inclui detalhes para configurar o IDE, uma lista de etapas e código de exemplo para converter PDF digitalizado em PDF pesquisável usando Java. Você receberá detalhes para personalizar o processo de digitalização de imagem e conversão de conteúdo em texto legível.

Etapas para tornar PDF legível usando Java

  1. Configure o IDE para usar Aspose.Total for Java para transformar um PDF escaneado em um PDF pesquisável
  2. Instanciar licenças de produto correspondentes para evitar marcas d’água na saída
  3. Crie uma instância do motor de reconhecimento usando a classe AsposeOCR
  4. Crie a instância de entrada usando a classe OcrInput e carregue o PDF escaneado de origem nela
  5. Crie a instância RecognitionSettings para definir parâmetros da personalização durante a varredura de imagem
  6. Chame o método AsposeOCR.Recognize() para buscar dados do PDF digitalizado e armazená‑los em um PDF temporário
  7. Carregue o PDF intermediário no objeto de classe Document do Aspose.PDF e defina os metadados nele
  8. Salve o PDF final no disco com texto pesquisável e metadados

Estas etapas descrevem como converter imagem PDF em texto PDF usando Java. Crie o objeto do mecanismo de reconhecimento, prepare o arquivo de entrada adicionando o PDF escaneado ao objeto OcrInput, defina os parâmetros no objeto RecognitionSettings, chame o método Recognize() para escanear os dados e salvar os resultados em um arquivo PDF intermediário. Por fim, carregue o arquivo PDF intermediário usando o objeto Aspose.PDF.Documente e adicione metadados ou formate‑o ainda mais antes de salvar o arquivo PDF final.

Código para converter imagem PDF em texto usando Java

Este código demonstra como converter PDF em PDF pesquisável usando Java. Você pode definir um idioma de detecção específico ao escanear o PDF, definir uma flag para auto‑detectar o idioma, restringir o reconhecimento a caracteres específicos ou colocar na lista negra caracteres que você deseja que o OCR ignore. Também há opções disponíveis para escolher a estratégia de detecção de área/layout do documento fonte, se necessário.

Este artigo nos ensinou o processo de converter um PDF em um PDF de texto selecionável. Para exportar dados de um formulário PDF para Excel, consulte o artigo Exportar Dados de um Formulário PDF para Excel usando Java.

 Português