Como localizar e substituir texto em PDF usando Java

Este breve tutorial explica como localizar e substituir texto em PDF usando Java. Também é útil em cenários em que você deseja excluir algumas informações confidenciais ou categorizadas. Para substituir o texto, carregue a pesquisa PDF e substitua usando Java e salve o documento PDF atualizado.

Etapas para localizar e substituir texto em PDF usando Java

  1. Configure seu aplicativo para instalar Aspose.PDF for Java para localizar e substituir texto
  2. Carregue o arquivo PDF de entrada usando a classe Document para substituir o texto
  3. Especifique a frase de texto que precisa ser pesquisada no objeto TextFragmentAbsorber
  4. Defina as opções de substituição de texto e aceite o absorvedor de texto para todas as páginas
  5. Crie uma coleção de frases de texto correspondentes no PDF
  6. Atualize o texto encontrado substituindo-o por um novo texto
  7. Salve o arquivo PDF de saída após substituir o texto

Estas etapas resumem como, com a ajuda de Java, substitua texto em PDF em seus aplicativos. Podemos realizar esta operação em um arquivo PDF recém-criado, bem como em um documento PDF existente, dependendo do fluxo de trabalho do aplicativo. Observe que, ao substituir o texto, você também pode alterar a fonte do texto, a cor do primeiro plano e a cor do plano de fundo.

Código para substituir texto em PDF usando Java

import com.aspose.pdf.Document;
import com.aspose.pdf.License;
public class FindAndReplaceTextInPdfUsingJava {
public static void main(String[] args) throws Exception {
// Instantiate license to create presentation in HTML
License pdfLicense = new License();
pdfLicense.setLicense("Aspose.Pdf.lic");
// Load the input PDF document
Document pdfDocument = new Document("Input.pdf");
// Create TextFragmentAbsorber object
com.aspose.pdf.TextFragmentAbsorber textFragmentAbsorber = new com.aspose.pdf.TextFragmentAbsorber("Rack");
// Set text replace options
com.aspose.pdf.TextReplaceOptions options = new com.aspose.pdf.TextReplaceOptions();
options.setReplaceScope(com.aspose.pdf.TextReplaceOptions.Scope.REPLACE_FIRST);
textFragmentAbsorber.setTextReplaceOptions(options);
// Accept the text absorber for the entire collection of pages
pdfDocument.getPages().accept(textFragmentAbsorber);
// Get the extracted fragments in a collection
com.aspose.pdf.TextFragmentCollection textFragmentCollection = textFragmentAbsorber.getTextFragments();
// Loop through all text fragments
for (com.aspose.pdf.TextFragment textFragment : textFragmentCollection) {
// Update the text
textFragment.setText("New Rack");
}
// Save the updated PDF file
pdfDocument.save("Output.pdf");
System.out.println("Done");
}
}

Este exemplo de código mostra como substituir texto em PDF usando Java. Além disso, você pode trabalhar com muitas propriedades para aprimorar o trecho de código. Por exemplo, atualizar as propriedades de aparência do texto, localizar o texto de uma região de página específica, localizar texto usando uma expressão regular, escopo de substituição de texto, estratégia de substituição de texto etc.

Para substituir texto em PDF, a configuração do ambiente baseado em Java e o trecho de código são discutidos neste artigo. No entanto, se você quiser aprender a proteger PDF com uma senha, consulte o artigo em como proteger PDF com senha em Java.

 Português