Como converter PDF para HTML em Java

Neste tutorial rápido, você aprenderá a converter PDF em HTML em Java. Pode-se salvar facilmente PDF para HTML em Java adotando etapas simples e execução de código no Windows, macOS ou Linux sem depender do Adobe Acrobat ou de qualquer outra ferramenta de terceiros.

Passos para converter PDF para HTML em Java

  1. Configure seu projeto para adicionar referência Aspose.PDF for Java do repositório Maven
  2. Adicione uma referência ao namespace Aspose.PDF em seu projeto
  3. Instancie o objeto Document class para carregar PDF para exportação para HTML
  4. Crie o objeto HtmlSaveOptions para definir diferentes opções de HTML
  5. Converter PDF para HTML em Java usando o método Save

Para desenvolver o conversor de PDF para HTML, o aplicativo baseado em Java pode ser usado. O processo começará incluindo a referência da API e carregando o arquivo PDF de origem do disco. Nas etapas subsequentes, a classe HtmlSaveOptions será usada para definir as opções de exportação de arquivo HTML desejadas. Por fim, o HTML gerado será salvo usando o método Save e o enumerador SaveFormat.Html.

Código para salvar PDF em HTML em Java

import com.aspose.pdf.Document;
import com.aspose.pdf.HtmlSaveOptions;
import com.aspose.pdf.HtmlSaveOptions.FontSavingModes;
import com.aspose.pdf.License;
import com.aspose.pdf.SaveFormat;
public class PdfToHtmlExport {
public static void Main(String[] args) throws Exception{
// Applying product license to create HTML from PDF in Java
License pdfJavaLic = new License();
pdfJavaLic.setLicense("PDF.Product.Family.lic");
// Initialize document object load the source PDF for exporting to HTML
Document document = new Document("Test.pdf");
// Initialize HTML SaveOptions to set export options
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions();
// Split multi HTML pages
htmlSaveOptions.setSplitIntoPages(true);
// Set Font saving mode
htmlSaveOptions.FontSavingMode = FontSavingModes.AlwaysSaveAsTTF;
// Managing SVG folders content
htmlSaveOptions.SpecialFolderForSvgImages = "\\SvgSavePath";
// Managing Images folder inside PDF
htmlSaveOptions.SpecialFolderForAllImages = "\\ImageSavePath";
// Using Java PDF to HTML export via Save method
document.save("Generated_out_Java.html",SaveFormat.Html);
}
}

Usando o exemplo acima em Java PDF para HTML, a conversão pode ser facilmente alcançada. Personalizamos a saída HTML usando a classe HtmlSaveOptions, que oferece a possibilidade de definir as opções de exportação SVG, como compactação e conteúdo SVG, juntamente com configurações de caminho para imagens exportadas do PDF de origem. Você também pode gerenciar fontes dentro do HTML exportado junto com a opção de dividir páginas PDF para saída HTML de várias páginas. Finalmente, podemos salvar o HTML gerado em disco ou em um MemoryStream para uso posterior.

No exemplo acima, aprendemos a converter PDF para HTML em Java com uma saída personalizada. Se você deseja criar um PDF programaticamente, consulte o artigo em como criar PDF usando Java.

 Português