Neste tutorial rápido, você aprenderá a converter PDF em HTML em Java. Pode-se salvar facilmente PDF para HTML em Java adotando etapas simples e execução de código no Windows, macOS ou Linux sem depender do Adobe Acrobat ou de qualquer outra ferramenta de terceiros.
Passos para converter PDF para HTML em Java
- Configure seu projeto para adicionar referência Aspose.PDF for Java do repositório Maven
- Adicione uma referência ao namespace Aspose.PDF em seu projeto
- Instancie o objeto Document class para carregar PDF para exportação para HTML
- Crie o objeto HtmlSaveOptions para definir diferentes opções de HTML
- Converter PDF para HTML em Java usando o método Save
Para desenvolver o conversor de PDF para HTML, o aplicativo baseado em Java pode ser usado. O processo começará incluindo a referência da API e carregando o arquivo PDF de origem do disco. Nas etapas subsequentes, a classe HtmlSaveOptions será usada para definir as opções de exportação de arquivo HTML desejadas. Por fim, o HTML gerado será salvo usando o método Save e o enumerador SaveFormat.Html.
Código para salvar PDF em HTML em Java
import com.aspose.pdf.Document; | |
import com.aspose.pdf.HtmlSaveOptions; | |
import com.aspose.pdf.HtmlSaveOptions.FontSavingModes; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.SaveFormat; | |
public class PdfToHtmlExport { | |
public static void Main(String[] args) throws Exception{ | |
// Applying product license to create HTML from PDF in Java | |
License pdfJavaLic = new License(); | |
pdfJavaLic.setLicense("PDF.Product.Family.lic"); | |
// Initialize document object load the source PDF for exporting to HTML | |
Document document = new Document("Test.pdf"); | |
// Initialize HTML SaveOptions to set export options | |
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions(); | |
// Split multi HTML pages | |
htmlSaveOptions.setSplitIntoPages(true); | |
// Set Font saving mode | |
htmlSaveOptions.FontSavingMode = FontSavingModes.AlwaysSaveAsTTF; | |
// Managing SVG folders content | |
htmlSaveOptions.SpecialFolderForSvgImages = "\\SvgSavePath"; | |
// Managing Images folder inside PDF | |
htmlSaveOptions.SpecialFolderForAllImages = "\\ImageSavePath"; | |
// Using Java PDF to HTML export via Save method | |
document.save("Generated_out_Java.html",SaveFormat.Html); | |
} | |
} |
Usando o exemplo acima em Java PDF para HTML, a conversão pode ser facilmente alcançada. Personalizamos a saída HTML usando a classe HtmlSaveOptions, que oferece a possibilidade de definir as opções de exportação SVG, como compactação e conteúdo SVG, juntamente com configurações de caminho para imagens exportadas do PDF de origem. Você também pode gerenciar fontes dentro do HTML exportado junto com a opção de dividir páginas PDF para saída HTML de várias páginas. Finalmente, podemos salvar o HTML gerado em disco ou em um MemoryStream para uso posterior.
No exemplo acima, aprendemos a converter PDF para HTML em Java com uma saída personalizada. Se você deseja criar um PDF programaticamente, consulte o artigo em como criar PDF usando Java.