Come convertire PDF in HTML in Java

In questo breve tutorial imparerai come convertire PDF in HTML in Java. È possibile salvare facilmente PDF in HTML in Java adottando semplici passaggi ed eseguendo il codice in Windows, macOS o Linux senza dipendere da Adobe Acrobat o da qualsiasi altro strumento di terze parti.

Passaggi per convertire PDF in HTML in Java

  1. Configura il tuo progetto per aggiungere Aspose.PDF for Java riferimento dal repository Maven
  2. Aggiungi un riferimento allo spazio dei nomi Aspose.PDF nel tuo progetto
  3. Crea un’istanza dell’oggetto Document class per caricare il PDF per l’esportazione in HTML
  4. Crea un oggetto HtmlSaveOptions per impostare diverse opzioni HTML
  5. Converti PDF in HTML in Java usando il metodo Salva

Per sviluppare un convertitore PDF in HTML è possibile utilizzare un’applicazione basata su Java. Il processo inizierà includendo il riferimento API e caricando il file PDF di origine dal disco. Nei passaggi successivi, la classe HtmlSaveOptions verrà utilizzata per impostare le opzioni di esportazione dei file HTML desiderate. Infine, l’HTML generato verrà salvato utilizzando il metodo Save e l’enumeratore SaveFormat.Html.

Codice per salvare PDF in HTML in Java

import com.aspose.pdf.Document;
import com.aspose.pdf.HtmlSaveOptions;
import com.aspose.pdf.HtmlSaveOptions.FontSavingModes;
import com.aspose.pdf.License;
import com.aspose.pdf.SaveFormat;
public class PdfToHtmlExport {
public static void Main(String[] args) throws Exception{
// Applying product license to create HTML from PDF in Java
License pdfJavaLic = new License();
pdfJavaLic.setLicense("PDF.Product.Family.lic");
// Initialize document object load the source PDF for exporting to HTML
Document document = new Document("Test.pdf");
// Initialize HTML SaveOptions to set export options
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions();
// Split multi HTML pages
htmlSaveOptions.setSplitIntoPages(true);
// Set Font saving mode
htmlSaveOptions.FontSavingMode = FontSavingModes.AlwaysSaveAsTTF;
// Managing SVG folders content
htmlSaveOptions.SpecialFolderForSvgImages = "\\SvgSavePath";
// Managing Images folder inside PDF
htmlSaveOptions.SpecialFolderForAllImages = "\\ImageSavePath";
// Using Java PDF to HTML export via Save method
document.save("Generated_out_Java.html",SaveFormat.Html);
}
}

Utilizzando l’esempio sopra in Java PDF in HTML la conversione può essere facilmente ottenuta. Abbiamo personalizzato l’output HTML utilizzando la classe HtmlSaveOptions che offre la possibilità di impostare le opzioni di esportazione SVG come la compressione e il contenuto SVG insieme alle impostazioni del percorso per le immagini esportate dal PDF sorgente. Puoi anche gestire i caratteri all’interno dell’HTML esportato insieme all’opzione per dividere le pagine PDF in output HTML multipagina. Infine, possiamo salvare l’HTML generato su disco o in un MemoryStream per un ulteriore utilizzo.

Nell’esempio sopra, abbiamo imparato a convertire PDF in HTML in Java con un output personalizzato. Se stai cercando di creare un PDF in modo programmatico, consulta l’articolo su come creare PDF utilizzando Java.

 Italiano