Hur man konverterar PDF till HTML i Java

I den här snabba handledningen kommer du att lära dig hur du konverterar PDF till HTML i Java. Man kan enkelt spara PDF till HTML i Java genom att använda enkla steg och köra kod i Windows, macOS eller Linux utan att vara beroende av Adobe Acrobat eller något annat tredjepartsverktyg.

Steg för att konvertera PDF till HTML i Java

  1. Konfigurera ditt projekt för att lägga till Aspose.PDF for Java-referens från Maven-förvaret
  2. Lägg till en referens till namnområdet Aspose.PDF i ditt projekt
  3. Instantiera Document class objekt för att ladda PDF för export till HTML
  4. Skapa HtmlSaveOptions-objekt för att ställa in olika HTML-alternativ
  5. Konvertera PDF till HTML i Java med hjälp av Spara-metoden

För att utveckla PDF till HTML-omvandlare kan Java-baserad applikation användas. Processen kommer att börja med att inkludera API-referens och ladda käll-PDF-fil från disk. I efterföljande steg kommer klassen HtmlSaveOptions att användas för att ställa in önskade exportalternativ för HTML-filer. Slutligen kommer den genererade HTML-koden att sparas med hjälp av Save-metoden och SaveFormat.Html-uppräkningen.

Kod för att spara PDF till HTML i Java

import com.aspose.pdf.Document;
import com.aspose.pdf.HtmlSaveOptions;
import com.aspose.pdf.HtmlSaveOptions.FontSavingModes;
import com.aspose.pdf.License;
import com.aspose.pdf.SaveFormat;
public class PdfToHtmlExport {
public static void Main(String[] args) throws Exception{
// Applying product license to create HTML from PDF in Java
License pdfJavaLic = new License();
pdfJavaLic.setLicense("PDF.Product.Family.lic");
// Initialize document object load the source PDF for exporting to HTML
Document document = new Document("Test.pdf");
// Initialize HTML SaveOptions to set export options
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions();
// Split multi HTML pages
htmlSaveOptions.setSplitIntoPages(true);
// Set Font saving mode
htmlSaveOptions.FontSavingMode = FontSavingModes.AlwaysSaveAsTTF;
// Managing SVG folders content
htmlSaveOptions.SpecialFolderForSvgImages = "\\SvgSavePath";
// Managing Images folder inside PDF
htmlSaveOptions.SpecialFolderForAllImages = "\\ImageSavePath";
// Using Java PDF to HTML export via Save method
document.save("Generated_out_Java.html",SaveFormat.Html);
}
}

Genom att använda ovanstående exempel i Java PDF till HTML kan konvertering enkelt uppnås. Vi har anpassat HTML-utdata genom att använda klassen HtmlSaveOptions som erbjuder möjligheten att ställa in SVG-exportalternativ som komprimering och SVG-innehåll tillsammans med sökvägsinställningar för exporterade bilder från käll-PDF. Du kan också hantera teckensnitt i exporterad HTML tillsammans med möjlighet att dela PDF-sidor till flersidiga HTML-utdata. Slutligen kan vi spara den genererade HTML-koden antingen på disk eller i en MemoryStream för vidare användning.

I exemplet ovan har vi lärt oss att konvertera PDF till HTML i Java med en anpassad utdata. Om du vill skapa en PDF programmatiskt, se artikeln om hur man skapar PDF med Java.

 Svenska