Из этого краткого руководства вы узнаете, как преобразовать PDF в HTML в Java. Можно легко сохранить PDF в HTML на Java, выполнив простые шаги и исполнив код в Windows, macOS или Linux без зависимости от Adobe Acrobat или любого другого стороннего инструмента.
Шаги для преобразования PDF в HTML в Java
- Настройте свой проект, чтобы добавить ссылку Aspose.PDF for Java из репозитория Maven.
- Добавьте ссылку на пространство имен Aspose.PDF в свой проект.
- Создать объект Document class для загрузки PDF для экспорта в HTML
- Создайте объект HtmlSaveOptions для установки различных параметров HTML.
- Преобразование PDF в HTML на Java с помощью метода «Сохранить»
Для разработки конвертера *PDF в HTML * можно использовать Java-приложение. Процесс начнется с включения ссылки на API и загрузки исходного PDF-файла с диска. На последующих шагах класс HtmlSaveOptions будет использоваться для установки желаемых параметров экспорта HTML-файла. Наконец, сгенерированный HTML будет сохранен с помощью метода Save и перечислителя SaveFormat.Html.
Код для сохранения PDF в HTML на Java
import com.aspose.pdf.Document; | |
import com.aspose.pdf.HtmlSaveOptions; | |
import com.aspose.pdf.HtmlSaveOptions.FontSavingModes; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.SaveFormat; | |
public class PdfToHtmlExport { | |
public static void Main(String[] args) throws Exception{ | |
// Applying product license to create HTML from PDF in Java | |
License pdfJavaLic = new License(); | |
pdfJavaLic.setLicense("PDF.Product.Family.lic"); | |
// Initialize document object load the source PDF for exporting to HTML | |
Document document = new Document("Test.pdf"); | |
// Initialize HTML SaveOptions to set export options | |
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions(); | |
// Split multi HTML pages | |
htmlSaveOptions.setSplitIntoPages(true); | |
// Set Font saving mode | |
htmlSaveOptions.FontSavingMode = FontSavingModes.AlwaysSaveAsTTF; | |
// Managing SVG folders content | |
htmlSaveOptions.SpecialFolderForSvgImages = "\\SvgSavePath"; | |
// Managing Images folder inside PDF | |
htmlSaveOptions.SpecialFolderForAllImages = "\\ImageSavePath"; | |
// Using Java PDF to HTML export via Save method | |
document.save("Generated_out_Java.html",SaveFormat.Html); | |
} | |
} |
Используя приведенный выше пример в Java PDF to HTML, можно легко преобразовать. Мы настроили вывод HTML с помощью класса HtmlSaveOptions, который позволяет установить параметры экспорта SVG, такие как сжатие и содержимое SVG, а также параметры пути для экспортируемых изображений из исходного PDF. Вы также можете управлять шрифтами внутри экспортированного HTML, а также иметь возможность разбивать страницы PDF на многостраничный вывод HTML. Наконец, мы можем сохранить сгенерированный HTML либо на диск, либо в MemoryStream для дальнейшего использования.
В приведенном выше примере мы научились конвертировать PDF в HTML на Java с настраиваемым выводом. Если вы хотите создать PDF-файл программно, обратитесь к статье как создать PDF с помощью Java.