Как конвертировать PDF в HTML на Java

Из этого краткого руководства вы узнаете, как преобразовать PDF в HTML в Java. Можно легко сохранить PDF в HTML на Java, выполнив простые шаги и исполнив код в Windows, macOS или Linux без зависимости от Adobe Acrobat или любого другого стороннего инструмента.

Шаги для преобразования PDF в HTML в Java

  1. Настройте свой проект, чтобы добавить ссылку Aspose.PDF for Java из репозитория Maven.
  2. Добавьте ссылку на пространство имен Aspose.PDF в свой проект.
  3. Создать объект Document class для загрузки PDF для экспорта в HTML
  4. Создайте объект HtmlSaveOptions для установки различных параметров HTML.
  5. Преобразование PDF в HTML на Java с помощью метода «Сохранить»

Для разработки конвертера *PDF в HTML * можно использовать Java-приложение. Процесс начнется с включения ссылки на API и загрузки исходного PDF-файла с диска. На последующих шагах класс HtmlSaveOptions будет использоваться для установки желаемых параметров экспорта HTML-файла. Наконец, сгенерированный HTML будет сохранен с помощью метода Save и перечислителя SaveFormat.Html.

Код для сохранения PDF в HTML на Java

import com.aspose.pdf.Document;
import com.aspose.pdf.HtmlSaveOptions;
import com.aspose.pdf.HtmlSaveOptions.FontSavingModes;
import com.aspose.pdf.License;
import com.aspose.pdf.SaveFormat;
public class PdfToHtmlExport {
public static void Main(String[] args) throws Exception{
// Applying product license to create HTML from PDF in Java
License pdfJavaLic = new License();
pdfJavaLic.setLicense("PDF.Product.Family.lic");
// Initialize document object load the source PDF for exporting to HTML
Document document = new Document("Test.pdf");
// Initialize HTML SaveOptions to set export options
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions();
// Split multi HTML pages
htmlSaveOptions.setSplitIntoPages(true);
// Set Font saving mode
htmlSaveOptions.FontSavingMode = FontSavingModes.AlwaysSaveAsTTF;
// Managing SVG folders content
htmlSaveOptions.SpecialFolderForSvgImages = "\\SvgSavePath";
// Managing Images folder inside PDF
htmlSaveOptions.SpecialFolderForAllImages = "\\ImageSavePath";
// Using Java PDF to HTML export via Save method
document.save("Generated_out_Java.html",SaveFormat.Html);
}
}

Используя приведенный выше пример в Java PDF to HTML, можно легко преобразовать. Мы настроили вывод HTML с помощью класса HtmlSaveOptions, который позволяет установить параметры экспорта SVG, такие как сжатие и содержимое SVG, а также параметры пути для экспортируемых изображений из исходного PDF. Вы также можете управлять шрифтами внутри экспортированного HTML, а также иметь возможность разбивать страницы PDF на многостраничный вывод HTML. Наконец, мы можем сохранить сгенерированный HTML либо на диск, либо в MemoryStream для дальнейшего использования.

В приведенном выше примере мы научились конвертировать PDF в HTML на Java с настраиваемым выводом. Если вы хотите создать PDF-файл программно, обратитесь к статье как создать PDF с помощью Java.

 Русский