Как конвертировать PDF в HTML на C#

В этом кратком разделе с практическими рекомендациями основное внимание уделяется тому, как преобразовать PDF в HTML в C#. Вы можете экспортировать PDF в HTML на C#, используя простые вызовы API, не зависящие от Adobe Acrobat или любого другого стороннего инструмента. Это приложение можно использовать в любом приложении на основе .NET, работающем в операционных системах MS Windows, Linux или macOS.

Шаги по преобразованию PDF в HTML на C#

  1. Установите Aspose.PDF с помощью инструмента пакета NuGet в своем приложении.
  2. Добавьте ссылку на пространство имен Aspose.PDF в свое приложение.
  3. Инициализировать экземпляр класса Document для загрузки PDF и его преобразования в HTML
  4. Инициализируйте объект HtmlSaveOptions, чтобы задать параметры сохранения шрифтов, SVG и изображений.
  5. Наконец, конвертируйте PDF в HTML на C#, используя метод Сохранить.

Благодаря выполнению описанных выше шагов в C# преобразование PDF в HTML стало возможным благодаря использованию простых вызовов API. Вы начнете с добавления необходимых ссылок на API, а затем загрузите исходный PDF-файл. Позже вы установите необходимые параметры, требуемые в экспортируемом HTML, с помощью класса HtmlSaveOptions. Наконец, используя перечислитель SaveFormat.Html внутри метода Save, HTML будет сохранен на диске.

Код для преобразования PDF в HTML на С#

using System;
using Aspose.Pdf;
namespace TestPDF
{
public class PdfToHtmlConverter
{
public static void Main(string[] args)
{
// Applying product license to create HTML from PDF in C#
License PdfLic = new License();
PdfLic.SetLicense("PDF.Product.Family.lic");
// Initialize document object load the source PDF for exporting to HTML
Document document = new Document("SourcePDF.pdf");
// Initialize HTML SaveOptions to set export options
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions();
// Split PDF to multiple HTML pages
htmlSaveOptions.SplitIntoPages = true;
htmlSaveOptions.FontSavingMode = HtmlSaveOptions.FontSavingModes.AlwaysSaveAsTTF;
// Managing SVG content
htmlSaveOptions.SpecialFolderForSvgImages = @"SvgSavePath";
// Managing Images inside PDF
htmlSaveOptions.SpecialFolderForAllImages = @"ImageSavePath";
// Create HTML from PDF using C#
document.Save("Generated_out.html",SaveFormat.Html);
}
}
}

Приведенный выше пример на C# конвертирует PDF в HTML с использованием класса HtmlSaveOptions, который позволит вам установить такие параметры, как разделение PDF на несколько страниц и управление настройками шрифта. Он также позволяет вам устанавливать параметры экспорта SVG, такие как сжатие и путь для содержимого SVG, а также параметры пути для экспортируемых изображений из исходного PDF. Наконец, желаемый HTML-файл сохраняется на диске или в MemoryStream для дальнейшего использования.

Мы убедились, насколько удобно конвертировать PDF в HTML на C# и получать настраиваемый результат. Если вы хотите сохранить файл PDF в виде изображения, обратитесь к статье как конвертировать PDF в изображение в С#.

 Русский