В этом кратком разделе с практическими рекомендациями основное внимание уделяется тому, как преобразовать PDF в HTML в C#. Вы можете экспортировать PDF в HTML на C#, используя простые вызовы API, не зависящие от Adobe Acrobat или любого другого стороннего инструмента. Это приложение можно использовать в любом приложении на основе .NET, работающем в операционных системах MS Windows, Linux или macOS.
Шаги по преобразованию PDF в HTML на C#
- Установите Aspose.PDF с помощью инструмента пакета NuGet в своем приложении.
- Добавьте ссылку на пространство имен Aspose.PDF в свое приложение.
- Инициализировать экземпляр класса Document для загрузки PDF и его преобразования в HTML
- Инициализируйте объект HtmlSaveOptions, чтобы задать параметры сохранения шрифтов, SVG и изображений.
- Наконец, конвертируйте PDF в HTML на C#, используя метод Сохранить.
Благодаря выполнению описанных выше шагов в C# преобразование PDF в HTML стало возможным благодаря использованию простых вызовов API. Вы начнете с добавления необходимых ссылок на API, а затем загрузите исходный PDF-файл. Позже вы установите необходимые параметры, требуемые в экспортируемом HTML, с помощью класса HtmlSaveOptions. Наконец, используя перечислитель SaveFormat.Html внутри метода Save, HTML будет сохранен на диске.
Код для преобразования PDF в HTML на С#
using System; | |
using Aspose.Pdf; | |
namespace TestPDF | |
{ | |
public class PdfToHtmlConverter | |
{ | |
public static void Main(string[] args) | |
{ | |
// Applying product license to create HTML from PDF in C# | |
License PdfLic = new License(); | |
PdfLic.SetLicense("PDF.Product.Family.lic"); | |
// Initialize document object load the source PDF for exporting to HTML | |
Document document = new Document("SourcePDF.pdf"); | |
// Initialize HTML SaveOptions to set export options | |
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions(); | |
// Split PDF to multiple HTML pages | |
htmlSaveOptions.SplitIntoPages = true; | |
htmlSaveOptions.FontSavingMode = HtmlSaveOptions.FontSavingModes.AlwaysSaveAsTTF; | |
// Managing SVG content | |
htmlSaveOptions.SpecialFolderForSvgImages = @"SvgSavePath"; | |
// Managing Images inside PDF | |
htmlSaveOptions.SpecialFolderForAllImages = @"ImageSavePath"; | |
// Create HTML from PDF using C# | |
document.Save("Generated_out.html",SaveFormat.Html); | |
} | |
} | |
} |
Приведенный выше пример на C# конвертирует PDF в HTML с использованием класса HtmlSaveOptions, который позволит вам установить такие параметры, как разделение PDF на несколько страниц и управление настройками шрифта. Он также позволяет вам устанавливать параметры экспорта SVG, такие как сжатие и путь для содержимого SVG, а также параметры пути для экспортируемых изображений из исходного PDF. Наконец, желаемый HTML-файл сохраняется на диске или в MemoryStream для дальнейшего использования.
Мы убедились, насколько удобно конвертировать PDF в HTML на C# и получать настраиваемый результат. Если вы хотите сохранить файл PDF в виде изображения, обратитесь к статье как конвертировать PDF в изображение в С#.