В этом кратком руководстве мы узнаем, как преобразовать Word Document в HTML с помощью C#. Мы можем эффективно экспортировать DOCX в HTML на C#, выполнив следующие простые шаги и фрагмент кода. Вы можете выполнить это преобразование в любой операционной системе, такой как macOS, Linux или MS Windows, где настроена платформа .NET.
Действия по преобразованию документа Word в HTML с помощью C#
- Установите библиотеку Aspose.Words из подключаемого модуля диспетчера пакетов NuGet.
- Создайте объект класса Document для загрузки DOCX.
- Укажите различные свойства, связанные с CssStyleSheet, полями страницы, параметрами страницы и т. д.
- Сохраните выходной файл как файл HTML
В приведенных выше шагах сначала создается экземпляр * класса Document * для загрузки входного документа Word, а затем устанавливаются различные свойства для процесса рендеринга, такие как поля страницы, параметры страницы и т. д., чтобы настроить свойства выходного HTML-файла. В конце концов, выходной файл сохраняется с расширением HTML.
Код для экспорта DOCX в HTML на С#
using System; | |
using Aspose.Words; | |
using Aspose.Words.Saving; | |
namespace ConvertDOCXtoHTMLinCsharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Use Aspose.Words license to remove trial version limitations after converting Word DOCX to HTML | |
License licenseForConvertingDOCXtoHTML = new License(); | |
licenseForConvertingDOCXtoHTML.SetLicense("Aspose.Words.lic"); | |
// Load input Word DOCX file with Document class | |
Document doc = new Document("Input.docx"); | |
// Set different properties of HtmlSaveOptions class | |
HtmlSaveOptions saveOptions = new HtmlSaveOptions(); | |
saveOptions.CssStyleSheetType = CssStyleSheetType.Inline; | |
saveOptions.ExportPageMargins = true; | |
saveOptions.ImageResolution = 90; | |
// Save output HTML | |
doc.Save("HtmlSaveOptions.html", saveOptions); | |
} | |
} | |
} |
В этом примере кода объявлен экземпляр класса Document для загрузки входного документа Word. Затем указываются различные параметры рендеринга для управления свойствами выходного HTML-файла. Вы можете управлять тем, как отображаются шрифты и изображения, или таблицами стилей css и настройками папок для преобразования файлов в соответствии с вашими требованиями. Наконец, мы сгенерируем HTML из DOCX с помощью C#.
В этой статье мы рассмотрели, как генерировать HTML из DOCX с помощью C#. Однако, если вы хотите преобразовать файл DOCX в TIFF, обратитесь к статье как конвертировать DOCX в TIFF с помощью C#.