Как конвертировать Word в HTML с помощью C++

В этом кратком руководстве мы поймем, как конвертировать Word в HTML с помощью C++. Входной файл может быть в формате DOCX или DOC и содержать текст, изображения, таблицы и т. д. Вы можете сохранить Word как HTML в C++, чтобы использовать информацию на веб-сайте или в веб-приложении, выполнив это преобразование в любых операционных системах с помощью нескольких вызовов API.

Шаги по преобразованию Word в HTML с помощью C++

  1. Установите библиотеку Aspose.Words.Cpp с помощью диспетчера пакетов NuGet в интегрированной среде разработки Visual Studio.
  2. Используйте ссылки на Aspose::Words и Aspose::Words::Saving namespaces
  3. Создайте экземпляр Document Class для загрузки входного документа Word.
  4. Инициализировать экземпляр класса HtmlSaveOptions и указать его свойства.
  5. Сохранить выходной файл в формате HTML

В приведенных выше шагах мы рассмотрели, как преобразовать DOCX в HTML с помощью C++. Вы можете изменить различные настройки выходного HTML-файла, такие как ресурсы шрифта или изображения, стиль CSS, кодировку и т. д., в соответствии с вашими требованиями. Выходной HTML-файл отображается с высокой точностью, при этом требуется мало времени и ресурсов ЦП.

Код для экспорта Word в HTML на C++

#pragma once
#include <cstdint>
#include <iostream>
#include <Aspose.Words.Cpp/Document.h>
#include <Aspose.Words.Cpp/License.h>
#include <Aspose.Words.Cpp/Saving/HtmlSaveOptions.h>
#include <system/exceptions.h>
using System::MakeObject;
using System::SharedPtr;
using System::String;
using namespace Aspose::Words;
using namespace Aspose::Words::Saving;
void DOCXtoHTML()
{
// Set license
System::String LicFilePath = u"Aspose.Total.CPP.lic";
SharedPtr<License> WordsCPPLicenseForDOCXtoHTML = System::MakeObject<License>();
WordsCPPLicenseForDOCXtoHTML->SetLicense(LicFilePath);
// Instantiate Document class for loading input document for converting to HTML
SharedPtr <Document> doc = MakeObject<Document>(u"Test.docx");
// Initilaize HtmlSaveOptions to convert DOCX to HTML file
SharedPtr <HtmlSaveOptions> saveOptions = MakeObject<HtmlSaveOptions>();
saveOptions->set_CssStyleSheetType(CssStyleSheetType::External);
saveOptions->set_ExportFontResources(true);
saveOptions->set_PrettyFormat(true);
saveOptions->set_ResolveFontNames(true);
// Save output HTML file
doc->Save(u"Output.html", saveOptions);
}

В приведенном выше фрагменте кода сначала мы загружаем входной файл Word с объектом класса Document, а затем устанавливаем несколько свойств для ожидаемого выходного HTML-файла, используя класс HtmlSaveOptions. В последних строках мы вызываем метод Save для записи выходной HTML-страницы по указанному пути с указанным именем файла. Более того, это преобразование не зависит от установки MS Word или любого другого интерфейса для экспорта Word в HTML на C++.

В предыдущем разделе мы подробно рассмотрели, как Отправить документ Word по электронной почте с помощью C++. Однако здесь мы рассмотрели, как конвертировать DOCX в HTML с помощью C++.

 Русский