В этом кратком руководстве мы поймем, как конвертировать Word в HTML с помощью C++. Входной файл может быть в формате DOCX или DOC и содержать текст, изображения, таблицы и т. д. Вы можете сохранить Word как HTML в C++, чтобы использовать информацию на веб-сайте или в веб-приложении, выполнив это преобразование в любых операционных системах с помощью нескольких вызовов API.
Шаги по преобразованию Word в HTML с помощью C++
- Установите библиотеку Aspose.Words.Cpp с помощью диспетчера пакетов NuGet в интегрированной среде разработки Visual Studio.
- Используйте ссылки на Aspose::Words и Aspose::Words::Saving namespaces
- Создайте экземпляр Document Class для загрузки входного документа Word.
- Инициализировать экземпляр класса HtmlSaveOptions и указать его свойства.
- Сохранить выходной файл в формате HTML
В приведенных выше шагах мы рассмотрели, как преобразовать DOCX в HTML с помощью C++. Вы можете изменить различные настройки выходного HTML-файла, такие как ресурсы шрифта или изображения, стиль CSS, кодировку и т. д., в соответствии с вашими требованиями. Выходной HTML-файл отображается с высокой точностью, при этом требуется мало времени и ресурсов ЦП.
Код для экспорта Word в HTML на C++
#pragma once | |
#include <cstdint> | |
#include <iostream> | |
#include <Aspose.Words.Cpp/Document.h> | |
#include <Aspose.Words.Cpp/License.h> | |
#include <Aspose.Words.Cpp/Saving/HtmlSaveOptions.h> | |
#include <system/exceptions.h> | |
using System::MakeObject; | |
using System::SharedPtr; | |
using System::String; | |
using namespace Aspose::Words; | |
using namespace Aspose::Words::Saving; | |
void DOCXtoHTML() | |
{ | |
// Set license | |
System::String LicFilePath = u"Aspose.Total.CPP.lic"; | |
SharedPtr<License> WordsCPPLicenseForDOCXtoHTML = System::MakeObject<License>(); | |
WordsCPPLicenseForDOCXtoHTML->SetLicense(LicFilePath); | |
// Instantiate Document class for loading input document for converting to HTML | |
SharedPtr <Document> doc = MakeObject<Document>(u"Test.docx"); | |
// Initilaize HtmlSaveOptions to convert DOCX to HTML file | |
SharedPtr <HtmlSaveOptions> saveOptions = MakeObject<HtmlSaveOptions>(); | |
saveOptions->set_CssStyleSheetType(CssStyleSheetType::External); | |
saveOptions->set_ExportFontResources(true); | |
saveOptions->set_PrettyFormat(true); | |
saveOptions->set_ResolveFontNames(true); | |
// Save output HTML file | |
doc->Save(u"Output.html", saveOptions); | |
} |
В приведенном выше фрагменте кода сначала мы загружаем входной файл Word с объектом класса Document, а затем устанавливаем несколько свойств для ожидаемого выходного HTML-файла, используя класс HtmlSaveOptions. В последних строках мы вызываем метод Save для записи выходной HTML-страницы по указанному пути с указанным именем файла. Более того, это преобразование не зависит от установки MS Word или любого другого интерфейса для экспорта Word в HTML на C++.
В предыдущем разделе мы подробно рассмотрели, как Отправить документ Word по электронной почте с помощью C++. Однако здесь мы рассмотрели, как конвертировать DOCX в HTML с помощью C++.