如何使用 C++ 将 Word 转换为 HTML

在这个简短的教程中,我们将了解如何使用 C++** 将 Word 转换为 HTML。输入文件可以是 DOCX 或包含文本、图像、表格等的 DOC 格式。您可以 将 Word 保存为 C++ 中的 HTML 以使用网站或基于 Web 的应用程序中的信息,方法是执行这种转换可以在任何操作系统上进行一些 API 调用。

使用 C++ 将 Word 转换为 HTML 的步骤

  1. 在 Visual Studio IDE 中使用 NuGet 包管理器安装 Aspose.Words.Cpp
  2. 使用对 Aspose::Words 和 Aspose::Words::Saving 命名空间的引用
  3. 实例化 Document Class 的实例以加载输入的 Word 文档
  4. 初始化 HtmlSaveOptions 类的实例并指定其属性
  5. 以 HTML 格式保存输出文件

在上述步骤中,我们探索了如何使用 C++* 将 DOCX 转换为 HTML。您可以根据需要更改输出 HTML 文件的不同首选项,例如字体或图像资源、CSS 样式、编码等。输出的 HTML 文件以高保真度呈现,同时消耗很少的时间和 CPU 资源。

在 C++ 中将 Word 导出为 HTML 的代码

#pragma once
#include <cstdint>
#include <iostream>
#include <Aspose.Words.Cpp/Document.h>
#include <Aspose.Words.Cpp/License.h>
#include <Aspose.Words.Cpp/Saving/HtmlSaveOptions.h>
#include <system/exceptions.h>
using System::MakeObject;
using System::SharedPtr;
using System::String;
using namespace Aspose::Words;
using namespace Aspose::Words::Saving;
void DOCXtoHTML()
{
// Set license
System::String LicFilePath = u"Aspose.Total.CPP.lic";
SharedPtr<License> WordsCPPLicenseForDOCXtoHTML = System::MakeObject<License>();
WordsCPPLicenseForDOCXtoHTML->SetLicense(LicFilePath);
// Instantiate Document class for loading input document for converting to HTML
SharedPtr <Document> doc = MakeObject<Document>(u"Test.docx");
// Initilaize HtmlSaveOptions to convert DOCX to HTML file
SharedPtr <HtmlSaveOptions> saveOptions = MakeObject<HtmlSaveOptions>();
saveOptions->set_CssStyleSheetType(CssStyleSheetType::External);
saveOptions->set_ExportFontResources(true);
saveOptions->set_PrettyFormat(true);
saveOptions->set_ResolveFontNames(true);
// Save output HTML file
doc->Save(u"Output.html", saveOptions);
}

在上面的代码片段中,首先我们使用 Document 类的对象加载输入 Word 文件,然后使用 HtmlSaveOptions class 为预期的输出 HTML 文件设置几个属性。在最后几行中,我们调用 Save 方法以将输出 HTML 页面写入指定路径并使用提到的文件名。此外,这种转换不依赖于 MS Word 的安装或任何其他将 Word 导出为 C++ 中的 HTML 的接口*。

在上一主题中,我们查看了有关如何 使用 C++ 通过电子邮件发送 Word 文档 的详细信息。然而,在这里我们已经考虑了如何使用 C++* 将 DOCX 转换为 HTML。

 简体中文