在这个简单的主题中,您将学习如何使用 Java** 将 Word Document 转换为 HTML。以下简单步骤可用于在任何常见操作系统(如 MS Windows、Ubuntu 或 macOS)中使用简单的 API 调用将 DOCX 导出为 Java 中的 HTML。
使用 Java 将 Word 文档转换为 HTML 的步骤
- 使用 Maven 存储库添加 Aspose.Words JAR 文件引用
- 实例化 Document Class 对象以加载源文档
- 指定不同的 HtmlSaveOptions 包括页边距、CssStyleSheet 和页面设置等。
- 使用 save 方法将 DOCX 导出为 Java 中的 HTML
在下面的示例代码中,我们将首先使用 Document class 实例加载源 DOCX。然后使用 HtmlSaveOptions 类 实例,我们将设置 CssStyleSheetType、ExportPageMargins 和 ImageResolution。最后,使用 save 方法,我们将从 Java 中的 DOCX 生成 HTML。
在 Java 中将 DOCX 导出为 HTML 的代码
import com.aspose.words.CssStyleSheetType; | |
import com.aspose.words.Document; | |
import com.aspose.words.HtmlSaveOptions; | |
import com.aspose.words.ImageColorMode; | |
import com.aspose.words.ImageSaveOptions; | |
import com.aspose.words.License; | |
import com.aspose.words.SaveFormat; | |
public class WordsKB { | |
public static void main(String[] wordsArgs) throws Exception { | |
{ | |
// Use Aspose.Words for Java license to remove trial version limitations | |
// after converting Word DOCX to HTML | |
License licenseConvertDOCXtoHTML = new License(); | |
licenseConvertDOCXtoHTML.setLicense("Java.Aspose.Words.lic"); | |
// Load input Word DOCX file with Document class | |
Document sourceDoc = new Document("Input.docx"); | |
// Set different properties of HtmlSaveOptions class | |
HtmlSaveOptions saveOptions = new HtmlSaveOptions(); | |
saveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE); | |
saveOptions.setExportPageMargins(true); | |
saveOptions.setImageResolution(90); | |
// Export docx to HTML in Java | |
sourceDoc.save("SavedHtml.html", saveOptions); | |
} | |
} |
在此示例代码中,我们使用 Document 类 的实例加载了源 DOCX。 HtmlSaveOptions class 实例可用于设置不同的选项,如编码、SVG 选项、版本和许多其他属性。最后,我们使用 Java 将 DOCX 导出为 HTML*。
在 如何使用 Java 将 DOCX 转换为 TIFF 的上一个主题中,我们专注于将 DOCX 渲染为 TIFF。然而,在本主题中,我们学习了如何使用 Java 从 DOCX 生成 HTML。