Pythonを使用してWord文書をHTMLに変換する方法

この短いチュートリアルでは、Pythonを使用して**Word DocumentHTMLに変換する方法を学習します**。 ** Pythonのサンプルコード行は、簡単な手順に従ってDOCXをHTML**に効率的に変換します。この変換は、.NET Frameworkが構成されているLinux、macOS、MSWindowsなどのオペレーティングシステムで実行できます。

Pythonを使用してWord文書をHTMLに変換する手順

  1. アプリケーションでAspose.Words for Python via .NETを使用するための環境をセットアップします
  2. プログラムの開始時に必要な名前空間とクラスを含める
  3. HTMLに変換するために、ディスクからDocumentクラスオブジェクトにソースWordファイルを開きます
  4. HtmlSaveOptionsオブジェクトを初期化して、出力HTMLをカスタマイズします
  5. saveメソッドを使用してDOCXをHTMLに変換します

上記の手順を使用して、PythonDOCXからHTMLへの変換を実行します。まず、Documentクラスインスタンスを使用して、入力Wordドキュメントを読み込み、ExportPageMargins、CssStyleSheetType、ImageResolutionなどのHTMLレンダリングプロセスにさまざまなプロパティを設定します。最後に、出力ファイルはHTMLファイル拡張子でディスクに保存されます。 。

PythonでWordをHTMLに変換するコード

  • Python WordからHTMLへの変換アプリケーションは、前述の例を使用して開発されています。 Documentクラスのインスタンスは、ソースのWordドキュメントをロードするために使用され、出力HTMLファイルのプロパティをカスタマイズするためにさまざまなレンダリングオプションが指定されます。最後に、 Word to HTML Python*ベースのsaveメソッドを保存するために使用されます。

この記事では、PythonベースのAPIを使用してDOCXをHTMLに変換するプロセスについて説明しました。ただし、DOCXファイルをPDFに変換する場合は、Pythonを使用してWordをPDFに変換する方法の記事を参照してください。

 日本語