この記事では、Python を使用して HTML を Excel に変換する 方法について説明します。**Python を使用して HTML から Excel にファイル形式を変換するための環境設定、手順の一覧、サンプル コードについて説明します。ソース PDF ファイルの読み込みをカスタマイズし、要件に応じてさまざまな形式で出力を保存する方法を学習します。
Python を使用して HTML を XLS に変換する手順
- .NET 経由の Python 用 Aspose.PDF を使用して HTML ファイルを Excel に変換するための環境を設定します
- HtmlLoadOptions クラスのインスタンスを作成し、ソース HTML ファイルの読み込みをカスタマイズします。
- 指定されたオプションを使用して、入力HTMLファイルをDocumentクラスオブジェクトに読み込みます。
- SaveFormat列挙子を使用して、読み込んだ形式をExcel形式で保存します。
これらの手順は、Python を使用して HTML から XLS へのコンバーターを開発するプロセスを要約したものです。プロセスを開始するには、入力 HTML ファイルの読み込みを制御する HtmlLoadOptions クラスのオブジェクトを作成します。カスタム読み込みオプションを使用して HTML ファイルを Document オブジェクトに読み込み、SaveFormat 列挙子を使用して Excel 形式で保存します。
Python を使用して HTML ファイルを Excel に変換するコード
import aspose.pdf as pdf | |
# Load the license | |
license = pdf.License() | |
license.set_license("License.lic") | |
# Declare the HtmlLoadOptions object | |
options = pdf.HtmlLoadOptions() | |
# Load the source HTML file using the specified load options | |
doc = pdf.Document("input.html",options) | |
# Save the output in the desired format | |
doc.save("excel.xlsx",pdf.SaveFormat.EXCEL) | |
print("Html converted to Excel successfully") |
このコードは、Python を使用して HTML ドキュメントを Excel に変換する方法を示しています。警告ハンドラーを設定して、HTML 読み込み操作中に生成されるエラーと警告を管理できます。フラグを設定してページ レイアウト オプションを設定し、ドキュメント全体を 1 ページにレンダリングし、エンコードを設定し、SaveFormat オプションを使用して EXCEL、PPTX、XPS、DOC などの出力形式を定義できます。
このトピックでは、Python を使用して HTML を XLS に変換する方法 について説明しました。画像を PDF に変換する場合は、Pythonを使用して画像をPDFに変換する方法 の記事を参照してください。