Как преобразовать HTML в JSON с помощью Python

В этой краткой статье рассказывается, как преобразовать HTML в JSON с помощью Python. В нем обсуждается конфигурация среды, пошаговый алгоритм выполнения программы и работающий пример кода для преобразования HTML в JSON с использованием Python. Кроме того, это преобразование не требует установки дополнительного программного обеспечения или плагинов с вашей стороны.

Шаги для преобразования HTML в JSON с помощью Python

  1. Настройте IDE для использования Aspose.Cells для Python через Java для преобразования файлов HTML в JSON.
  2. Загрузите файл HTML с классом Workbook и получите доступ к последней ячейке.
  3. Создайте объект класса JsonSaveOptions
  4. Создайте диапазон и экспортируйте его в формат JSON.
  5. Сохраните выходной файл JSON.

Эти шаги помогут вам создать конвертер HTML в JSON Python. Прежде всего загружается файл HTML и осуществляется доступ к последней ячейке. Впоследствии диапазон создается и экспортируется в формате JSON. Наконец, файл JSON можно сохранить на диск или в поток.

Код для преобразования HTML в JSON с использованием Python

import jpype
import asposecells
# Start JVM
jpype.startJVM()
from asposecells.api import License, Workbook, JsonUtility, JsonSaveOptions
# Load License
licenseHtmlToImage = License()
licenseHtmlToImage.setLicense("License.lic")
# Load HTML file
workbook = Workbook("sample.html")
# Get the last cell
cells = workbook.getWorksheets().get(0).getCells().getLastCell()
# Create JsonSaveOptions object
options = JsonSaveOptions()
# Create Range
range = workbook.getWorksheets().get(0).getCells().createRange(0, 0, cells.getRow() + 1, cells.getColumn() + 1)
data = JsonUtility.exportRangeToJson(range, options)
# Save output JSON file
with open("output.json", 'w') as file:
file.write(str(data))
# Shutdown the JVM
jpype.shutdownJVM()
print("HTML to JSON conversion done successfully")

Этот фрагмент кода демонстрирует, как можно быстро выполнить преобразование Python HTML в JSON. Процесс инициируется загрузкой исходных данных HTML с помощью класса Workbook. Затем создайте диапазон и преобразуйте его в формат JSON с помощью класса JsonUtility перед сохранением выходного файла. Однако вы также можете установить различные свойства для управления форматированием данных JSON, например, пропуск пустых строк, проверку областей слияния, сортировку имен и т. д. в соответствии с вашими требованиями.

В этой статье объясняется, как создать конвертер HTML в JSON с помощью Python. Принимая во внимание, что если вы хотите узнать о преобразовании TXT в JSON, прочитайте статью о как преобразовать TXT в JSON с помощью Python.

 Русский