Como converter documento HTML para Word em Python

Este breve tutorial orienta sobre como converter documento HTML em Word em Python. Ele contém os detalhes para definir o IDE para testar o código de amostra, uma lista de etapas para escrever o aplicativo e um código de amostra executável para converter HTML em DOCX em Python. Um exemplo de código também será descrito para a modificação opcional do arquivo HTML carregado antes de salvá-lo como um arquivo Word.

Etapas para converter HTML em documento do Word em Python

  1. Estabeleça o ambiente para use Aspose.Words para Python via .NET para converter HTML em DOCX
  2. Abra o arquivo HTML de origem usando o objeto de classe Document do namespace aspose.words
  3. Anexe algum texto de exemplo ao primeiro parágrafo do arquivo HTML para demonstrar a modificação do HTML
  4. Save o arquivo HTML carregado como um arquivo Word, definindo o nome e o formato

As etapas acima definem o processo para converter HTML em Word DOC em Python. O arquivo HTML de destino é carregado no objeto da classe Document do namespace aspose.words. Este documento é salvo como um arquivo Word usando o método Document.save() junto com a modificação opcional do arquivo HTML adicionando algum texto de amostra no final do primeiro parágrafo.

Código para converter documento HTML em Word em Python

Este código de exemplo é um simples conversor de documentos HTML para Word em Python. Depois que o arquivo HTML de origem é carregado no objeto da classe Document, todos os recursos avançados podem ser utilizados para trabalhar com o documento carregado, por exemplo, anexando texto no início do primeiro parágrafo, conforme demonstrado neste código de exemplo, adicionando novos nós, tabelas, gráficos, etc. de acordo com os requisitos. Da mesma forma, o arquivo de saída pode ser salvo como DOCX, DOC, DOCM, RTF, XPS, SVG, TIFF, PNG, JPEG, GIF e EPS, para listar alguns.

Neste artigo, aprendemos a transformação de HTML em Word em Python. Se você quiser aprender o processo de conversão de um arquivo HTML em PDF, consulte o artigo em como converter HTML para PDF em Python.

 Português