Cómo convertir HTML a Word usando C#

Aquí hay un artículo que guía sobre cómo convertir HTML a Word usando C# proporcionando información detallada sobre la configuración del entorno y también contiene un código C# ejecutable para cargar el archivo HTML de origen para la conversión. Las opciones están disponibles para configurar el archivo de salida DOCX mediante el uso del objeto de clase DocSaveOptions. En este tutorial para escribir Convertidor de HTML a Word C# se ha utilizado el lenguaje.

Pasos para escribir contenido HTML en un documento de Word usando C#

  1. Agregue la referencia a Aspose.HTML al proyecto para convertir HTML a un archivo de Word
  2. Abra el archivo HTML de origen cargándolo en HTMLDocument proporcionando la ruta del archivo
  3. Cree el objeto de clase DocSaveOptions para configurar el archivo de salida
  4. Guarde el archivo de Word convertido desde el archivo HTML de origen usando la configuración especificada

Estos sencillos pasos describen cómo usar C# para convertir archivos HTML a Word como DOCX se logra fácilmente. Primero se comparte la información para configurar el entorno y luego se carga el archivo HTML de origen. En el siguiente paso, el objeto de la clase DocSaveOptions se usa para configurar el archivo DOCX de salida; sin embargo, tiene la opción de usar todas las configuraciones predeterminadas de esta clase. En el último y último paso, el archivo se guarda como DOCX, mientras que también puede guardarlo en cualquier otro formato compatible con MS Word.

Código para convertir HTML a Word usando C#

using Aspose.Html;
using Aspose.Html.Converters;
using Aspose.Html.Saving;
namespace ConvertHtmlToWordUsingCSharp
{
class Program
{
static void Main(string[] args) // Main function to convert HTML to Image in C#
{
// Remove the watermark in output word document by adding license
License licHtmlToImage = new License();
licHtmlToImage.SetLicense(@"Aspose.Html.lic");
// Load the source input HTML file for conversion to word document
HTMLDocument document = new HTMLDocument("SampleInput.html");
// Instantiate the document save options
DocSaveOptions docSaveOptions = new DocSaveOptions();
// Convert HTML to word file using the input HTML document, document save options and output file name
Converter.ConvertHTML(document, docSaveOptions, "OutputDocx.docx");
System.Console.WriteLine("Done");
}
}
}

En este código de muestra, hemos aprendido cómo convertir HTML a Word en C# usando unas pocas líneas de código donde al principio el archivo HTML de origen se carga en HTMLDocument. Tenga en cuenta que no es necesario cargar un archivo HTML existente, pero puede obtener una cadena HTML de alguna fuente externa o usar alguna URL también mientras llama a la función Converter.ConvertHTML(). También son posibles muchas otras configuraciones utilizando el objeto de clase DocSaveOptions, como establecer el tamaño de página y los márgenes del archivo DOCX de salida.

En este tutorial práctico, hemos aprendido cómo escribir contenido HTML en un documento de Word usando C#. Si está interesado en convertir el archivo HTML a texto, consulte el artículo sobre cómo convertir HTML a texto en C#.

 Español