Jak převést HTML do Word pomocí C#

Zde je článek, který popisuje, jak převést HTML do Wordu pomocí C# tím, že poskytuje podrobné informace o nastavení prostředí a také obsahuje spustitelný kód C# pro načtení zdrojového souboru HTML pro převod. K dispozici jsou možnosti pro konfiguraci výstupního souboru DOCX pomocí objektu třídy DocSaveOptions. V tomto tutoriálu pro psaní převaděče HTML do Wordu byl použit jazyk C#.

Kroky k zápisu obsahu HTML do dokumentu Word pomocí C#

  1. Přidejte odkaz na Aspose.HTML do projektu pro převod HTML na soubor Word
  2. Otevřete zdrojový soubor HTML načtením do HTMLDocument zadáním cesty k souboru
  3. Vytvořte objekt třídy DocSaveOptions pro konfiguraci výstupního souboru
  4. Uložte soubor Word převedený ze zdrojového souboru HTML pomocí zadané konfigurace

Tyto jednoduché kroky popisují, jak lze snadno dosáhnout pomocí C# převodu HTML do souboru Word, jako je DOCX. Nejprve jsou sdíleny informace pro konfiguraci prostředí a poté je načten zdrojový soubor HTML. V dalším kroku je objekt třídy DocSaveOptions použit pro konfiguraci výstupního souboru DOCX, ale máte možnost použít všechna výchozí nastavení této třídy. V posledním a posledním kroku se soubor uloží jako DOCX, přičemž jej můžete uložit i do jiného formátu podporovaného MS Word.

Kód pro převod HTML do Wordu pomocí C#

using Aspose.Html;
using Aspose.Html.Converters;
using Aspose.Html.Saving;
namespace ConvertHtmlToWordUsingCSharp
{
class Program
{
static void Main(string[] args) // Main function to convert HTML to Image in C#
{
// Remove the watermark in output word document by adding license
License licHtmlToImage = new License();
licHtmlToImage.SetLicense(@"Aspose.Html.lic");
// Load the source input HTML file for conversion to word document
HTMLDocument document = new HTMLDocument("SampleInput.html");
// Instantiate the document save options
DocSaveOptions docSaveOptions = new DocSaveOptions();
// Convert HTML to word file using the input HTML document, document save options and output file name
Converter.ConvertHTML(document, docSaveOptions, "OutputDocx.docx");
System.Console.WriteLine("Done");
}
}
}

V tomto ukázkovém kódu jsme se naučili, jak převést HTML na Word v C# pomocí několika řádků kódu, kde je na začátku zdrojový soubor HTML načten do HTMLDocument. Všimněte si, že není nutné načítat existující HTML soubor, ale můžete načíst HTML řetězec z nějakého externího zdroje nebo použít nějakou URL také při volání funkce Converter.ConvertHTML(). Mnoho dalších konfigurací je také možné pomocí objektu třídy DocSaveOptions, jako je nastavení velikosti stránky a okrajů výstupního souboru DOCX.

V tomto tutoriálu jsme se naučili, jak zapsat obsah HTML do dokumentu aplikace Word pomocí C#. Pokud máte zájem o převod souboru HTML na text, přečtěte si článek na jak převést HTML na text v C#.

 Čeština