Zde je článek, který popisuje, jak převést HTML do Wordu pomocí C# tím, že poskytuje podrobné informace o nastavení prostředí a také obsahuje spustitelný kód C# pro načtení zdrojového souboru HTML pro převod. K dispozici jsou možnosti pro konfiguraci výstupního souboru DOCX pomocí objektu třídy DocSaveOptions. V tomto tutoriálu pro psaní převaděče HTML do Wordu byl použit jazyk C#.
Kroky k zápisu obsahu HTML do dokumentu Word pomocí C#
- Přidejte odkaz na Aspose.HTML do projektu pro převod HTML na soubor Word
- Otevřete zdrojový soubor HTML načtením do HTMLDocument zadáním cesty k souboru
- Vytvořte objekt třídy DocSaveOptions pro konfiguraci výstupního souboru
- Uložte soubor Word převedený ze zdrojového souboru HTML pomocí zadané konfigurace
Tyto jednoduché kroky popisují, jak lze snadno dosáhnout pomocí C# převodu HTML do souboru Word, jako je DOCX. Nejprve jsou sdíleny informace pro konfiguraci prostředí a poté je načten zdrojový soubor HTML. V dalším kroku je objekt třídy DocSaveOptions použit pro konfiguraci výstupního souboru DOCX, ale máte možnost použít všechna výchozí nastavení této třídy. V posledním a posledním kroku se soubor uloží jako DOCX, přičemž jej můžete uložit i do jiného formátu podporovaného MS Word.
Kód pro převod HTML do Wordu pomocí C#
using Aspose.Html; | |
using Aspose.Html.Converters; | |
using Aspose.Html.Saving; | |
namespace ConvertHtmlToWordUsingCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) // Main function to convert HTML to Image in C# | |
{ | |
// Remove the watermark in output word document by adding license | |
License licHtmlToImage = new License(); | |
licHtmlToImage.SetLicense(@"Aspose.Html.lic"); | |
// Load the source input HTML file for conversion to word document | |
HTMLDocument document = new HTMLDocument("SampleInput.html"); | |
// Instantiate the document save options | |
DocSaveOptions docSaveOptions = new DocSaveOptions(); | |
// Convert HTML to word file using the input HTML document, document save options and output file name | |
Converter.ConvertHTML(document, docSaveOptions, "OutputDocx.docx"); | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
V tomto ukázkovém kódu jsme se naučili, jak převést HTML na Word v C# pomocí několika řádků kódu, kde je na začátku zdrojový soubor HTML načten do HTMLDocument. Všimněte si, že není nutné načítat existující HTML soubor, ale můžete načíst HTML řetězec z nějakého externího zdroje nebo použít nějakou URL také při volání funkce Converter.ConvertHTML(). Mnoho dalších konfigurací je také možné pomocí objektu třídy DocSaveOptions, jako je nastavení velikosti stránky a okrajů výstupního souboru DOCX.
V tomto tutoriálu jsme se naučili, jak zapsat obsah HTML do dokumentu aplikace Word pomocí C#. Pokud máte zájem o převod souboru HTML na text, přečtěte si článek na jak převést HTML na text v C#.