Zde je článek, který popisuje, jak převést HTML do Wordu pomocí C# tím, že poskytuje podrobné informace o nastavení prostředí a také obsahuje spustitelný kód C# pro načtení zdrojového souboru HTML pro převod. K dispozici jsou možnosti pro konfiguraci výstupního souboru DOCX pomocí objektu třídy DocSaveOptions. V tomto tutoriálu pro psaní převaděče HTML do Wordu byl použit jazyk C#.
Kroky k zápisu obsahu HTML do dokumentu Word pomocí C#
- Přidejte odkaz na Aspose.HTML do projektu pro převod HTML na soubor Word
- Otevřete zdrojový soubor HTML načtením do HTMLDocument zadáním cesty k souboru
- Vytvořte objekt třídy DocSaveOptions pro konfiguraci výstupního souboru
- Uložte soubor Word převedený ze zdrojového souboru HTML pomocí zadané konfigurace
Tyto jednoduché kroky popisují, jak lze snadno dosáhnout pomocí C# převodu HTML do souboru Word, jako je DOCX. Nejprve jsou sdíleny informace pro konfiguraci prostředí a poté je načten zdrojový soubor HTML. V dalším kroku je objekt třídy DocSaveOptions použit pro konfiguraci výstupního souboru DOCX, ale máte možnost použít všechna výchozí nastavení této třídy. V posledním a posledním kroku se soubor uloží jako DOCX, přičemž jej můžete uložit i do jiného formátu podporovaného MS Word.
Kód pro převod HTML do Wordu pomocí C#
V tomto ukázkovém kódu jsme se naučili, jak převést HTML na Word v C# pomocí několika řádků kódu, kde je na začátku zdrojový soubor HTML načten do HTMLDocument. Všimněte si, že není nutné načítat existující HTML soubor, ale můžete načíst HTML řetězec z nějakého externího zdroje nebo použít nějakou URL také při volání funkce Converter.ConvertHTML(). Mnoho dalších konfigurací je také možné pomocí objektu třídy DocSaveOptions, jako je nastavení velikosti stránky a okrajů výstupního souboru DOCX.
V tomto tutoriálu jsme se naučili, jak zapsat obsah HTML do dokumentu aplikace Word pomocí C#. Pokud máte zájem o převod souboru HTML na text, přečtěte si článek na jak převést HTML na text v C#.