W tym krótkim samouczku nauczymy się konwertować Word Document na HTML przy użyciu C#. Możemy wydajnie wyeksportować DOCX do HTML w C#, wykonując następujące proste kroki i fragment kodu. Możesz przeprowadzić tę konwersję na dowolnym systemie operacyjnym, takim jak macOS, Linux lub MS Windows, w którym skonfigurowano platformę .NET.
Kroki, aby przekonwertować dokument programu Word na format HTML przy użyciu języka C#
- Zainstaluj bibliotekę Aspose.Words z wtyczki menedżera pakietów NuGet
- Utwórz instancję obiektu klasy Document, aby załadować DOCX
- Określ różne właściwości związane z CssStyleSheet, marginesami strony, ustawieniami strony itp.
- Zapisz plik wyjściowy jako plik HTML
W powyższych krokach najpierw tworzona jest instancja Document class do ładowania wejściowego dokumentu programu Word, a następnie ustawiane są różne właściwości procesu renderowania, takie jak marginesy strony, ustawienia strony itp., aby dostosować właściwości wyjściowego pliku HTML. Ostatecznie plik wyjściowy jest zapisywany z rozszerzeniem pliku HTML.
Kod do eksportu DOCX do HTML w C#
W tym przykładowym kodzie zadeklarowano instancję klasy Document do ładowania wejściowego dokumentu programu Word. Następnie określa się różne opcje renderowania, aby sterować właściwościami wyjściowego pliku HTML. Możesz manipulować sposobem renderowania czcionek i obrazów lub arkuszem stylów css i preferencjami folderów w celu konwersji plików zgodnie z własnymi wymaganiami. Na koniec wygenerujemy HTML z DOCX przy użyciu C#.
W tym artykule zbadaliśmy, jak generować HTML z DOCX przy użyciu C#. Jeśli jednak chcesz przekonwertować plik DOCX na TIFF, zapoznaj się z artykułem na jak przekonwertować DOCX na TIFF za pomocą C#.