Jak przekonwertować dokument Worda na HTML za pomocą C#

W tym krótkim samouczku nauczymy się konwertować Word Document na HTML przy użyciu C#. Możemy wydajnie wyeksportować DOCX do HTML w C#, wykonując następujące proste kroki i fragment kodu. Możesz przeprowadzić tę konwersję na dowolnym systemie operacyjnym, takim jak macOS, Linux lub MS Windows, w którym skonfigurowano platformę .NET.

Kroki, aby przekonwertować dokument programu Word na format HTML przy użyciu języka C#

  1. Zainstaluj bibliotekę Aspose.Words z wtyczki menedżera pakietów NuGet
  2. Utwórz instancję obiektu klasy Document, aby załadować DOCX
  3. Określ różne właściwości związane z CssStyleSheet, marginesami strony, ustawieniami strony itp.
  4. Zapisz plik wyjściowy jako plik HTML

W powyższych krokach najpierw tworzona jest instancja Document class do ładowania wejściowego dokumentu programu Word, a następnie ustawiane są różne właściwości procesu renderowania, takie jak marginesy strony, ustawienia strony itp., aby dostosować właściwości wyjściowego pliku HTML. Ostatecznie plik wyjściowy jest zapisywany z rozszerzeniem pliku HTML.

Kod do eksportu DOCX do HTML w C#

W tym przykładowym kodzie zadeklarowano instancję klasy Document do ładowania wejściowego dokumentu programu Word. Następnie określa się różne opcje renderowania, aby sterować właściwościami wyjściowego pliku HTML. Możesz manipulować sposobem renderowania czcionek i obrazów lub arkuszem stylów css i preferencjami folderów w celu konwersji plików zgodnie z własnymi wymaganiami. Na koniec wygenerujemy HTML z DOCX przy użyciu C#.

W tym artykule zbadaliśmy, jak generować HTML z DOCX przy użyciu C#. Jeśli jednak chcesz przekonwertować plik DOCX na TIFF, zapoznaj się z artykułem na jak przekonwertować DOCX na TIFF za pomocą C#.

 Polski