Σε αυτό το σύντομο σεμινάριο, θα μάθουμε πώς να μετατρέπουμε το Word Document σε HTML χρησιμοποιώντας το C#. Μπορούμε αποτελεσματικά να εξάγουμε το DOCX σε HTML σε C# με τα ακόλουθα απλά βήματα και το απόσπασμα κώδικα. Μπορείτε να εκτελέσετε αυτήν τη μετατροπή σε οποιοδήποτε λειτουργικό σύστημα όπως macOS, Linux ή MS Windows όπου έχει διαμορφωθεί το πλαίσιο .NET.
Βήματα για τη μετατροπή εγγράφου Word σε HTML χρησιμοποιώντας C#
- Εγκαταστήστε τη βιβλιοθήκη Aspose.Words από την προσθήκη διαχείρισης πακέτων NuGet
- Δημιουργήστε ένα αντικείμενο της κλάσης Document για να φορτώσετε το DOCX
- Καθορίστε διαφορετικές ιδιότητες που σχετίζονται με το CssStyleSheet, τα περιθώρια σελίδας, τη ρύθμιση σελίδας κ.λπ.
- Αποθηκεύστε το αρχείο εξόδου ως αρχείο HTML
Στα παραπάνω βήματα, αρχικά δημιουργείται η παρουσία Κλάση εγγράφου για τη φόρτωση του εγγράφου Word εισόδου και, στη συνέχεια, ορίζονται διαφορετικές ιδιότητες για τη διαδικασία απόδοσης, όπως Περιθώρια σελίδας, Διαμόρφωση σελίδας, κ.λπ. για την προσαρμογή των ιδιοτήτων του αρχείου HTML εξόδου. Στο τέλος, το αρχείο εξόδου αποθηκεύεται με επέκταση αρχείου HTML.
Κώδικας για εξαγωγή DOCX σε HTML σε C#
Σε αυτό το δείγμα κώδικα, δηλώνεται μια παρουσία της Κλάση εγγράφου για τη φόρτωση του εγγράφου Word εισόδου. Στη συνέχεια καθορίζονται διαφορετικές επιλογές απόδοσης για τον έλεγχο των ιδιοτήτων του αρχείου HTML εξόδου. Μπορείτε να χειριστείτε τον τρόπο απόδοσης των γραμματοσειρών και των εικόνων ή τις προτιμήσεις του φύλλου στυλ css και των φακέλων για τη μετατροπή των αρχείων σύμφωνα με τις απαιτήσεις σας. Τέλος, θα δημιουργήσουμε HTML από το DOCX χρησιμοποιώντας C#.
Σε αυτό το άρθρο, εξερευνήσαμε πώς να δημιουργήσετε HTML από το DOCX χρησιμοποιώντας C#. Ωστόσο, εάν θέλετε να μετατρέψετε ένα αρχείο DOCX σε TIFF, ανατρέξτε στο άρθρο στο πώς να μετατρέψετε το DOCX σε TIFF χρησιμοποιώντας C#.