Πώς να μετατρέψετε ένα έγγραφο Word σε HTML χρησιμοποιώντας Java

Σε αυτό το απλό θέμα θα μάθετε πώς να μετατρέπετε το Word Document σε HTML χρησιμοποιώντας Java. Τα παρακάτω απλά βήματα μπορούν να χρησιμοποιηθούν για την εξαγωγή του DOCX σε HTML σε Java σε οποιοδήποτε κοινό λειτουργικό σύστημα όπως τα MS Windows, το Ubuntu ή το macOS χρησιμοποιώντας απλές κλήσεις API.

Βήματα για τη μετατροπή εγγράφου Word σε HTML χρησιμοποιώντας Java

  1. Προσθέστε αναφορά αρχείου JAR Aspose.Words χρησιμοποιώντας το αποθετήριο Maven
  2. Δημιουργήστε το αντικείμενο Document Class για να φορτώσετε το έγγραφο προέλευσης
  3. Καθορίστε διαφορετικές επιλογές HtmlSave, συμπεριλαμβανομένων των περιθωρίων σελίδας, του CssStyleSheet και του Page Setup κ.λπ.
  4. Εξαγωγή DOCX σε HTML σε Java χρησιμοποιώντας τη μέθοδο αποθήκευσης

Στο ακόλουθο δείγμα κώδικα, θα φορτώσουμε πρώτα την πηγή DOCX χρησιμοποιώντας την παρουσία Κλάση εγγράφου. Στη συνέχεια, χρησιμοποιώντας την παρουσία HtmlSaveOptions class, θα ορίσουμε τα CssStyleSheetType, ExportPageMargins και ImageResolution. Τέλος, χρησιμοποιώντας τη μέθοδο αποθήκευσης θα δημιουργήσουμε HTML από το DOCX σε Java.

Κώδικας για εξαγωγή DOCX σε HTML σε Java

Σε αυτό το δείγμα κώδικα, έχουμε φορτώσει την πηγή DOCX χρησιμοποιώντας μια παρουσία της Κλάση εγγράφου. Η παρουσία HtmlSaveOptions class μπορεί να χρησιμοποιηθεί για να ορίσετε διαφορετικές επιλογές όπως κωδικοποίηση, επιλογές SVG, έκδοση και πολλές άλλες ιδιότητες. Τέλος, εξάγουμε το DOCX σε HTML χρησιμοποιώντας Java.

Στο προηγούμενο θέμα του πώς να μετατρέψετε το DOCX σε TIFF χρησιμοποιώντας Java, επικεντρωθήκαμε στην απόδοση του DOCX σε TIFF. Ενώ, σε αυτό το θέμα, μάθαμε πώς να δημιουργούμε HTML από το DOCX χρησιμοποιώντας Java.

 Ελληνικά