Σε αυτό το σύντομο σεμινάριο, θα μάθουμε πώς να διαβάζουμε έγγραφο του Word σε C# με τη βοήθεια λεπτομερειών σχετικά με τη διαμόρφωση του περιβάλλοντος, μια λίστα βημάτων και έναν κώδικα με δυνατότητα εκτέλεσης. Ο κώδικας θα δείξει την ανάγνωση του αρχείου Word με διαφορετικούς τρόπους. Θα μάθετε πώς το C# διαβάζει το έγγραφο του Word φορτώνοντας ένα αρχείο Word όπως DOCX, DOC, RTF ή HTML κ.λπ., και στη συνέχεια αποκτώντας πρόσβαση στα διάφορα στοιχεία του για επεξεργασία ή προβολή.
Βήματα για την ανάγνωση δεδομένων από έγγραφο του Word σε C#
- Διαμορφώστε το περιβάλλον του έργου για χρήση του Aspose.Words από τη διαχείριση πακέτων NuGet
- Φορτώστε το αρχείο εισόδου DOCX στο αντικείμενο κλάσης Document
- Λάβετε όλους τους κόμβους του τύπου Paragraph από το έγγραφο
- Μετατρέψτε κάθε παράγραφο σε συμβολοσειρά και εμφανίστε την στην κονσόλα
- Λάβετε όλους τους κόμβους τύπου Run από το έγγραφο
- Μετατρέψτε κάθε στοιχείο Εκτέλεση σε συμβολοσειρά και εμφανίστε το μαζί με το όνομα και το μέγεθος της γραμματοσειράς
Αυτά τα βήματα παρέχουν τις λεπτομερείς πληροφορίες που απαιτούνται για τη διαμόρφωση του περιβάλλοντος και των εργασιών που θα εκτελεστούν κατά τη σύνταξη ενός προγράμματος ανάγνωσης αρχείων Word. Δείχνει πώς διαβάζει το C# το αρχείο DOCX φορτώνοντας το αρχείο προέλευσης στην παρουσία της κλάσης Document και, στη συνέχεια, αποκτώντας πρόσβαση σε όλες τις παραγράφους του για να εμφανιστεί το κείμενο. Περιγράφει επίσης την ανάγνωση δεδομένων από παραγράφους, πίνακες κ.λπ. έτσι ώστε κάθε τμήμα κειμένου με διαφορετικό στυλ να διαχωρίζεται ή κάθε τιμή κελιού πίνακα γίνεται ξεχωριστά για επεξεργασία.s
Κώδικας για ανάγνωση αρχείου Word σε C#
Αυτός ο κώδικας δείχνει πώς να διαβάζετε το αρχείο Word σε C# χρησιμοποιώντας τη συνάρτηση Document.GetChildNodes() που απαιτεί την ανάκτηση ενός τύπου κόμβου όπως Παράγραφος, Εκτέλεση, Ενότητα, Σώμα, HeaderFooter, Σχόλιο, κ.λπ. Μόλις γίνει πρόσβαση στον θυγατρικό κόμβο , πρέπει να το πετάξετε στον αντίστοιχο τύπο για να χρησιμοποιήσετε τις μεθόδους και τις ιδιότητές του. Για παράδειγμα, έχουμε διαβάσει το έγγραφο δύο φορές έτσι ώστε πρώτα να εμφανίζεται όλο το κείμενο από ολόκληρο το έγγραφο ανεξάρτητα από μια κανονική παράγραφο ή πίνακα κ.λπ., και τη δεύτερη φορά να διαβάζεται με βάση οποιαδήποτε αλλαγή στο στυλ και τον τύπο περιεχομένου.
Αυτό το άρθρο μας έμαθε να διαβάζουμε αρχεία Word, ωστόσο, εάν θέλετε να μάθετε τη μετατροπή εγγράφων του Word σε HTML, ανατρέξτε στο άρθρο στο πώς να μετατρέψετε έγγραφο του Word σε HTML χρησιμοποιώντας C#.