Εξαγωγή κειμένου από έγγραφο του Word σε C#

Μπορείτε να εξαγάγετε το Text από το έγγραφο του Word σε C# με αυτόν τον σύντομο οδηγό. Περιλαμβάνει βήματα για τη ρύθμιση του περιβάλλοντος ανάπτυξης, βήμα προς βήμα ροή εργασίας και ένα τρέχον δείγμα κώδικα για μετατροπή του DOCX σε TXT σε C#. Η αναπτυγμένη εφαρμογή μπορεί να ενσωματωθεί σε οποιαδήποτε εφαρμογή που υποστηρίζει το πλαίσιο .NET σε Linux, MS Windows ή macOS.

Βήματα για την εξαγωγή κειμένου από έγγραφο του Word σε C#

  1. Εγκαταστήστε το σύστημα εγκαθιστώντας το Aspose.Words for .NET για να μετατρέψετε ένα αρχείο DOCX σε αρχείο TXT χρησιμοποιώντας C#
  2. Αποκτήστε πρόσβαση στο έγγραφο προέλευσης του Word χρησιμοποιώντας μια παρουσία της κλάσης Document
  3. Δημιουργήστε την παρουσία κλάσης TxtSaveOptions και ορίστε τις απαιτούμενες ιδιότητες
  4. Αποθηκεύστε το αρχείο Word ως TXT στο δίσκο χρησιμοποιώντας τη μέθοδο Save

Αυτά τα συνοπτικά βήματα στο C# εξάγουν κείμενο από το έγγραφο του Word χρησιμοποιώντας μερικές κλήσεις API. Αρχικά, φορτώστε το αρχείο προέλευσης εγγράφου Word από το δίσκο, το οποίο στη συνέχεια ακολουθείται από τη ρύθμιση των επιλογών εξαγωγής του αρχείου TXT εξόδου χρησιμοποιώντας την παρουσία κλάσης TxtSaveOptions. Τέλος, το φορτωμένο DOCX αποθηκεύεται ως αρχείο TXT στο δίσκο χρησιμοποιώντας τη μέθοδο Save.

Κώδικας για μετατροπή DOCX σε TXT σε C#

Για την εξαγωγή κειμένου από το έγγραφο του Word API που βασίζεται σε C# έχει χρησιμοποιηθεί αποτελεσματικά σε αυτό το απόσπασμα κώδικα. Μπορείτε να αποθηκεύσετε το έγγραφο του Word στο TXT χωρίς να χρησιμοποιήσετε την προαιρετική παρουσία κλάσης TxtSaveOptions. Ωστόσο, εάν πρέπει να προσαρμόσετε περαιτέρω το αρχείο εξόδου TXT, μπορείτε να χρησιμοποιήσετε διαφορετικές ιδιότητες που εκτίθενται από την κλάση TxtSaveOptions, συμπεριλαμβανομένων των ρυθμίσεων Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak και PrettyFormat για να αναφέρετε μερικές.

Αυτό το άρθρο έχει εξηγήσει τις πληροφορίες για την ανάπτυξη ενός μετατροπέα Word σε TXT χρησιμοποιώντας C#. Εάν θέλετε να συγκρίνετε τα έγγραφα PDF, ανατρέξτε στο άρθρο στο Συγκρίνετε έγγραφα PDF χρησιμοποιώντας C#.

 Ελληνικά