Πώς να μετατρέψετε HTML σε κείμενο σε C#

Αυτός ο απλός τρόπος δείχνει πώς να μετατρέπετε το HTML σε κείμενο σε C#. Σε C# HTML σε απλό κείμενο η μετατροπή μπορεί εύκολα να επιτευχθεί χρησιμοποιώντας λίγες γραμμές κώδικα για οποιαδήποτε εφαρμογή που βασίζεται σε .NET που εκτελείται σε πλατφόρμες Windows, macOS ή Linux.

Βήματα για τη μετατροπή HTML σε κείμενο σε C#

  1. Εγκαταστήστε το Aspose.HTML for .NET από τον διαχειριστή πακέτων NuGet
  2. Συμπεριλάβετε τον χώρο ονομάτων Aspose.HTML στο έργο σας
  3. Φορτώστε το περιεχόμενο του αρχείου HTML σε μια συμβολοσειρά
  4. Δημιουργήστε μια παρουσία της κλάσης HTMLDocument για να φορτώσετε τη συμβολοσειρά που περιέχει HTML
  5. Δημιουργήστε στιγμιότυπο κλάσης INodeIterator για επανάληψη μέσω κόμβων και προσθήκη στο StringBuilder
  6. Τέλος, αποθηκεύστε το μετατρεπόμενο κείμενο από HTML στο δίσκο

Για να λάβετε απλό κείμενο από HTML C# λίγες γραμμές κώδικα μπορούν να χρησιμοποιηθούν αποτελεσματικά σε οποιαδήποτε εφαρμογή που βασίζεται στο .NET. Η διαδικασία ξεκινά με τη φόρτωση του αρχείου HTML ως String στην παρουσία HTMLDocument class χρησιμοποιώντας τη μέθοδο File.ReadAllText. Στη συνέχεια, το INodeIterator θα χρησιμοποιηθεί για την εξαγωγή κόμβων από την HTML και την προσάρτησή τους στο StringBuilder. Τέλος, το εξαγόμενο HTML στο StringBuilder θα αποθηκευτεί στο δίσκο.

Κώδικας για μετατροπή HTML σε κείμενο σε C#

Ο παραπάνω κώδικας στο C# μετατρέπει την HTML σε απλό κείμενο χρησιμοποιώντας λίγες κλήσεις API. Χρησιμοποιήσαμε προσαρμοσμένη Κλάση StyleFilter που κληρονομεί την NodeFilter class για να παρακάμψει τη μέθοδο AcceptNode, η οποία φιλτράρει τους ανεπιθύμητους κόμβους από την HTML κατά τη διαδικασία μετατροπής.

Στο προηγούμενο θέμα, μάθαμε πώς να δημιουργία αρχείου HTML σε C#. Ενώ, το παραπάνω παράδειγμα στο C# παίρνει απλό κείμενο από το αρχείο HTML μέσω προγραμματισμού.

 Ελληνικά