Αυτό το βασικό σεμινάριο σάς καθοδηγεί για το πώς να μετατρέψετε PDF σε αρχείο κειμένου χρησιμοποιώντας C#, συμπεριλαμβανομένων των ρυθμίσεων διαμόρφωσης και ενός αποσπάσματος κώδικα με δυνατότητα εκτέλεσης. Δείχνει πώς η χρήση του μετατροπέα C# PDF σε Κείμενο μπορεί να δημιουργηθεί με μερικές κλήσεις API. Χρειάζεται μόνο να φορτώσετε το έγγραφο προέλευσης PDF και να αποθηκεύσετε το αρχείο εξόδου Text.
Βήματα για τη μετατροπή PDF σε αρχείο κειμένου χρησιμοποιώντας C#
- Προσθέστε μια αναφορά στο Aspose.PDF for .NET στην εφαρμογή σας για να μετατρέψετε το PDF σε αρχείο κειμένου
- Φορτώστε το αρχείο προέλευσης PDF χρησιμοποιώντας την παρουσία κλάσης Document για τη δημιουργία ενός αρχείου κειμένου
- Δημιουργήστε μια παρουσία της κλάσης TextAbsorber και εξάγετε κείμενο από όλες τις σελίδες
- Αποθηκεύστε το αρχείο κειμένου εξόδου
Για τη σύνταξη PDF σε κείμενο μετατροπέα C# με βάση τη διαμόρφωση εφαρμογής σε .NET framework και μια διαδικασία βήμα προς βήμα παρέχεται εδώ. Ως πρώτο βήμα, διαμορφώστε γρήγορα το API και φορτώστε το αρχείο εισόδου PDF. Στη συνέχεια, προχωράμε στην εξαγωγή του κειμένου από όλες τις σελίδες του και γράφουμε το εξαγόμενο κείμενο σε ένα αρχείο ή μια ροή σύμφωνα με τις απαιτήσεις.
Απόσπασμα κώδικα για μετατροπή PDF σε κείμενο χρησιμοποιώντας C#
Η χρήση της δυνατότητας C# convert PDF to Text μπορεί να ενσωματωθεί στις εφαρμογές σας μαζί με τον έλεγχο της ανάγνωσης κειμένου από το PDF προέλευσης, όπως μπορείτε να διαβάσετε κείμενο από όλες τις σελίδες ή από μια καθορισμένη σελίδα. Ομοίως, εάν θέλετε να διαβάσετε κείμενο από μια συγκεκριμένη περιοχή ορθογωνίου στη σελίδα PDF, έχετε την ελευθερία να ορίσετε και αυτήν την ορθογώνια περιοχή. Μπορούν επίσης να οριστούν διαφορετικές λειτουργίες για τη μετατροπή PDF σε κείμενο όπως Pure, Raw και MemorySaving.
Σε αυτό το άρθρο, μάθαμε πώς μπορεί να χρησιμοποιηθεί ο κώδικας PDF σε κείμενο C# στις εφαρμογές σας .NET. Ωστόσο, εάν θέλετε να εξερευνήσετε τη μετατροπή εγγράφων PDF σε HTML, ανατρέξτε στο άρθρο στο πώς να μετατρέψετε PDF σε HTML χρησιμοποιώντας C#.