Πώς να διαβάσετε ένα αρχείο PDF σε C#

Η ανάγνωση διαφορετικών τύπων εγγράφων μέσω προγραμματισμού είναι κοινή πρακτική στις μέρες μας. Σε αυτόν τον οδηγό, θα μάθετε πώς να διαβάζετε το αρχείο PDF σε C# ακολουθώντας τα παρακάτω απλά βήματα.

Βήματα για την ανάγνωση αρχείου PDF σε C#

  1. Δημιουργήστε μια κενή εφαρμογή κονσόλας C# στο Visual Studio
  2. Προσθέστε αναφορά στο Aspose.PDF for .NET εγκαθιστώντας το από το NuGet.org
  3. Φορτώστε ένα υπάρχον αρχείο PDF στο αντικείμενο Document
  4. Ξεκινήστε την τάξη TextAbsorber για να διαβάσετε το αρχείο PDF
  5. Εξαγάγετε κείμενο PDF και γράψτε το στην έξοδο της Κονσόλας
  6. Επαναλάβετε τη σελίδα PDF Resources για να βρείτε εικόνες
  7. Δημιουργήστε αντικείμενο FileStream με την εικόνα που βρέθηκε
  8. Αποθηκεύστε την εικόνα στον τοπικό δίσκο

Το παρακάτω απόσπασμα κώδικα εξηγεί πώς να ανοίξετε και να διαβάσετε ένα αρχείο PDF σε C#. Θα μπορείτε να διαβάζετε κείμενο και να εξάγετε εικόνες από ένα αρχείο PDF χρησιμοποιώντας το. Το API προσφέρει TextAbsorber Class που χρησιμοποιείται για την ανάγνωση κειμένου από αρχείο PDF και μπορείτε να επιτύχετε τα εξαγόμενα αποτελέσματα μέσω του αντικειμένου Text. Η εύρεση εικόνων και η αποθήκευσή τους στον τοπικό δίσκο είναι επίσης δυνατή κάνοντας βρόχο μέσω των πόρων της σελίδας PDF όπως φαίνεται παρακάτω.

Κώδικας για ανάγνωση αρχείου PDF σε C#

Στο προηγούμενο θέμα, μάθατε πώς να επεξεργαστείτε μεγάλα αρχεία PDF σε C#. Οι παραπάνω πληροφορίες και το παράδειγμα κώδικα θα σας επιτρέψουν να ανοίξετε και να διαβάσετε αρχεία PDF σε C# για να εξαγάγετε κείμενο και εικόνες.

 Ελληνικά