Μετατροπή Σαρωμένου PDF σε Επεξεργάσιμο PDF χρησιμοποιώντας Java

Αυτό το σύντομο σεμινάριο καθοδηγεί σχετικά με το πώς να μετατρέψετε το σαρωμένο PDF σε επεξεργάσιμο PDF χρησιμοποιώντας Java. Περιλαμβάνει λεπτομέρειες για τη διαμόρφωση του IDE, μια λίστα βημάτων και δείγμα κώδικα για τη μετατροπή του σαρωμένου PDF σε αναζητήσιμο PDF χρησιμοποιώντας Java. Θα λάβετε λεπτομέρειες για την προσαρμογή της διαδικασίας σάρωσης εικόνας και μετατροπής του περιεχομένου σε αναγνώσιμο κείμενο.

Βήματα για να κάνετε το PDF αναγνώσιμο χρησιμοποιώντας Java

  1. Ορίστε το IDE να χρησιμοποιεί Aspose.Total for Java για να μετατρέψετε ένα σαρωμένο PDF σε PDF με δυνατότητα αναζήτησης
  2. Δημιουργήστε τις αντίστοιχες άδειες προϊόντων για να αποφύγετε τα υδατογραφήματα στην έξοδο
  3. Δημιουργήστε μια παρουσία της μηχανής αναγνώρισης χρησιμοποιώντας την κλάση AsposeOCR
  4. Δημιουργήστε το αντικείμενο εισόδου χρησιμοποιώντας την κλάση OcrInput και φορτώστε το πηγαίο σαρωμένο PDF σε αυτό
  5. Δημιουργήστε το RecognitionSettings αντίγραφο για να ορίσετε παραμέτρους για την προσαρμογή κατά τη σάρωση της εικόνας
  6. Καλέστε τη μέθοδο AsposeOCR.Recognize() για να ανακτήσετε δεδομένα από το σαρωμένο PDF και να τα αποθηκεύσετε σε ένα προσωρινό PDF
  7. Φορτώστε το ενδιάμεσο PDF στο αντικείμενο κλάσης Document του Aspose.PDF και ορίστε μεταδεδομένα σε αυτό
  8. Αποθηκεύστε το τελικό PDF στο δίσκο με δυνατότητα αναζήτησης κειμένου και μεταδεδομένων

Αυτά τα βήματα περιγράφουν πώς να μετατρέψετε PDF image to PDF text using Java. Δημιουργήστε το αντικείμενο μηχανής αναγνώρισης, προετοιμάστε το αρχείο εισόδου προσθέτοντας το σαρωμένο αρχείο PDF στο αντικείμενο OcrInput, ορίστε τις παραμέτρους στο αντικείμενο RecognitionSettings, καλέστε τη μέθοδο Recognize() για να σαρώσετε τα δεδομένα και να αποθηκεύσετε τα αποτελέσματα σε ένα ενδιάμεσο αρχείο PDF. Τέλος, φορτώστε το ενδιάμεσο αρχείο PDF χρησιμοποιώντας το αντικείμενο Aspose.PDF.Document και προσθέστε μεταδεδομένα ή μορφοποιήστε το περαιτέρω πριν αποθηκεύσετε το τελικό αρχείο PDF.

Κώδικας για τη Μετατροπή Εικόνας PDF σε Κείμενο χρησιμοποιώντας Java

Αυτός ο κώδικας δείχνει πώς να μετατρέψετε το PDF σε PDF με δυνατότητα αναζήτησης χρησιμοποιώντας Java. Μπορείτε να ορίσετε μια συγκεκριμένη γλώσσα ανίχνευσης κατά τη σάρωση του PDF, να ορίσετε μια σημαία για αυτόματη ανίχνευση της γλώσσας, να περιορίσετε την αναγνώριση σε συγκεκριμένους χαρακτήρες ή να αποκλείσετε χαρακτήρες που θέλετε να αγνοήσει το OCR. Επιπλέον, υπάρχουν επιλογές για την επιλογή της στρατηγικής ανίχνευσης περιοχής/διάταξης του πηγαίου εγγράφου, εάν απαιτείται.

Αυτό το άρθρο μας δίδαξε τη διαδικασία μετατροπής ενός PDF σε PDF με δυνατότητα επιλογής κειμένου. Για εξαγωγή δεδομένων από μια φόρμα PDF σε Excel, ανατρέξτε στο άρθρο Εξαγωγή δεδομένων από μια φόρμα PDF σε Excel χρησιμοποιώντας Java.

 Ελληνικά