Εξαγωγή κειμένου από PowerPoint χρησιμοποιώντας C#

Αυτός ο σύντομος οδηγός περιγράφει πώς να εξάγετε κείμενο από το PowerPoint χρησιμοποιώντας C#. Περιλαμβάνει λεπτομέρειες για τη ρύθμιση του IDE, μια λίστα βημάτων και ένα δείγμα κώδικα για την ανάπτυξη ενός PowerPoint σε μετατροπέα κειμένου χρησιμοποιώντας C#. Θα μάθετε πώς να έχετε πρόσβαση σε διάφορα περιεχόμενα στην παρουσίαση/διαφάνειες για την ανάκτηση κειμένου από αυτήν.

Βήματα για τη μετατροπή του PowerPoint σε κείμενο χρησιμοποιώντας C#

  1. Ορίστε το περιβάλλον να χρησιμοποιεί Aspose.Slides for .NET για τη μετατροπή του PPTX σε TXT
  2. Ανοίξτε το αρχείο PPTX στη μνήμη χρησιμοποιώντας την κλάση Presentation, χρησιμοποιώντας το καθορισμένο μονοπάτι εισόδου
  3. Καλέστε τη μέθοδο SlideUtil.GetAllTextFrames() για την εξαγωγή όλων των πλαισίων κειμένου από κάθε διαφάνεια
  4. Ορίστε τη σημαία για την εξαγωγή πλαισίων κειμένου από τις κύριες και τις διαφάνειες διάταξης, επίσης
  5. Δηλώστε το αντικείμενο StringBuilder για την αποθήκευση του εξαγόμενου κειμένου
  6. Αναλύστε κάθε πλαίσιο κειμένου και αποκτήστε πρόσβαση στις παραγράφους
  7. Διέλθετε σε κάθε παράγραφο και προσθέστε τα τμήματα κειμένου της σε νέες γραμμές στο StringBuilder
  8. Γράψτε το τελικό συγκεντρωμένο κείμενο σε αρχείο TXT στον δίσκο

Αυτά τα βήματα εξηγούν την ανάπτυξη του Μετατροπέας PPTX σε κείμενο χρησιμοποιώντας C#. Φορτώστε την παρουσίαση, λάβετε τη συλλογή όλων των πλαισίων κειμένου, δημιουργήστε ένα αντικείμενο StringBuilder και επαναλάβετε για κάθε πλαίσιο στη συλλογή. Για κάθε πλαίσιο, αποκτήστε πρόσβαση στη συλλογή παραγράφων, σε κάθε παράγραφο, λάβετε τη συλλογή των τμημάτων, ανακτήστε το κείμενο από το τμήμα και προσθέστε το στο αντικείμενο StringBuilder.

Κώδικας για τη μετατροπή του PPTX σε TXT με C#.

Αυτός ο κώδικας επιδεικνύει πώς να εξάγετε κείμενο από PPTX χρησιμοποιώντας C#. Υπάρχει επίσης ένας άλλος γρήγορος τρόπος για να αποκτήσετε όλο το κείμενο της παρουσίασης, χρησιμοποιώντας το PresentationFactory.Instance. Μέθοδος GetPresentationText(inputPath, TextExtractionArrangingMode.Unarranged) γράφει το περιεχόμενο κάθε διαφάνειας σε αρχείο εξόδου κωδικοποιημένο σε UTF-8. Για κάθε διαφάνεια γράφονται τέσσερα στοιχεία κειμένου, συμπεριλαμβανομένου του κύριου κειμένου, των σημειώσεων του παρουσιαστή, του κειμένου της κύριας διαφάνειας και του κειμένου διάταξης.

Αυτό το άρθρο μας δίδαξε πώς να εξάγουμε όλο το κείμενο από μια παρουσίαση. Για να μετατρέψετε ένα PowerPoint σε βίντεο MP4, ανατρέξτε στο άρθρο Μετατροπή PowerPoint σε βίντεο με C#.

 Ελληνικά