Αυτό το άρθρο εξηγεί πώς να εξάγετε γραμματοσειρά από PDF χρησιμοποιώντας C# για περαιτέρω ανάλυση, επεξεργασία και αποσφαλμάτωση. Θα παρέχει λεπτομέρειες για τη ρύθμιση του IDE, μια λίστα βημάτων για την ανάπτυξη της εφαρμογής και έναν λειτουργικό κώδικα για την εξαγωγή γραμματοσειράς από PDF Acrobat χρησιμοποιώντας C#. Μπορείτε να αποκτήσετε πρόσβαση και να εμφανίσετε όλες τις ιδιότητες της εξαγόμενης γραμματοσειράς και να την αποθηκεύσετε στο δίσκο εάν είναι απαραίτητο.
Βήματα για την εξαγωγή αρχείου γραμματοσειράς από PDF χρησιμοποιώντας C#
- Ρυθμίστε το IDE για να χρησιμοποιεί το Aspose.PDF για την εξαγωγή γραμματοσειρών
- Φορτώστε το αρχείο PDF πηγής με το αντικείμενο κλάσης Document ορίζοντας το όνομα του αρχείου PDF
- Ανακτήστε όλες τις γραμματοσειρές στο φορτωμένο PDF χρησιμοποιώντας την κλάση FontUtilities
- Επαναλάβετε τη συλλογή των γραμματοσειρών
- Δημιουργήστε μια ροή μνήμης και αποθηκεύστε την εξαγόμενη γραμματοσειρά στο δίσκο εάν είναι απαραίτητο
- Εμφανίστε διαφορετικές ιδιότητες της γραμματοσειράς στην κονσόλα
Αυτά τα βήματα εξηγούν πώς να εξάγετε γραμματοσειρά από αρχείο PDF χρησιμοποιώντας C#. Φορτώστε το αρχείο PDF στο αντικείμενο κλάσης Document και λάβετε μια λίστα όλων των γραμματοσειρών χρησιμοποιώντας την κλάση FontUtilities. Επαναλάβετε όλες τις γραμματοσειρές στη λίστα, εμφανίστε τις ιδιότητές τους και αποθηκεύστε τις σε μια ροή μνήμης για τη δημιουργία ενός αρχείου γραμματοσειράς στο δίσκο εάν είναι απαραίτητο.
Κώδικας για την εξαγωγή γραμματοσειράς από αρχείο PDF χρησιμοποιώντας C#
// Create a new instance of the License class | |
var pdfLic = new License(); | |
// Set the license using the provided license file ("license.lic"). | |
pdfLic.SetLicense("license.lic"); | |
// Open the PDF document | |
using (var document = new Aspose.Pdf.Document("Test.pdf")) | |
{ | |
// Retrieve all fonts used in the PDF document | |
Aspose.Pdf.Text.Font[] fonts = document.FontUtilities.GetAllFonts(); | |
// Iterate through each font in the fonts array. | |
foreach (Aspose.Pdf.Text.Font font in fonts) | |
{ | |
// Create a MemoryStream to temporarily store the font data. | |
using (MemoryStream memoryStream = new MemoryStream()) | |
{ | |
// Save the font data into the MemoryStream. | |
font.Save(memoryStream); | |
// Write the font data from the MemoryStream to a .TTF file. | |
// The file is named after the font's name. | |
File.WriteAllBytes($"{font.FontName}.TTF", memoryStream.ToArray()); | |
// Print the font name | |
Console.WriteLine(font.FontName); | |
} | |
} | |
} |
Αυτός ο κώδικας δείχνει τη διαδικασία εξαγωγής γραμματοσειράς από PDF χρησιμοποιώντας C#. Εάν θέλετε να εξάγετε ενσωματωμένες γραμματοσειρές, χρησιμοποιήστε τη σημαία IsEmbedded για κάθε γραμματοσειρά και επεξεργαστείτε την ανάλογα. Η κλάση Font εκθέτει διάφορες άλλες ιδιότητες που μπορούν να προσπελαστούν, όπως η σημαία IsAccessible που δείχνει εάν η γραμματοσειρά είναι εγκατεστημένη στο σύστημα και η λήψη του τελευταίου σφάλματος ενσωμάτωσης γραμματοσειράς.
Αυτό το άρθρο μας έμαθε πώς να αποκτούμε πρόσβαση και να εμφανίζουμε γραμματοσειρές σε ένα αρχείο PDF. Για να μετατρέψετε μια διεύθυνση URL σε PDF, ανατρέξτε στο άρθρο σχετικά με τη Μετατροπή διεύθυνσης URL σε PDF χρησιμοποιώντας C#.