Dieser Artikel erklärt, wie man Schriftarten aus PDF mit C# extrahiert, um sie weiter zu analysieren, zu bearbeiten und zu debuggen. Er bietet Details zur Einrichtung der IDE, eine Schritt-für-Schritt-Anleitung zur Entwicklung der Anwendung und einen funktionierenden Code zum Extrahieren von Schriftarten aus PDF Acrobat mit C#. Sie können auf alle Eigenschaften der extrahierten Schriftart zugreifen und sie anzeigen sowie bei Bedarf auf der Festplatte speichern.
Schritte zum Extrahieren einer Schriftartdatei aus PDF mit C#
- Richten Sie die IDE ein, um Aspose.PDF zum Extrahieren von Schriftarten zu verwenden
- Laden Sie die Quell-PDF-Datei mit dem Document-Klassenobjekt, indem Sie den PDF-Dateinamen festlegen
- Holen Sie sich alle Schriftarten in der geladenen PDF-Datei mit der FontUtilities-Klasse
- Durchlaufen Sie die Sammlung der Schriftarten
- Erstellen Sie einen Speicherstream und speichern Sie die extrahierte Schriftart auf der Festplatte, falls erforderlich
- Zeigen Sie verschiedene Eigenschaften der Schriftart auf der Konsole an
Diese Schritte erklären, wie man Schriftarten aus einer PDF-Datei mit C# extrahiert. Laden Sie die PDF-Datei in das Document-Klassenobjekt und erhalten Sie eine Liste aller Schriftarten mit der FontUtilities-Klasse. Durchlaufen Sie alle Schriftarten in der Liste, zeigen Sie ihre Eigenschaften an und speichern Sie sie bei Bedarf in einem Speicherstream, um eine Schriftartdatei auf der Festplatte zu erstellen.
Code zum Extrahieren von Schriftarten aus einer PDF-Datei mit C#
// Create a new instance of the License class | |
var pdfLic = new License(); | |
// Set the license using the provided license file ("license.lic"). | |
pdfLic.SetLicense("license.lic"); | |
// Open the PDF document | |
using (var document = new Aspose.Pdf.Document("Test.pdf")) | |
{ | |
// Retrieve all fonts used in the PDF document | |
Aspose.Pdf.Text.Font[] fonts = document.FontUtilities.GetAllFonts(); | |
// Iterate through each font in the fonts array. | |
foreach (Aspose.Pdf.Text.Font font in fonts) | |
{ | |
// Create a MemoryStream to temporarily store the font data. | |
using (MemoryStream memoryStream = new MemoryStream()) | |
{ | |
// Save the font data into the MemoryStream. | |
font.Save(memoryStream); | |
// Write the font data from the MemoryStream to a .TTF file. | |
// The file is named after the font's name. | |
File.WriteAllBytes($"{font.FontName}.TTF", memoryStream.ToArray()); | |
// Print the font name | |
Console.WriteLine(font.FontName); | |
} | |
} | |
} |
Dieser Code demonstriert den Prozess des Extrahierens von Schriftarten aus PDF mit C#. Wenn Sie eingebettete Schriftarten extrahieren möchten, verwenden Sie das Flag IsEmbedded für jede Schriftart und verarbeiten Sie sie entsprechend. Die Font-Klasse bietet verschiedene weitere Eigenschaften, auf die zugegriffen werden kann, wie das IsAccessible-Flag, das anzeigt, ob die Schriftart auf dem System installiert ist, und das Abrufen des letzten Schriftart-Einbettungsfehlers.
Dieser Artikel hat uns gezeigt, wie man auf Schriftarten in einer PDF-Datei zugreift und sie anzeigt. Um eine URL in PDF zu konvertieren, lesen Sie den Artikel über Konvertieren von URL in PDF mit C#.