Lettertype uit PDF extraheren met C#

Dit artikel legt uit hoe je een lettertype uit PDF kunt extraheren met C# voor verdere analyse, bewerking en debugging. Het biedt details over het instellen van de IDE, een lijst met stappen voor het ontwikkelen van de applicatie en een werkende code om een lettertype uit PDF Acrobat te extraheren met C#. Je hebt toegang tot alle eigenschappen van het geëxtraheerde lettertype en kunt deze weergeven en indien nodig opslaan op schijf.

Stappen om een lettertypebestand uit PDF te extraheren met C#

  1. Stel de IDE in om Aspose.PDF te gebruiken voor het extraheren van lettertypen
  2. Laad het bron-PDF-bestand met het Document-klasseobject door de PDF-bestandsnaam in te stellen
  3. Haal alle lettertypen in het geladen PDF-bestand op met de FontUtilities-klasse
  4. Itereer door de verzameling lettertypen
  5. Maak een geheugenstroom en sla het geëxtraheerde lettertype op schijf op indien nodig
  6. Toon verschillende eigenschappen van het lettertype in de console

Deze stappen leggen uit hoe je een lettertype uit een PDF-bestand kunt extraheren met C#. Laad het PDF-bestand in het Document-klasseobject en krijg een lijst van alle lettertypen met de FontUtilities-klasse. Itereer door alle lettertypen in de lijst, toon hun eigenschappen en sla ze indien nodig op in een geheugenstroom om een lettertypebestand op schijf te maken.

Code om een lettertype uit een PDF-bestand te extraheren met C#

// Create a new instance of the License class
var pdfLic = new License();
// Set the license using the provided license file ("license.lic").
pdfLic.SetLicense("license.lic");
// Open the PDF document
using (var document = new Aspose.Pdf.Document("Test.pdf"))
{
// Retrieve all fonts used in the PDF document
Aspose.Pdf.Text.Font[] fonts = document.FontUtilities.GetAllFonts();
// Iterate through each font in the fonts array.
foreach (Aspose.Pdf.Text.Font font in fonts)
{
// Create a MemoryStream to temporarily store the font data.
using (MemoryStream memoryStream = new MemoryStream())
{
// Save the font data into the MemoryStream.
font.Save(memoryStream);
// Write the font data from the MemoryStream to a .TTF file.
// The file is named after the font's name.
File.WriteAllBytes($"{font.FontName}.TTF", memoryStream.ToArray());
// Print the font name
Console.WriteLine(font.FontName);
}
}
}

Deze code demonstreert het proces van het extraheren van een lettertype uit PDF met C#. Als je ingesloten lettertypen wilt extraheren, gebruik dan de IsEmbedded-vlag voor elk lettertype en verwerk deze dienovereenkomstig. De Font-klasse stelt verschillende andere eigenschappen bloot die toegankelijk zijn, zoals de IsAccessible-vlag die aangeeft of het lettertype op het systeem is geïnstalleerd en het verkrijgen van de laatste lettertype-embedfout.

Dit artikel heeft ons geleerd hoe we toegang kunnen krijgen tot lettertypen in een PDF-bestand en deze kunnen weergeven. Om een URL naar PDF te converteren, zie het artikel over URL naar PDF converteren met C#.

 Nederlands