Denna artikel förklarar hur man extraherar teckensnitt från PDF med C# för vidare analys, redigering och felsökning. Den kommer att ge detaljer om hur man ställer in IDE, en lista med steg för att utveckla applikationen och en fungerande kod för att extrahera teckensnitt från PDF Acrobat med C#. Du kan komma åt och visa alla egenskaper för det extraherade teckensnittet och spara det på disken om det behövs.
Steg för att extrahera teckensnittsfil från PDF med C#
- Ställ in IDE för att använda Aspose.PDF för att extrahera teckensnitt
- Ladda käll-PDF-filen med Document-klassobjektet genom att ställa in PDF-filens namn
- Hämta alla teckensnitt i den laddade PDF-filen med FontUtilities-klassen
- Iterera genom samlingen av teckensnitt
- Skapa en minnesström och spara det extraherade teckensnittet på disken om det behövs
- Visa olika egenskaper för teckensnittet i konsolen
Dessa steg förklarar hur man extraherar teckensnitt från en PDF-fil med C#. Ladda PDF-filen i Document-klassobjektet och få en lista över alla teckensnitt med FontUtilities-klassen. Iterera genom alla teckensnitt i listan, visa deras egenskaper och spara dem i en minnesström för att skapa en teckensnittsfil på disken om det behövs.
Kod för att extrahera teckensnitt från PDF-fil med C#
// Create a new instance of the License class | |
var pdfLic = new License(); | |
// Set the license using the provided license file ("license.lic"). | |
pdfLic.SetLicense("license.lic"); | |
// Open the PDF document | |
using (var document = new Aspose.Pdf.Document("Test.pdf")) | |
{ | |
// Retrieve all fonts used in the PDF document | |
Aspose.Pdf.Text.Font[] fonts = document.FontUtilities.GetAllFonts(); | |
// Iterate through each font in the fonts array. | |
foreach (Aspose.Pdf.Text.Font font in fonts) | |
{ | |
// Create a MemoryStream to temporarily store the font data. | |
using (MemoryStream memoryStream = new MemoryStream()) | |
{ | |
// Save the font data into the MemoryStream. | |
font.Save(memoryStream); | |
// Write the font data from the MemoryStream to a .TTF file. | |
// The file is named after the font's name. | |
File.WriteAllBytes($"{font.FontName}.TTF", memoryStream.ToArray()); | |
// Print the font name | |
Console.WriteLine(font.FontName); | |
} | |
} | |
} |
Denna kod demonstrerar processen för att extrahera teckensnitt från PDF med C#. Om du vill extrahera inbäddade teckensnitt, använd flaggan IsEmbedded för varje teckensnitt och bearbeta det därefter. Font-klassen exponerar olika andra egenskaper som kan nås, som flaggan IsAccessible som visar om teckensnittet är installerat på systemet och hämtning av det sista teckensnittsinbäddningsfelet.
Denna artikel har lärt oss hur man kommer åt och visar teckensnitt i en PDF-fil. För att konvertera en URL till PDF, se artikeln om Konvertera URL till PDF med C#.