Extrair fonte de PDF usando C#

Este artigo explica como extrair fontes de PDF usando C# para análise, edição e depuração adicionais. Ele fornecerá detalhes sobre a configuração do IDE, uma lista de etapas para desenvolver o aplicativo e um código funcional para extrair fontes de PDF Acrobat usando C#. Você pode acessar e exibir todas as propriedades da fonte extraída e salvá-la no disco, se necessário.

Etapas para extrair arquivo de fonte de PDF usando C#

  1. Configure o IDE para usar Aspose.PDF para extrair fontes
  2. Carregue o arquivo PDF de origem com o objeto da classe Document definindo o nome do arquivo PDF
  3. Obtenha todas as fontes no PDF carregado usando a classe FontUtilities
  4. Itere pela coleção de fontes
  5. Crie um fluxo de memória e salve a fonte extraída no disco, se necessário
  6. Exiba diferentes propriedades da fonte no console

Essas etapas explicam como extrair fontes de um arquivo PDF usando C#. Carregue o arquivo PDF no objeto da classe Document e obtenha uma lista de todas as fontes usando a classe FontUtilities. Itere por todas as fontes na lista, exiba suas propriedades e salve-as em um fluxo de memória para criar um arquivo de fonte no disco, se necessário.

Código para extrair fontes de um arquivo PDF usando C#

// Create a new instance of the License class
var pdfLic = new License();
// Set the license using the provided license file ("license.lic").
pdfLic.SetLicense("license.lic");
// Open the PDF document
using (var document = new Aspose.Pdf.Document("Test.pdf"))
{
// Retrieve all fonts used in the PDF document
Aspose.Pdf.Text.Font[] fonts = document.FontUtilities.GetAllFonts();
// Iterate through each font in the fonts array.
foreach (Aspose.Pdf.Text.Font font in fonts)
{
// Create a MemoryStream to temporarily store the font data.
using (MemoryStream memoryStream = new MemoryStream())
{
// Save the font data into the MemoryStream.
font.Save(memoryStream);
// Write the font data from the MemoryStream to a .TTF file.
// The file is named after the font's name.
File.WriteAllBytes($"{font.FontName}.TTF", memoryStream.ToArray());
// Print the font name
Console.WriteLine(font.FontName);
}
}
}

Este código demonstra o processo de extração de fontes de PDF usando C#. Se você deseja extrair fontes incorporadas, use o sinalizador IsEmbedded para cada fonte e processe-a adequadamente. A classe Font expõe várias outras propriedades que podem ser acessadas, como o sinalizador IsAccessible, que indica se a fonte está instalada no sistema, e a obtenção do último erro de incorporação de fonte.

Este artigo nos ensinou como acessar e exibir fontes em um arquivo PDF. Para converter uma URL em PDF, consulte o artigo sobre Converter URL em PDF usando C#.

 Português