Extraer fuente de PDF usando C#

Este artículo explica cómo extraer fuentes de PDF usando C# para su posterior análisis, edición y depuración. Proporcionará detalles sobre la configuración del IDE, una lista de pasos para desarrollar la aplicación y un código funcional para extraer fuentes de PDF Acrobat usando C#. Puede acceder y mostrar todas las propiedades de la fuente extraída y guardarla en el disco si es necesario.

Pasos para extraer un archivo de fuente de PDF usando C#

  1. Configurar el IDE para usar Aspose.PDF para extraer fuentes
  2. Cargar el archivo PDF de origen con el objeto de la clase Document estableciendo el nombre del archivo PDF
  3. Obtener todas las fuentes en el PDF cargado usando la clase FontUtilities
  4. Iterar a través de la colección de fuentes
  5. Crear un flujo de memoria y guardar la fuente extraída en el disco si es necesario
  6. Mostrar diferentes propiedades de la fuente en la consola

Estos pasos explican cómo extraer fuentes de un archivo PDF usando C#. Cargue el archivo PDF en el objeto de la clase Document y obtenga una lista de todas las fuentes usando la clase FontUtilities. Itere a través de todas las fuentes en la lista, muestre sus propiedades y guárdelas en un flujo de memoria para crear un archivo de fuente en el disco si es necesario.

Código para extraer fuentes de un archivo PDF usando C#

// Create a new instance of the License class
var pdfLic = new License();
// Set the license using the provided license file ("license.lic").
pdfLic.SetLicense("license.lic");
// Open the PDF document
using (var document = new Aspose.Pdf.Document("Test.pdf"))
{
// Retrieve all fonts used in the PDF document
Aspose.Pdf.Text.Font[] fonts = document.FontUtilities.GetAllFonts();
// Iterate through each font in the fonts array.
foreach (Aspose.Pdf.Text.Font font in fonts)
{
// Create a MemoryStream to temporarily store the font data.
using (MemoryStream memoryStream = new MemoryStream())
{
// Save the font data into the MemoryStream.
font.Save(memoryStream);
// Write the font data from the MemoryStream to a .TTF file.
// The file is named after the font's name.
File.WriteAllBytes($"{font.FontName}.TTF", memoryStream.ToArray());
// Print the font name
Console.WriteLine(font.FontName);
}
}
}

Este código demuestra el proceso de extraer fuentes de PDF usando C#. Si desea extraer fuentes incrustadas, use la bandera IsEmbedded para cada fuente y procésela en consecuencia. La clase Font expone varias otras propiedades que se pueden acceder, como la bandera IsAccessible que indica si la fuente está instalada en el sistema y la obtención del último error de incrustación de fuentes.

Este artículo nos ha enseñado cómo acceder y mostrar fuentes en un archivo PDF. Para convertir una URL a PDF, consulte el artículo sobre Convertir URL a PDF usando C#.

 Español