Este artículo explica cómo extraer fuentes de PDF usando C# para su posterior análisis, edición y depuración. Proporcionará detalles sobre la configuración del IDE, una lista de pasos para desarrollar la aplicación y un código funcional para extraer fuentes de PDF Acrobat usando C#. Puede acceder y mostrar todas las propiedades de la fuente extraída y guardarla en el disco si es necesario.
Pasos para extraer un archivo de fuente de PDF usando C#
- Configurar el IDE para usar Aspose.PDF para extraer fuentes
- Cargar el archivo PDF de origen con el objeto de la clase Document estableciendo el nombre del archivo PDF
- Obtener todas las fuentes en el PDF cargado usando la clase FontUtilities
- Iterar a través de la colección de fuentes
- Crear un flujo de memoria y guardar la fuente extraída en el disco si es necesario
- Mostrar diferentes propiedades de la fuente en la consola
Estos pasos explican cómo extraer fuentes de un archivo PDF usando C#. Cargue el archivo PDF en el objeto de la clase Document y obtenga una lista de todas las fuentes usando la clase FontUtilities. Itere a través de todas las fuentes en la lista, muestre sus propiedades y guárdelas en un flujo de memoria para crear un archivo de fuente en el disco si es necesario.
Código para extraer fuentes de un archivo PDF usando C#
// Create a new instance of the License class | |
var pdfLic = new License(); | |
// Set the license using the provided license file ("license.lic"). | |
pdfLic.SetLicense("license.lic"); | |
// Open the PDF document | |
using (var document = new Aspose.Pdf.Document("Test.pdf")) | |
{ | |
// Retrieve all fonts used in the PDF document | |
Aspose.Pdf.Text.Font[] fonts = document.FontUtilities.GetAllFonts(); | |
// Iterate through each font in the fonts array. | |
foreach (Aspose.Pdf.Text.Font font in fonts) | |
{ | |
// Create a MemoryStream to temporarily store the font data. | |
using (MemoryStream memoryStream = new MemoryStream()) | |
{ | |
// Save the font data into the MemoryStream. | |
font.Save(memoryStream); | |
// Write the font data from the MemoryStream to a .TTF file. | |
// The file is named after the font's name. | |
File.WriteAllBytes($"{font.FontName}.TTF", memoryStream.ToArray()); | |
// Print the font name | |
Console.WriteLine(font.FontName); | |
} | |
} | |
} |
Este código demuestra el proceso de extraer fuentes de PDF usando C#. Si desea extraer fuentes incrustadas, use la bandera IsEmbedded para cada fuente y procésela en consecuencia. La clase Font expone varias otras propiedades que se pueden acceder, como la bandera IsAccessible que indica si la fuente está instalada en el sistema y la obtención del último error de incrustación de fuentes.
Este artículo nos ha enseñado cómo acceder y mostrar fuentes en un archivo PDF. Para convertir una URL a PDF, consulte el artículo sobre Convertir URL a PDF usando C#.