В этом простом руководстве рассказывается, как искать текст и выделять его в PDF с помощью C#. В нем рассказывается о загрузке PDF-файла, поиске текста в PDF, создании выделенных аннотаций с цветом и формой и применении различных выделенных аннотаций к некоторому тексту. Вы можете выделить PDF-документ с помощью C# без установки каких-либо сторонних инструментов.
Шаги для поиска текста и выделения в PDF с помощью С#
- Настройте библиотеку Aspose.PDF for .NET в диспетчере пакетов NuGet, чтобы выделить любой текст в PDF.
- Загрузите входной PDF-файл с объектом класса Document, чтобы найти текст и выделить его.
- Найдите текст в PDF, чтобы выделить
- Создайте HighlightAnnotation, указав цвет и форму
- Применение выделения аннотации к искомому тексту
- Сохраните выходной PDF-файл с выделенным текстом.
Эти шаги раскрывают простой процесс выделения текста в PDF с помощью C#. Вам нужно только найти определенную строку в документе, а затем выделить ее. Кроме того, вы можете выбрать цвет для выделения текста, например, желтый, красный или любой другой цвет вместе с формой в соответствии с вашими требованиями.
Код для выделения слов в PDF с помощью С#
using Aspose.Pdf; | |
using Aspose.Pdf.Annotations; | |
using Aspose.Pdf.Text; | |
namespace SearchTextAndHighlightInPdfUsingCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) // Main function to search text in PDF and highlight | |
{ | |
// Instantiate the license to avoid any trial version limitations | |
// and watermark in the output ODF file | |
Aspose.Pdf.License licHighlightText= new Aspose.Pdf.License(); | |
licHighlightText.SetLicense("Aspose.Pdf.lic"); | |
// Load an existing PDF file in which you want to highlight text | |
Document doc = new Document("sample_input.pdf"); | |
// Search target text to highlight | |
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("The text to be searched"); | |
doc.Pages[1].Accept(textFragmentAbsorber); | |
// Create a highlight annotation | |
HighlightAnnotation ha = new HighlightAnnotation(doc.Pages[1], textFragmentAbsorber.TextFragments[1].Rectangle); | |
// Specify highlight color | |
ha.Color = Color.Yellow; | |
// Add annotation to highlight text in PDF | |
doc.Pages[1].Annotations.Add(ha); | |
// Save the document | |
doc.Save("PDF_with_Highlighted_Text.pdf"); | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
Этот код отвечает на вопрос как выделить в PDF с помощью C#. Класс TextFragmentAbsorber используется для поиска строки на определенной странице PDF-файла. Класс HighlightAnnotation используется для определения характеристик используемого маркера подсветки. В конце мы добавляем заданную аннотацию, чтобы выделить текст в PDF перед его сохранением на диск.
В этом руководстве объясняется выделение определенного текста в файле PDF. Однако, если вы заинтересованы в программном чтении файла PDF, перейдите к статье как читать PDF на С#.