Как искать текст и выделять в PDF с помощью C#

В этом простом руководстве рассказывается, как искать текст и выделять его в PDF с помощью C#. В нем рассказывается о загрузке PDF-файла, поиске текста в PDF, создании выделенных аннотаций с цветом и формой и применении различных выделенных аннотаций к некоторому тексту. Вы можете выделить PDF-документ с помощью C# без установки каких-либо сторонних инструментов.

Шаги для поиска текста и выделения в PDF с помощью С#

  1. Настройте библиотеку Aspose.PDF for .NET в диспетчере пакетов NuGet, чтобы выделить любой текст в PDF.
  2. Загрузите входной PDF-файл с объектом класса Document, чтобы найти текст и выделить его.
  3. Найдите текст в PDF, чтобы выделить
  4. Создайте HighlightAnnotation, указав цвет и форму
  5. Применение выделения аннотации к искомому тексту
  6. Сохраните выходной PDF-файл с выделенным текстом.

Эти шаги раскрывают простой процесс выделения текста в PDF с помощью C#. Вам нужно только найти определенную строку в документе, а затем выделить ее. Кроме того, вы можете выбрать цвет для выделения текста, например, желтый, красный или любой другой цвет вместе с формой в соответствии с вашими требованиями.

Код для выделения слов в PDF с помощью С#

using Aspose.Pdf;
using Aspose.Pdf.Annotations;
using Aspose.Pdf.Text;
namespace SearchTextAndHighlightInPdfUsingCSharp
{
class Program
{
static void Main(string[] args) // Main function to search text in PDF and highlight
{
// Instantiate the license to avoid any trial version limitations
// and watermark in the output ODF file
Aspose.Pdf.License licHighlightText= new Aspose.Pdf.License();
licHighlightText.SetLicense("Aspose.Pdf.lic");
// Load an existing PDF file in which you want to highlight text
Document doc = new Document("sample_input.pdf");
// Search target text to highlight
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("The text to be searched");
doc.Pages[1].Accept(textFragmentAbsorber);
// Create a highlight annotation
HighlightAnnotation ha = new HighlightAnnotation(doc.Pages[1], textFragmentAbsorber.TextFragments[1].Rectangle);
// Specify highlight color
ha.Color = Color.Yellow;
// Add annotation to highlight text in PDF
doc.Pages[1].Annotations.Add(ha);
// Save the document
doc.Save("PDF_with_Highlighted_Text.pdf");
System.Console.WriteLine("Done");
}
}
}

Этот код отвечает на вопрос как выделить в PDF с помощью C#. Класс TextFragmentAbsorber используется для поиска строки на определенной странице PDF-файла. Класс HighlightAnnotation используется для определения характеристик используемого маркера подсветки. В конце мы добавляем заданную аннотацию, чтобы выделить текст в PDF перед его сохранением на диск.

В этом руководстве объясняется выделение определенного текста в файле PDF. Однако, если вы заинтересованы в программном чтении файла PDF, перейдите к статье как читать PDF на С#.

 Русский