Jak wyszukiwać tekst i wyróżniać w formacie PDF za pomocą języka C#

Ten prosty przewodnik omawia wyszukiwanie tekstu i wyróżnianie w PDF przy użyciu języka C#. Prowadzi ładowanie pliku PDF, przeszukiwanie tekstu w pliku PDF, tworzenie adnotacji wyróżnienia z kolorem i kształtem oraz stosowanie różnych adnotacji wyróżnienia do niektórych tekstów. Możesz wyróżnić dokument PDF za pomocą C# bez instalowania jakiegokolwiek narzędzia innej firmy.

Kroki wyszukiwania tekstu i wyróżniania w formacie PDF przy użyciu języka C#

  1. Skonfiguruj bibliotekę Aspose.PDF for .NET z menedżera pakietów NuGet, aby podświetlić dowolny tekst w pliku PDF
  2. Załaduj wejściowy plik PDF z obiektem klasy Document, aby wyszukać tekst i zaznaczyć go
  3. Wyszukaj tekst w pliku PDF, aby go wyróżnić
  4. Utwórz HighlightAnnotation, określając kolor i kształt
  5. Zastosuj adnotację wyróżnienia do wyszukiwanego tekstu
  6. Zapisz wyjściowy plik PDF z wyróżnionym tekstem

Te kroki opisują prosty proces podświetlania tekstu w formacie PDF przy użyciu języka C#. Wystarczy wyszukać określony ciąg znaków w dokumencie, a następnie go zaznaczyć. Co więcej, możesz wybrać kolor podświetlenia tekstu, taki jak żółty, czerwony lub dowolny inny kolor wraz z kształtem zgodnie z własnymi wymaganiami.

Kod do podświetlania słów w PDF przy użyciu C#

using Aspose.Pdf;
using Aspose.Pdf.Annotations;
using Aspose.Pdf.Text;
namespace SearchTextAndHighlightInPdfUsingCSharp
{
class Program
{
static void Main(string[] args) // Main function to search text in PDF and highlight
{
// Instantiate the license to avoid any trial version limitations
// and watermark in the output ODF file
Aspose.Pdf.License licHighlightText= new Aspose.Pdf.License();
licHighlightText.SetLicense("Aspose.Pdf.lic");
// Load an existing PDF file in which you want to highlight text
Document doc = new Document("sample_input.pdf");
// Search target text to highlight
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("The text to be searched");
doc.Pages[1].Accept(textFragmentAbsorber);
// Create a highlight annotation
HighlightAnnotation ha = new HighlightAnnotation(doc.Pages[1], textFragmentAbsorber.TextFragments[1].Rectangle);
// Specify highlight color
ha.Color = Color.Yellow;
// Add annotation to highlight text in PDF
doc.Pages[1].Annotations.Add(ha);
// Save the document
doc.Save("PDF_with_Highlighted_Text.pdf");
System.Console.WriteLine("Done");
}
}
}

Ten kod odpowiada na pytanie jak wyróżniać w PDF przy użyciu C#. Klasa TextFragmentAbsorber służy do wyszukiwania ciągu na określonej stronie w pliku PDF. Klasa HighlightAnnotation służy do zdefiniowania właściwości zakreślacza, który ma być używany. Na koniec dodajemy zdefiniowaną adnotację, aby podświetlić tekst w PDF przed zapisaniem go na dysku.

W tym samouczku wyjaśniono, jak wyróżniać określony tekst w pliku PDF. Jeśli jednak chcesz programowo odczytać plik PDF, przejdź do artykułu na jak czytać PDF w C#.

 Polski