Kako pronaći i zamijeniti tekst u PDF-u koristeći C#

Ovaj brzi vodič opisuje kako pronaći i zamijeniti tekst u PDF-u pomoću C# uz pomoć detaljnih koraka i koda koji se može izvoditi. Pomaže u konfiguriranju okruženja, a zatim pruža postupak korak po korak za zamjenu teksta u PDF-u pomoću C#. Nakon što se datoteka ažurira, možete je spremiti natrag na disk u izvornom formatu, tj. PDF ili kao DOCX, Excel, HTML, itd. da spomenemo samo neke.

Koraci za pronalaženje i zamjenu teksta u PDF-u pomoću C#

  1. Konfigurirajte projekt za korištenje Aspose.PDF for .NET pomoću upravitelja paketa NuGet
  2. Stvorite ili učitajte PDF datoteku koja sadrži ogledni tekst pomoću objekta klase Document
  3. Koristeći objekt klase TextFragmentAbsorber, postavite tekst koji će se pretraživati
  4. Za sve stranice u ulaznoj PDF datoteci prihvatite apsorber teksta
  5. Dobijte zbirku fragmenata u kojima je tekst izdvojen iz učitane PDF datoteke
  6. Raščlanite sve fragmente i postavite novi tekst
  7. Spremite ažuriranu PDF datoteku

Ovi koraci opisuju kako u PDF-u pretraživati i zamijeniti tekst pomoću C#. Stvorena je nova datoteka s uzorkom teksta, ali možete učitati postojeću PDF datoteku čiji tekst treba zamijeniti. Postoji niz dostupnih opcija za pretraživanje teksta u PDF-u kao što je ignoriranje teksta u sjeni, ograničavanje pretraživanja na stranice uvezane itd.

Kod za zamjenu teksta u PDF-u pomoću C#

using Aspose.Pdf;
using Aspose.Pdf.Text;
namespace FindAndReplaceTextInPdfUsingCSharp
{
class Program
{
static void Main(string[] args) // Main function to create 7z archive in CSharp
{
// Instantiate a license to avoid watermark in output PDF
Aspose.Pdf.License licForPdf= new Aspose.Pdf.License();
licForPdf.SetLicense("Aspose.Pdf.lic");
// Create an empty PDF document
Document newPDFFile = new Document();
// Add an empty page in the newly created PDF
Page page = newPDFFile.Pages.Add();
// Add sample text in the PDF file
for(int iTxtCounter = 0 ; iTxtCounter < 15; iTxtCounter++)
page.Paragraphs.Add(new Aspose.Pdf.Text.TextFragment($"my_data\nanother data"));
// Save the newly created PDF file containing the test data in it
newPDFFile.Save("InputPDFToReplaceText.pdf");
// Open PDF document to replace text in it
Document inputPDFFile = new Document("InputPDFToReplaceText.pdf");
// Set the text that is to be searched in the TextAbsorber object
TextFragmentAbsorber txtAbsorber = new TextFragmentAbsorber("my_data");
// Apply the text absorber for all the pages in the input PDF file
inputPDFFile.Pages.Accept(txtAbsorber);
// Get the collection of fragments containing extracted text from the PDF
TextFragmentCollection textFragmentCollection = txtAbsorber.TextFragments;
// Parse all the fragments and replace text using particular font, size and foreground/background color
foreach (TextFragment txtFragment in textFragmentCollection)
txtFragment.Text = "MY_DATA";
// Save resulting PDF document.
inputPDFFile.Save("OutputPDFAfterReplacingText.pdf");
System.Console.WriteLine("Done");
}
}
}

Ovaj kôd koristi TextFragmentAbsorber i TextFragment za pronalaženje i zamjenu teksta u PDF-u koristeći C#. Ne samo da možete zamijeniti tekst, već i promijeniti njegovu obitelj fontova, veličinu, boju prednjeg plana i boju pozadine u rezultirajućoj PDF datoteci. Dostupne su i opcije za zamjenu teksta u cijelom PDF-u odjednom ili za zamjenu teksta na temelju regularnog izraza.

U ovoj smo temi naučili pronaći i zamijeniti tekst u PDF-u, međutim, ako želite naučiti dijeliti PDF datoteke po stranicama, pogledajte članak na kako podijeliti PDF datoteku po stranicama u C#.

 Hrvatski