Ovaj brzi vodič opisuje kako pronaći i zamijeniti tekst u PDF-u pomoću C# uz pomoć detaljnih koraka i koda koji se može izvoditi. Pomaže u konfiguriranju okruženja, a zatim pruža postupak korak po korak za zamjenu teksta u PDF-u pomoću C#. Nakon što se datoteka ažurira, možete je spremiti natrag na disk u izvornom formatu, tj. PDF ili kao DOCX, Excel, HTML, itd. da spomenemo samo neke.
Koraci za pronalaženje i zamjenu teksta u PDF-u pomoću C#
- Konfigurirajte projekt za korištenje Aspose.PDF for .NET pomoću upravitelja paketa NuGet
- Stvorite ili učitajte PDF datoteku koja sadrži ogledni tekst pomoću objekta klase Document
- Koristeći objekt klase TextFragmentAbsorber, postavite tekst koji će se pretraživati
- Za sve stranice u ulaznoj PDF datoteci prihvatite apsorber teksta
- Dobijte zbirku fragmenata u kojima je tekst izdvojen iz učitane PDF datoteke
- Raščlanite sve fragmente i postavite novi tekst
- Spremite ažuriranu PDF datoteku
Ovi koraci opisuju kako u PDF-u pretraživati i zamijeniti tekst pomoću C#. Stvorena je nova datoteka s uzorkom teksta, ali možete učitati postojeću PDF datoteku čiji tekst treba zamijeniti. Postoji niz dostupnih opcija za pretraživanje teksta u PDF-u kao što je ignoriranje teksta u sjeni, ograničavanje pretraživanja na stranice uvezane itd.
Kod za zamjenu teksta u PDF-u pomoću C#
using Aspose.Pdf; | |
using Aspose.Pdf.Text; | |
namespace FindAndReplaceTextInPdfUsingCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) // Main function to create 7z archive in CSharp | |
{ | |
// Instantiate a license to avoid watermark in output PDF | |
Aspose.Pdf.License licForPdf= new Aspose.Pdf.License(); | |
licForPdf.SetLicense("Aspose.Pdf.lic"); | |
// Create an empty PDF document | |
Document newPDFFile = new Document(); | |
// Add an empty page in the newly created PDF | |
Page page = newPDFFile.Pages.Add(); | |
// Add sample text in the PDF file | |
for(int iTxtCounter = 0 ; iTxtCounter < 15; iTxtCounter++) | |
page.Paragraphs.Add(new Aspose.Pdf.Text.TextFragment($"my_data\nanother data")); | |
// Save the newly created PDF file containing the test data in it | |
newPDFFile.Save("InputPDFToReplaceText.pdf"); | |
// Open PDF document to replace text in it | |
Document inputPDFFile = new Document("InputPDFToReplaceText.pdf"); | |
// Set the text that is to be searched in the TextAbsorber object | |
TextFragmentAbsorber txtAbsorber = new TextFragmentAbsorber("my_data"); | |
// Apply the text absorber for all the pages in the input PDF file | |
inputPDFFile.Pages.Accept(txtAbsorber); | |
// Get the collection of fragments containing extracted text from the PDF | |
TextFragmentCollection textFragmentCollection = txtAbsorber.TextFragments; | |
// Parse all the fragments and replace text using particular font, size and foreground/background color | |
foreach (TextFragment txtFragment in textFragmentCollection) | |
txtFragment.Text = "MY_DATA"; | |
// Save resulting PDF document. | |
inputPDFFile.Save("OutputPDFAfterReplacingText.pdf"); | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
Ovaj kôd koristi TextFragmentAbsorber i TextFragment za pronalaženje i zamjenu teksta u PDF-u koristeći C#. Ne samo da možete zamijeniti tekst, već i promijeniti njegovu obitelj fontova, veličinu, boju prednjeg plana i boju pozadine u rezultirajućoj PDF datoteci. Dostupne su i opcije za zamjenu teksta u cijelom PDF-u odjednom ili za zamjenu teksta na temelju regularnog izraza.
U ovoj smo temi naučili pronaći i zamijeniti tekst u PDF-u, međutim, ako želite naučiti dijeliti PDF datoteke po stranicama, pogledajte članak na kako podijeliti PDF datoteku po stranicama u C#.