Szöveg keresése és cseréje PDF-ben a C# használatával

Ez a gyors útmutató leírja, hogyan kereshet meg és cserélhet szöveget PDF-ben C# használatával, részletes lépések és futtatható kód segítségével. Segíti a környezet konfigurálását, majd lépésenkénti folyamatot biztosít a szöveg cseréjéhez a PDF-ben C# használatával. A fájl frissítése után visszamentheti a lemezre az eredeti formátumban, pl. PDF, vagy DOCX, Excel, HTML stb. formátumban, hogy csak néhányat említsünk.

Szöveg keresésének és cseréjének lépései PDF-ben C# használatával

  1. A NuGet csomagkezelő segítségével állítsa be a projektet a Aspose.PDF for .NET használatára
  2. Hozzon létre vagy töltsön be egy minta szöveget tartalmazó PDF-fájlt a Document osztályobjektum segítségével
  3. A TextFragmentAbsorber osztályobjektum segítségével állítsa be a keresendő szöveget
  4. A bemeneti PDF-fájl összes oldalához fogadja el a szövegelnyelőt
  5. Szerezze be a töredékek gyűjteményét, ahol a szöveg a betöltött PDF-fájlból kinyerhető
  6. Elemezze át az összes töredéket, és állítson be új szöveget
  7. Mentse el a frissített PDF fájlt

Ezek a lépések leírják, hogyan lehet PDF-ben keresni és szöveget C# használatával cserélni. Létrejön egy új fájl minta szöveggel, de betölthet egy meglévő PDF-fájlt, amelynek szövegét le kell cserélni. Számos lehetőség áll rendelkezésre a PDF-ben található szöveges keresésre, például az árnyékszöveg figyelmen kívül hagyása, a keresés korlátozása az oldalra kötöttre stb.

Kód a szöveg cseréjéhez PDF-ben C# használatával

using Aspose.Pdf;
using Aspose.Pdf.Text;
namespace FindAndReplaceTextInPdfUsingCSharp
{
class Program
{
static void Main(string[] args) // Main function to create 7z archive in CSharp
{
// Instantiate a license to avoid watermark in output PDF
Aspose.Pdf.License licForPdf= new Aspose.Pdf.License();
licForPdf.SetLicense("Aspose.Pdf.lic");
// Create an empty PDF document
Document newPDFFile = new Document();
// Add an empty page in the newly created PDF
Page page = newPDFFile.Pages.Add();
// Add sample text in the PDF file
for(int iTxtCounter = 0 ; iTxtCounter < 15; iTxtCounter++)
page.Paragraphs.Add(new Aspose.Pdf.Text.TextFragment($"my_data\nanother data"));
// Save the newly created PDF file containing the test data in it
newPDFFile.Save("InputPDFToReplaceText.pdf");
// Open PDF document to replace text in it
Document inputPDFFile = new Document("InputPDFToReplaceText.pdf");
// Set the text that is to be searched in the TextAbsorber object
TextFragmentAbsorber txtAbsorber = new TextFragmentAbsorber("my_data");
// Apply the text absorber for all the pages in the input PDF file
inputPDFFile.Pages.Accept(txtAbsorber);
// Get the collection of fragments containing extracted text from the PDF
TextFragmentCollection textFragmentCollection = txtAbsorber.TextFragments;
// Parse all the fragments and replace text using particular font, size and foreground/background color
foreach (TextFragment txtFragment in textFragmentCollection)
txtFragment.Text = "MY_DATA";
// Save resulting PDF document.
inputPDFFile.Save("OutputPDFAfterReplacingText.pdf");
System.Console.WriteLine("Done");
}
}
}

Ez a kód a TextFragmentAbsorber-t és a TextFragment-et használja a PDF-ben a C# használatával *keresendő és cserélhető szöveghez. Nemcsak a szöveget cserélheti le, hanem módosíthatja a betűcsaládját, a méretét, az előtér színét és a háttérszínét is a létrejövő PDF-fájlban. Lehetőségek állnak rendelkezésre a teljes PDF-fájl szövegének egyidejű vagy a reguláris kifejezés alapján történő cseréjére is.

Ebben a témakörben megtanultuk, hogyan lehet szöveget találni és cserélni PDF-ben, de ha meg szeretné tanulni a PDF-fájlok oldalakra való felosztását, olvassa el a hogyan lehet a PDF fájlt oldalakra osztani C#-ban című cikket.

 Magyar