Šiame trumpame vadove aprašoma, kaip rasti ir pakeisti tekstą PDF formatu naudojant C# naudojant išsamius veiksmus ir paleidžiamą kodą. Tai padeda konfigūruoti aplinką ir pateikia nuoseklų procesą, kaip pakeisti tekstą PDF faile naudojant C#. Kai failas bus atnaujintas, galėsite jį įrašyti atgal į diską pradiniu formatu, ty PDF arba kaip DOCX, Excel, HTML ir kt., kad būtų galima paminėti keletą.
Veiksmai, kaip rasti ir pakeisti tekstą PDF naudojant C#
- Sukonfigūruokite projektą naudoti Aspose.PDF for .NET naudodami NuGet paketų tvarkyklę
- Sukurkite arba įkelkite PDF failą su pavyzdiniu tekstu naudodami Document klasės objektą
- Naudodami TextFragmentAbsorber klasės objektą, nustatykite ieškomą tekstą
- Visiems įvesties PDF failo puslapiams priimkite teksto sugėriklį
- Gaukite fragmentų rinkinį, kuriame tekstas išgaunamas iš įkelto PDF failo
- Išnagrinėkite visus fragmentus ir nustatykite naują tekstą
- Išsaugokite atnaujintą PDF failą
Šie veiksmai aprašo, kaip PDF paieškoje ir teksto pakeitime naudojant C#. Sukuriamas naujas failas su teksto pavyzdžiu, tačiau galite įkelti esamą PDF failą, kurio tekstas turi būti pakeistas. Yra įvairių parinkčių, leidžiančių ieškoti teksto PDF faile, pvz., ignoruoti šešėlinį tekstą, apriboti paiešką iki susieto puslapio ir pan.
Kodas, skirtas pakeisti tekstą PDF naudojant C#
using Aspose.Pdf; | |
using Aspose.Pdf.Text; | |
namespace FindAndReplaceTextInPdfUsingCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) // Main function to create 7z archive in CSharp | |
{ | |
// Instantiate a license to avoid watermark in output PDF | |
Aspose.Pdf.License licForPdf= new Aspose.Pdf.License(); | |
licForPdf.SetLicense("Aspose.Pdf.lic"); | |
// Create an empty PDF document | |
Document newPDFFile = new Document(); | |
// Add an empty page in the newly created PDF | |
Page page = newPDFFile.Pages.Add(); | |
// Add sample text in the PDF file | |
for(int iTxtCounter = 0 ; iTxtCounter < 15; iTxtCounter++) | |
page.Paragraphs.Add(new Aspose.Pdf.Text.TextFragment($"my_data\nanother data")); | |
// Save the newly created PDF file containing the test data in it | |
newPDFFile.Save("InputPDFToReplaceText.pdf"); | |
// Open PDF document to replace text in it | |
Document inputPDFFile = new Document("InputPDFToReplaceText.pdf"); | |
// Set the text that is to be searched in the TextAbsorber object | |
TextFragmentAbsorber txtAbsorber = new TextFragmentAbsorber("my_data"); | |
// Apply the text absorber for all the pages in the input PDF file | |
inputPDFFile.Pages.Accept(txtAbsorber); | |
// Get the collection of fragments containing extracted text from the PDF | |
TextFragmentCollection textFragmentCollection = txtAbsorber.TextFragments; | |
// Parse all the fragments and replace text using particular font, size and foreground/background color | |
foreach (TextFragment txtFragment in textFragmentCollection) | |
txtFragment.Text = "MY_DATA"; | |
// Save resulting PDF document. | |
inputPDFFile.Save("OutputPDFAfterReplacingText.pdf"); | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
Šis kodas naudoja TextFragmentAbsorber ir TextFragment tekstui rasti ir pakeisti PDF naudojant C#. Galite ne tik pakeisti tekstą, bet ir pakeisti jo šriftų šeimą, dydį, priekinio plano spalvą ir fono spalvą gautame PDF faile. Taip pat yra parinkčių, kaip pakeisti tekstą visame PDF faile iš karto arba pakeisti tekstą pagal reguliariąją išraišką.
Šioje temoje išmokome rasti ir pakeisti tekstą PDF formatu, tačiau jei norite išmokti skaidyti PDF failus puslapiais, žr. straipsnį kaip padalinti PDF failą į puslapius C#.