सी # का उपयोग करके पीडीएफ में टेक्स्ट कैसे ढूंढें और बदलें

यह त्वरित मार्गदर्शिका विस्तृत चरणों और एक रन करने योग्य कोड की सहायता से सी# का उपयोग करके पीडीएफ में टेक्स्ट को खोजने और बदलने का तरीका बताती है। यह पर्यावरण को कॉन्फ़िगर करने में सहायता करता है और फिर सी#** का उपयोग करके **पीडीएफ में टेक्स्ट को बदलने के लिए चरण-दर-चरण प्रक्रिया प्रदान करता है। एक बार फ़ाइल अपडेट हो जाने के बाद, आप इसे डिस्क पर मूल स्वरूप में वापस सहेज सकते हैं जैसे PDF या DOCX, एक्सेल, HTML, आदि के रूप में कुछ नाम रखने के लिए।

सी#का उपयोग करके पीडीएफ में टेक्स्ट खोजने और बदलने के चरण

  1. NuGet पैकेज मैनेजर का उपयोग करके Aspose.PDF for .NET का उपयोग करने के लिए प्रोजेक्ट को कॉन्फ़िगर करें
  2. Document क्लास ऑब्जेक्ट . का उपयोग करके नमूना टेक्स्ट वाली PDF फ़ाइल बनाएं या लोड करें
  3. TextFragmentAbsorber क्लास ऑब्जेक्ट का उपयोग करके, खोजे जाने वाले टेक्स्ट को सेट करें
  4. इनपुट पीडीएफ फाइल के सभी पेजों के लिए, टेक्स्ट एब्जॉर्बर को स्वीकार करें
  5. उन अंशों का संग्रह प्राप्त करें जहां लोड की गई पीडीएफ फाइल से टेक्स्ट निकाला जाता है
  6. सभी अंशों को पार्स करें और नया टेक्स्ट सेट करें
  7. अपडेट की गई पीडीएफ फाइल को सेव करें

ये चरण वर्णन करते हैं कि कैसे PDF में C# का उपयोग करके टेक्स्ट को खोजें और बदलें। कुछ नमूना पाठ के साथ एक नई फ़ाइल बनाई जाती है, हालांकि आप एक मौजूदा पीडीएफ फाइल लोड कर सकते हैं जिसका पाठ प्रतिस्थापित किया जाना है। पीडीएफ में टेक्स्ट सर्च करने के लिए कई तरह के विकल्प उपलब्ध हैं जैसे शैडो टेक्स्ट को नजरअंदाज करना, सर्च को पेज बाउंड तक सीमित करना आदि।

सी # का उपयोग कर पीडीएफ में टेक्स्ट को बदलने के लिए कोड

using Aspose.Pdf;
using Aspose.Pdf.Text;
namespace FindAndReplaceTextInPdfUsingCSharp
{
class Program
{
static void Main(string[] args) // Main function to create 7z archive in CSharp
{
// Instantiate a license to avoid watermark in output PDF
Aspose.Pdf.License licForPdf= new Aspose.Pdf.License();
licForPdf.SetLicense("Aspose.Pdf.lic");
// Create an empty PDF document
Document newPDFFile = new Document();
// Add an empty page in the newly created PDF
Page page = newPDFFile.Pages.Add();
// Add sample text in the PDF file
for(int iTxtCounter = 0 ; iTxtCounter < 15; iTxtCounter++)
page.Paragraphs.Add(new Aspose.Pdf.Text.TextFragment($"my_data\nanother data"));
// Save the newly created PDF file containing the test data in it
newPDFFile.Save("InputPDFToReplaceText.pdf");
// Open PDF document to replace text in it
Document inputPDFFile = new Document("InputPDFToReplaceText.pdf");
// Set the text that is to be searched in the TextAbsorber object
TextFragmentAbsorber txtAbsorber = new TextFragmentAbsorber("my_data");
// Apply the text absorber for all the pages in the input PDF file
inputPDFFile.Pages.Accept(txtAbsorber);
// Get the collection of fragments containing extracted text from the PDF
TextFragmentCollection textFragmentCollection = txtAbsorber.TextFragments;
// Parse all the fragments and replace text using particular font, size and foreground/background color
foreach (TextFragment txtFragment in textFragmentCollection)
txtFragment.Text = "MY_DATA";
// Save resulting PDF document.
inputPDFFile.Save("OutputPDFAfterReplacingText.pdf");
System.Console.WriteLine("Done");
}
}
}

यह कोड टेक्स्ट के लिए TextFragmentAbsorber और TextFragment का उपयोग करता है ताकि C#* का उपयोग करके PDF में *ढूंढें और बदलें। आप न केवल टेक्स्ट को बदल सकते हैं बल्कि परिणामी पीडीएफ फाइल में इसके फ़ॉन्ट परिवार, आकार, अग्रभूमि रंग और पृष्ठभूमि रंग भी बदल सकते हैं। संपूर्ण PDF में टेक्स्ट को एक बार में बदलने या रेगुलर एक्सप्रेशन के आधार पर टेक्स्ट को बदलने के विकल्प भी उपलब्ध हैं।

इस विषय में हमने पीडीएफ में टेक्स्ट ढूंढना और बदलना सीखा है, हालांकि, अगर आप पीडीएफ फाइलों को पेजों से विभाजित करना सीखना चाहते हैं, तो सी # में पृष्ठों द्वारा पीडीएफ फाइल को कैसे विभाजित करें पर लेख देखें।

 हिन्दी