Πώς να βρείτε και να αντικαταστήσετε κείμενο σε PDF χρησιμοποιώντας C#

Αυτός ο γρήγορος οδηγός περιγράφει πώς μπορείτε να βρείτε και να αντικαταστήσετε κείμενο σε PDF χρησιμοποιώντας C# με τη βοήθεια λεπτομερών βημάτων και έναν κώδικα με δυνατότητα εκτέλεσης. Βοηθά στη διαμόρφωση του περιβάλλοντος και στη συνέχεια παρέχει μια διαδικασία βήμα προς βήμα αντικατάστασης κειμένου σε PDF χρησιμοποιώντας C#. Μόλις ενημερωθεί το αρχείο, μπορείτε να το αποθηκεύσετε ξανά στον δίσκο στην αρχική μορφή, π.χ. PDF ή ως DOCX, Excel, HTML κ.λπ. για να αναφέρουμε μερικά.

Βήματα για την εύρεση και αντικατάσταση κειμένου σε PDF χρησιμοποιώντας C#

  1. Διαμορφώστε το έργο ώστε να χρησιμοποιεί το Aspose.PDF for .NET χρησιμοποιώντας τη διαχείριση πακέτων NuGet
  2. Δημιουργήστε ή φορτώστε ένα αρχείο PDF που περιέχει δείγμα κειμένου χρησιμοποιώντας το αντικείμενο κλάσης Document
  3. Χρησιμοποιώντας το αντικείμενο κλάσης TextFragmentAbsorber, ορίστε το κείμενο προς αναζήτηση
  4. Για όλες τις σελίδες του αρχείου εισόδου PDF, αποδεχτείτε τον απορροφητή κειμένου
  5. Αποκτήστε τη συλλογή των θραυσμάτων όπου εξάγεται κείμενο από το φορτωμένο αρχείο PDF
  6. Αναλύστε όλα τα τμήματα και ορίστε νέο κείμενο
  7. Αποθηκεύστε το ενημερωμένο αρχείο PDF

Αυτά τα βήματα περιγράφουν πώς σε ένα PDF αναζητάτε και αντικαθιστάτε κείμενο χρησιμοποιώντας C#. Δημιουργείται ένα νέο αρχείο με κάποιο δείγμα κειμένου, ωστόσο μπορείτε να φορτώσετε ένα υπάρχον αρχείο PDF του οποίου το κείμενο πρόκειται να αντικατασταθεί. Υπάρχει μια ποικιλία διαθέσιμων επιλογών για αναζήτηση κειμένου στο PDF, όπως η παράβλεψη σκιώδους κειμένου, ο περιορισμός της αναζήτησης σε δεσμευμένη σελίδα κ.λπ.

Κώδικας για αντικατάσταση κειμένου σε PDF χρησιμοποιώντας C#

using Aspose.Pdf;
using Aspose.Pdf.Text;
namespace FindAndReplaceTextInPdfUsingCSharp
{
class Program
{
static void Main(string[] args) // Main function to create 7z archive in CSharp
{
// Instantiate a license to avoid watermark in output PDF
Aspose.Pdf.License licForPdf= new Aspose.Pdf.License();
licForPdf.SetLicense("Aspose.Pdf.lic");
// Create an empty PDF document
Document newPDFFile = new Document();
// Add an empty page in the newly created PDF
Page page = newPDFFile.Pages.Add();
// Add sample text in the PDF file
for(int iTxtCounter = 0 ; iTxtCounter < 15; iTxtCounter++)
page.Paragraphs.Add(new Aspose.Pdf.Text.TextFragment($"my_data\nanother data"));
// Save the newly created PDF file containing the test data in it
newPDFFile.Save("InputPDFToReplaceText.pdf");
// Open PDF document to replace text in it
Document inputPDFFile = new Document("InputPDFToReplaceText.pdf");
// Set the text that is to be searched in the TextAbsorber object
TextFragmentAbsorber txtAbsorber = new TextFragmentAbsorber("my_data");
// Apply the text absorber for all the pages in the input PDF file
inputPDFFile.Pages.Accept(txtAbsorber);
// Get the collection of fragments containing extracted text from the PDF
TextFragmentCollection textFragmentCollection = txtAbsorber.TextFragments;
// Parse all the fragments and replace text using particular font, size and foreground/background color
foreach (TextFragment txtFragment in textFragmentCollection)
txtFragment.Text = "MY_DATA";
// Save resulting PDF document.
inputPDFFile.Save("OutputPDFAfterReplacingText.pdf");
System.Console.WriteLine("Done");
}
}
}

Αυτός ο κώδικας χρησιμοποιεί TextFragmentAbsorber και TextFragment για κείμενο για εύρεση και αντικατάσταση σε PDF χρησιμοποιώντας C#. Μπορείτε όχι μόνο να αντικαταστήσετε το κείμενο, αλλά και να αλλάξετε την οικογένεια γραμματοσειράς, το μέγεθος, το χρώμα του προσκηνίου και το χρώμα του φόντου στο αρχείο PDF που προκύπτει. Είναι επίσης διαθέσιμες επιλογές για αντικατάσταση κειμένου σε ολόκληρο το PDF ταυτόχρονα ή αντικατάσταση κειμένου με βάση την κανονική έκφραση.

Σε αυτό το θέμα μάθαμε να βρίσκουμε και να αντικαθιστούμε κείμενο σε PDF, ωστόσο, εάν θέλετε να μάθετε να χωρίζετε αρχεία PDF ανά σελίδες, ανατρέξτε στο άρθρο στο πώς να χωρίσετε το αρχείο PDF ανά σελίδες σε C#.

 Ελληνικά