Szöveg áthúzása az Adobe PDF-ben Python használatával

Ez a gyors oktatóanyag végigvezeti Önt, hogyan húzhat ki szöveget az Adobe PDF programban Python használatával. Megosztja a környezet létrehozásához szükséges összes lépést és a követendő lépések listáját, valamint a futtatható mintakódot, amely bemutatja, hogyan kell törölni az Adobe Acrobatban Python használatával. Megtanulhatja az alkalmazás fejlesztésének folyamatát a semmiből, néhány API-hívás segítségével, valamint az összes lépés leírását.

Az Adobe PDF szövegének áthúzásának lépései Python használatával

  1. Állítsa az IDE-t használja az Aspose.PDF-et Pythonhoz .NET-en keresztül értékre a szöveg kihúzásához
  2. A Document osztályobjektum segítségével töltse be a forrás PDF-fájlt, ahol néhány szöveget ki kell húzni
  3. Határozza meg a keresőszót a PDF-ben a TextFragmentAbsorber osztályobjektum segítségével
  4. Futtassa a visit() metódust a céloldalon a célszó példányainak kereséséhez
  5. Hozzon létre egy StrikeOutAnnotation objektumot a keresett szó első példányának téglalap alakú területével
  6. Állítsa be az áthúzott kommentár színét és címét, mielőtt hozzáadná az oldal kommentárgyűjteményéhez
  7. Mentse az eredményül kapott PDF-fájlt a kívánt szó első előfordulásakor áthúzással

Ezek a lépések meghatározzák a szöveg kihúzásának folyamatát a PDF-ben Python használatával. Ehhez be kell tölteni a cél PDF-fájlt, majd meg kell keresni a kívánt szó előfordulásait, amelyeket ki kell törölni egy adott oldalon. A keresés befejezése után az első előfordulás téglalap alakú területét a rendszer egy StrikeOutAnnotation objektum létrehozására használja, amely ténylegesen áthúzott vonalat hoz létre a kívánt színű szövegen, és szükség esetén a címben.

Kód a szöveg áthúzásához a PDF-ben Python használatával

import aspose.pdf as pdf
# Load License
license = pdf.License()
license.set_license("Aspose.Total.lic")
# Load the PDF file
pdfDocument = pdf.Document("SamplePdfFile.pdf")
# Define search word in TextFragmentAbsorber object
tfa = pdf.text.TextFragmentAbsorber("Signature")
# Search all occurrences of the word
tfa.visit(pdfDocument.pages[1])
# Instantiate a StrikeOutAnnotation object and set its properties
strikeOutAnnotation = pdf.annotations.StrikeOutAnnotation(pdfDocument.pages[1],tfa.text_fragments[1].rectangle)
strikeOutAnnotation.title = "KB Aspose user"
strikeOutAnnotation.color = pdf.Color.red
# Add strike out annotation to the page
pdfDocument.pages[1].annotations.add(strikeOutAnnotation, True)
# Save the PDF
pdfDocument.save("PdfWithStrikeText.pdf")
print("PDF text strike operation completed successfully")

Ez a mintakódrészlet felhasználható egy teljes alkalmazás alapjául, amely az Adobe Acrobatban Python használatával törölhető. A TextFragmentAbsorber osztály használatával kereshet a célszóban egy adott oldalon, hogy megkapja a szó összes előfordulásának listáját. A következő lépésben létre kell hoznia egy StrikeOutAnnotation objektumot a célelőfordulás téglalap alakú területén, hogy a vonal a befoglaló téglalapon belül jelenjen meg.

Ez a rövid útmutató megtanított bennünket arra, hogy a PDF-oldalon egy vagy több szónál áthúzott vonalakat jelenítsünk meg. Ha meg szeretné ismerni a táblázat PDF-be történő beszúrásának folyamatát, tekintse meg a hogyan lehet táblázatot beszúrni PDF-be Python segítségével című cikket.

 Magyar