Ez a gyors oktatóanyag végigvezeti Önt, hogyan húzhat ki szöveget az Adobe PDF programban Python használatával. Megosztja a környezet létrehozásához szükséges összes lépést és a követendő lépések listáját, valamint a futtatható mintakódot, amely bemutatja, hogyan kell törölni az Adobe Acrobatban Python használatával. Megtanulhatja az alkalmazás fejlesztésének folyamatát a semmiből, néhány API-hívás segítségével, valamint az összes lépés leírását.
Az Adobe PDF szövegének áthúzásának lépései Python használatával
- Állítsa az IDE-t használja az Aspose.PDF-et Pythonhoz .NET-en keresztül értékre a szöveg kihúzásához
- A Document osztályobjektum segítségével töltse be a forrás PDF-fájlt, ahol néhány szöveget ki kell húzni
- Határozza meg a keresőszót a PDF-ben a TextFragmentAbsorber osztályobjektum segítségével
- Futtassa a visit() metódust a céloldalon a célszó példányainak kereséséhez
- Hozzon létre egy StrikeOutAnnotation objektumot a keresett szó első példányának téglalap alakú területével
- Állítsa be az áthúzott kommentár színét és címét, mielőtt hozzáadná az oldal kommentárgyűjteményéhez
- Mentse az eredményül kapott PDF-fájlt a kívánt szó első előfordulásakor áthúzással
Ezek a lépések meghatározzák a szöveg kihúzásának folyamatát a PDF-ben Python használatával. Ehhez be kell tölteni a cél PDF-fájlt, majd meg kell keresni a kívánt szó előfordulásait, amelyeket ki kell törölni egy adott oldalon. A keresés befejezése után az első előfordulás téglalap alakú területét a rendszer egy StrikeOutAnnotation objektum létrehozására használja, amely ténylegesen áthúzott vonalat hoz létre a kívánt színű szövegen, és szükség esetén a címben.
Kód a szöveg áthúzásához a PDF-ben Python használatával
import aspose.pdf as pdf | |
# Load License | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Load the PDF file | |
pdfDocument = pdf.Document("SamplePdfFile.pdf") | |
# Define search word in TextFragmentAbsorber object | |
tfa = pdf.text.TextFragmentAbsorber("Signature") | |
# Search all occurrences of the word | |
tfa.visit(pdfDocument.pages[1]) | |
# Instantiate a StrikeOutAnnotation object and set its properties | |
strikeOutAnnotation = pdf.annotations.StrikeOutAnnotation(pdfDocument.pages[1],tfa.text_fragments[1].rectangle) | |
strikeOutAnnotation.title = "KB Aspose user" | |
strikeOutAnnotation.color = pdf.Color.red | |
# Add strike out annotation to the page | |
pdfDocument.pages[1].annotations.add(strikeOutAnnotation, True) | |
# Save the PDF | |
pdfDocument.save("PdfWithStrikeText.pdf") | |
print("PDF text strike operation completed successfully") |
Ez a mintakódrészlet felhasználható egy teljes alkalmazás alapjául, amely az Adobe Acrobatban Python használatával törölhető. A TextFragmentAbsorber osztály használatával kereshet a célszóban egy adott oldalon, hogy megkapja a szó összes előfordulásának listáját. A következő lépésben létre kell hoznia egy StrikeOutAnnotation objektumot a célelőfordulás téglalap alakú területén, hogy a vonal a befoglaló téglalapon belül jelenjen meg.
Ez a rövid útmutató megtanított bennünket arra, hogy a PDF-oldalon egy vagy több szónál áthúzott vonalakat jelenítsünk meg. Ha meg szeretné ismerni a táblázat PDF-be történő beszúrásának folyamatát, tekintse meg a hogyan lehet táblázatot beszúrni PDF-be Python segítségével című cikket.