Šioje trumpoje pamokoje pateikiama informacija apie tai, kaip rasti ir pakeisti tekstą PDF formatu naudojant Python. Jame pateikiama informacija apie IDE konfigūravimą, laipsniškas išsamus procesas ir vykdomas pavyzdinis kodas, skirtas rasti ir pakeisti žodį pdf faile naudojant Python. Taip pat sužinosite, kaip ieškoti ir pakeisti tekstą visuose PDF puslapiuose arba konkrečiame puslapyje pagal programos reikalavimus.
Veiksmai, kaip rasti ir pakeisti PDF naudojant Python
- Norėdami pakeisti tekstą, nustatykite aplinką į naudokite Aspose.PDF, skirtą Python per .NET
- Įkelkite tikslinį PDF failą naudodami Document klasės objektą, kuriame reikia ieškoti ir pakeisti duomenų
- Apibrėžkite tekstą, kurio reikia ieškoti, naudodami TextFragmentAbsorber klasės objektą
- Taikykite TextAbsorber visiems PDF puslapiams naudodami Document.pages.accept() metodą
- Gaukite prieigą prie visų ieškomų elementų rinkinio PDF rinkmenoje naudodami ypatybę TextFragmentAbsorber.text_fragments
- Pakartokite visus ieškomus teksto fragmentus ir nustatykite naujas reikšmes pagal savo poreikius
- Išsaugokite atnaujintą PDF failą diske su atnaujintu tekstu
Šie veiksmai apibendrina procesą, kaip * rasti ir pakeisti viską PDF naudojant Python*. Objektas TextFragmentAbsorber deklaruojamas pateikiant eilutę, kurios reikia ieškoti, tada iškviečiamas Document.pages.accept() metodas, kuris išanalizuoja visus PDF puslapius ir surinks teksto fragmentus, kuriuose yra tikslinis žodis. Kai rastų žodžių rinkinys bus paruoštas, dabar galite pakeisti visus arba pasirinktus fragmentus naujais žodžiais pagal savo poreikius.
Kodas, skirtas rasti ir pakeisti tekstą PDF naudojant Python
Šis kodas parodo, kaip įdiegti PDF paieškos funkciją ir pakeisti tekstą naudojant Python. Šiame kode buvo naudojamas metodas Document.pages.accept() ieškant teksto visame PDF faile, tačiau jei norite ieškoti ir pakeisti tekstą tik tam tikrame puslapyje, galite pasirinkti puslapį pateikdami puslapio indeksą rinkinyje Document.pages ir tada iškvieskite Page.accept() metodą. Taip pat galite naudoti TextSearchOptions klasės objektą kaip antrą argumentą, kai sukuriate TextFragmentAbsorber objektą, kad tinkintumėte paieškos operaciją.
Šis straipsnis išmokė mus rasti ir pakeisti tekstą PDF faile. Jei norite sužinoti, kaip rasti ir paryškinti tekstą PDF faile, žr. straipsnį kaip paryškinti PDF naudojant Python.