Išgauti tekstą iš PowerPoint naudojant Python

Ši trumpa vadovas aprašo, kaip išgauti tekstą iš PowerPoint naudojant Python. Joje pateikiama informacija, kaip nustatyti IDE, žingsnių sąrašas ir pavyzdinis kodas, skirtas konvertuoti PowerPoint į tekstą naudojant Python. Bus aptariami įvairūs metodai, kaip išgauti tekstą iš skaidrių.

Žingsniai, kaip išgauti tekstą iš PPTX naudojant Python

  1. Nustatykite IDE naudoti Aspose.Slides for Python via .NET, kad išgautumėte tekstą
  2. Importuokite norimas klases iš bibliotekos ir SlideUtil pagalbinę klasę.
  3. Nustatykite įvesties/išvesties failų kelius ir įkelkite licenciją
  4. Įkelkite šaltinio PowerPoint pristatymą į Presentation objektą
  5. Naudokite SlideUtil.get_all_text_frames visų teksto rėmelių išgavimui iš kiekvienos skaidrės
  6. Peržiūrėkite visus teksto kadrus ir jų pastraipas, kad surinktumėte atskiras teksto dalis
  7. Apdorokite kiekvieną kadrą ir pridėkite skaidrių turinį naujoje eilutėje
  8. Išsaugokite visus surinktus teksto fragmentus ir išsaugokite išvestį į TXT failą

Šie žingsniai paaiškina procesą, kaip sukurti PPTX į teksto konvertorių naudojant Python. Įkelkite prezentaciją, gaukite visus teksto rėmus, išanalizuokite kiekvieną pastraipą visuose rėmuose ir išgaukite tekstą iš jų dalių. Išsaugokite visus surinktus duomenis teksto faile, naudodami eilutės skirtuką kiekvienam teksto segmentui.

PowerPoint į tekstą konvertavimo įrankio kodas naudojant Python

Šis kodas rodo, kaip konvertuoti PPTX į TXT naudojant Python. Vietoj to, kad vienu metu nuskenuotumėte visą pristatymą, galite prieiti prie kiekvienos skaidrės atskirai ir apdoroti ją, kad gautumėte tekstą tik iš pasirinktų skaidrių. Kita galimybė – neįkelti pristatymo į atmintį ir tiesiog naudoti failo kelią, kad išgautumėte jo tekstą su vėliava, kuri ištraukia tekstą išdėstyta tokia pat tvarka kaip originalas, arba plokščioje tvarkoje.

Ši trumpa straipsnis supažindina su teksto ištraukimu iš PPTX. Norėdami konvertuoti pristatymą į vaizdo įrašą, žiūrėkite į straipsnį Konvertuoti PowerPoint į vaizdo įrašą naudojant Python.

 Latviski