Ovaj kratki vodič opisuje kako izvući tekst iz PowerPoint pomoću Pythona. Sadrži detalje o postavljanju IDE‑a, popis koraka i uzorak koda za pretvaranje PowerPoint prezentacije u tekst pomoću Pythona. Razgovarat će se o raznim tehnikama za dohvaćanje teksta sa slajdova.
Koraci za izdvajanje teksta iz PPTX pomoću Pythona
- Postavite IDE da koristi Aspose.Slides for Python via .NET za izdvajanje teksta
- Uvezite željene klase iz biblioteke i pomoćnu klasu SlideUtil
- Definirajte putanje ulaznih/izlaznih datoteka i učitajte licencu
- Učitaj izvorni PowerPoint prezentaciju u objekt Presentation
- Koristite SlideUtil.get_all_text_frames za izdvajanje svih tekstualnih okvira sa svakog slajda
- Prođite kroz sve tekstualne okvire i njihove odlomke kako biste prikupili pojedinačne dijelove teksta
- Obradi svaki okvir i dodaj sadržaj slajda u novi redak
- Spremi sve prikupljene tekstualne dijelove i spremi izlaz u TXT datoteku
Ovi koraci objašnjavaju proces izrade pretvarača PPTX u tekst koristeći Python. Učitajte prezentaciju, dohvatite sve tekstualne okvire iz nje, parsirajte svaki odlomak u svim okvirima i preuzmite tekst iz njihovih dijelova. Spremite sve prikupljene podatke u tekstualnu datoteku s razdjelnim znakom za svaki tekstualni segment.
Kod za pretvarač PowerPoint u tekst koristeći Python
Ovaj kod pokazuje kako pretvoriti PPTX u TXT pomoću Pythona. Umjesto da skenirate cijelu prezentaciju odjednom, možete pristupiti svakom slajdu zasebno i obraditi ga kako biste dohvatili tekst samo s odabranih slajdova. Druga opcija je da ne učitavate prezentaciju u memoriju i jednostavno koristite putanju datoteke za izdvajanje njenog teksta s oznakom za povlačenje teksta u uređenom redoslijedu, kao originalni ili u ravnom redoslijedu.
Ovaj kratki članak vodi kroz izdvajanje teksta iz PPTX‑a. Za pretvaranje prezentacije u video, pogledajte članak Pretvorite PowerPoint u video koristeći Python.