Ovaj kratki vodič opisuje kako izvući tekst iz PowerPointa koristeći C#. Sadrži detalje za postavljanje IDE-a, popis koraka i uzorak koda za razvoj PowerPoint u pretvarač teksta koristeći C#. Naučit ćete pristupiti različitim sadržajima u prezentaciji/slajdovima kako biste dohvatili tekst iz njih.
Koraci za pretvaranje PowerPointa u tekst pomoću C#
- Postavite okruženje da koristi Aspose.Slides for .NET za pretvaranje PPTX u TXT
- Otvorite PPTX datoteku u memoriju koristeći klasu Presentation, koristeći definiranu putanju ulazne datoteke
- Pozovite metodu SlideUtil.GetAllTextFrames() za izdvajanje svih tekstualnih okvira sa svakog slajda
- Postavite zastavicu za izdvajanje tekstualnih okvira iz master i rasporednih slajdova, također.
- Deklarirajte StringBuilder objekt za pohranu izvučenog teksta
- Parsiraj svaki tekstualni okvir i pristupi njegovim odlomcima
- Prođite kroz svaki odlomak i dodajte njegove tekstualne dijelove u nove redove u StringBuilderu
- Zapišite konačni akumulirani tekst u TXT datoteku na disku
Ovi koraci objašnjavaju razvoj pretvarača PPTX u tekst koristeći C#. Učitajte prezentaciju, dohvatite kolekciju svih tekstualnih okvira, stvorite objekt StringBuilder i iterirajte kroz svaki okvir u kolekciji. Za svaki okvir pristupite kolekciji odlomaka, u svakom odlomku dohvatite kolekciju dijelova, preuzmite tekst iz dijela i dodajte ga u objekt StringBuilder.
Kod za pretvaranje PPTX u TXT pomoću C#
Ovaj kod demonstrira kako izvući tekst iz PPTX koristeći C#. Postoji još jedan brz način za dohvaćanje teksta iz cijele prezentacije koristeći PresentationFactory.Instance. Metoda GetPresentationText(inputPath, TextExtractionArrangingMode.Neuređeno) zapisuje sadržaj svakog slajda u UTF‑8 kodiranu izlaznu datoteku. Za svaki slajd bit će zapisane četiri tekstualne komponente, uključujući glavni tekst tijela, bilješke govornika, tekst master slajda i tekst rasporeda.
Ovaj članak nas je naučio kako izvući sav tekst iz prezentacije. Za pretvaranje PowerPointa u MP4 video, pogledajte članak Pretvaranje PowerPointa u video pomoću C#.