Extrair Texto de PowerPoint usando Python

Este breve guia descreve como extrair texto de PowerPoint usando Python. Ele contém detalhes para configurar o IDE, uma lista de etapas e um código de exemplo para converter PowerPoint em texto usando Python. Várias técnicas serão discutidas para buscar texto dos slides.

Etapas para extrair texto de PPTX usando Python

  1. Configure o IDE para usar Aspose.Slides for Python via .NET para extrair texto
  2. Importe as classes desejadas da biblioteca e a classe utilitária SlideUtil
  3. Defina os caminhos dos arquivos de entrada/saída e carregue a licença
  4. Carregue a apresentação PowerPoint de origem no objeto Presentation
  5. Use o SlideUtil.get_all_text_frames para extrair todos os quadros de texto de cada slide
  6. Percorra todos os quadros de texto e seus parágrafos para coletar porções individuais de texto
  7. Processar cada quadro e acrescentar o conteúdo dos slides em uma nova linha
  8. Salve todas as porções de texto coletadas e salve a saída em um arquivo TXT

Esses passos explicam o processo para desenvolver um conversor de PPTX para texto usando Python. Carregue a apresentação, obtenha todos os quadros de texto dela, analise cada parágrafo em todos os quadros e recupere o texto das porções neles. Guarde todos os dados recolhidos num ficheiro de texto com uma quebra de linha para cada segmento de texto.

Código para Conversor de PowerPoint para Texto usando Python

Este código mostra como converter PPTX para TXT usando Python. Em vez de escanear toda a apresentação de uma vez, você pode acessar cada slide separadamente e processá‑lo para buscar texto apenas dos slides selecionados. Outra opção é não carregar a apresentação na memória e apenas usar o caminho do arquivo para extrair seu texto com uma flag para puxar o texto na ordem organizada, como original ou em ordem plana.

Este breve artigo orienta sobre a extração de texto de um PPTX. Para converter uma apresentação em vídeo, consulte o artigo Converter PowerPoint em vídeo usando Python.

 Português