Este breve tutorial explica cómo extraer texto de PowerPoint usando Java. Compartirá detalles para configurar el IDE, una lista de pasos y un código de ejemplo para desarrollar un convertidor de PowerPoint a texto usando Java. Se discutirán varias opciones para extraer texto de la presentación.
Pasos para extraer todo el texto de PowerPoint usando Java
- Configura el entorno para usar Aspose.Slides for Java para convertir PPTX a TXT
- Importa las dependencias para el análisis de diapositivas y la salida de archivos
- Cargue el archivo PPTX fuente en memoria mediante la clase Presentation
- Recupera todos los marcos de texto para recopilar cada contenedor de texto de todos los slides
- Analiza todos los párrafos y fragmentos de los marcos, y agrega texto al objeto StringBuilder
- Guarda el archivo de salida como un archivo TXT
Los pasos mencionados anteriormente resumen el proceso para extraer texto de PPTX usando Java. Cargue la presentación, acceda a todos los marcos de texto, cree un objeto StringBuilder y recorra todos los marcos para obtener los párrafos. De cada párrafo, obtenga las porciones, extraiga el texto de cada porción y añádalo a la instancia de StringBuilder, y finalmente guarde el texto acumulado en un archivo TXT.
Código para convertir PPTX a TXT usando Java
Este código demuestra cómo convertir PowerPoint a texto usando Java. Puedes extraer texto diapositiva por diapositiva usando el método SlideUtil.getAllTextBoxes() que toma una diapositiva como entrada y extrae notas del presentador usando el método slide.getNotesSlideManager().getNotesSlide() y extraer texto de tablas usando la diapositiva.getShapes() que devuelve la colección de formas y filtra cada forma que sea una instancia de ITable. También se puede generar salida JSON llenando el JsonObject y guardando los datos en un JSONArray.
Este artículo explica el proceso para convertir PowerPoint a texto. Para convertir una presentación a video, consulte el artículo Convertir PowerPoint a video usando Java.