이 짧은 가이드는 Python을 사용하여 PowerPoint에서 텍스트를 추출하는 방법을 설명합니다. IDE 설정에 대한 세부 정보, 단계 목록 및 Python을 사용하여 PowerPoint를 텍스트로 변환하는 샘플 코드가 포함되어 있습니다. 슬라이드에서 텍스트를 가져오는 다양한 기술이 논의될 것입니다.
Python을 사용하여 PPTX에서 텍스트 추출 단계
- IDE를 Aspose.Slides for Python via .NET을 사용하도록 설정하여 텍스트를 추출합니다.
- 라이브러리와 SlideUtil 유틸리티 클래스에서 원하는 클래스를 가져옵니다.
- 입력/출력 파일 경로를 정의하고 라이선스를 로드합니다.
- 소스 PowerPoint 프레젠테이션을 Presentation 객체에 로드합니다.
- 모든 슬라이드에서 모든 텍스트 프레임을 추출하기 위해 SlideUtil.get_all_text_frames를 사용하십시오.
- 모든 텍스트 프레임과 해당 단락을 파싱하여 개별 텍스트 부분을 수집합니다
- 각 프레임을 처리하고 슬라이드 내용을 새 줄에 추가합니다
- 수집된 모든 텍스트 부분을 저장하고 출력물을 TXT 파일에 저장합니다.
이 단계들은 Python을 사용한 PPTX 텍스트 변환기 개발 과정을 설명합니다. 프레젠테이션을 로드하고, 모든 텍스트 프레임을 가져온 뒤, 각 프레임의 모든 단락을 파싱하고, 그 안의 부분 텍스트를 추출합니다. 수집된 모든 데이터를 각 텍스트 구간마다 줄 구분자를 넣은 텍스트 파일에 저장합니다.
Python을 사용한 PowerPoint 텍스트 변환기 코드
이 코드는 Python을 사용하여 PPTX를 TXT로 변환하는 방법을 보여줍니다. 전체 프레젠테이션을 한 번에 스캔하는 대신, 각 슬라이드에 개별적으로 접근하여 선택된 슬라이드에서만 텍스트를 가져오도록 처리할 수 있습니다. 또 다른 옵션은 프레젠테이션을 메모리에 로드하지 않고 파일 경로만 사용하여 텍스트를 추출하는 것으로, 플래그를 사용해 원본 순서대로 또는 평면 순서대로 텍스트를 가져올 수 있습니다.
이 짧은 기사에서는 PPTX에서 텍스트를 추출하는 방법을 안내합니다. 프레젠테이션을 비디오로 변환하려면, 기사 파이썬을 사용하여 PowerPoint를 비디오로 변환를 참조하세요.