이 짧은 가이드는 C#을 사용하여 PowerPoint에서 텍스트를 추출하는 방법을 설명합니다. IDE 설정 방법, 단계 목록, 그리고 PowerPoint을 텍스트 변환기로 개발하기 위한 샘플 코드가 포함되어 있습니다. 프레젠테이션/슬라이드의 다양한 콘텐츠에 접근하여 텍스트를 가져오는 방법을 배울 수 있습니다.
C#를 사용하여 PowerPoint를 텍스트로 변환하는 단계
- 환경을 설정하여 Aspose.Slides for .NET을 사용해 PPTX를 TXT로 변환합니다.
- 정의된 입력 파일 경로를 사용하여 Presentation 클래스를 이용해 PPTX 파일을 메모리로 엽니다.
- 모든 슬라이드에서 모든 텍스트 프레임을 추출하기 위해 SlideUtil.GetAllTextFrames() 메서드를 호출합니다.
- 마스터 및 레이아웃 슬라이드에서 텍스트 프레임을 추출하도록 플래그를 설정합니다, 또한
- 추출된 텍스트 내용을 보관하기 위한 StringBuilder 객체 선언
- 각 텍스트 프레임을 구문 분석하고 해당 단락에 접근합니다
- 각 단락을 순회하면서 텍스트 부분을 새 줄에 StringBuilder에 추가합니다.
- 디스크에 TXT 파일로 최종 누적 텍스트를 기록합니다
이 단계들은 C#를 사용한 PPTX 텍스트 변환기의 개발을 설명합니다. 프레젠테이션을 로드하고, 모든 텍스트 프레임의 컬렉션을 가져온 다음, StringBuilder 객체를 생성하고 컬렉션의 각 프레임을 반복합니다. 각 프레임에 대해 단락 컬렉션에 접근하고, 각 단락에서 부분 컬렉션을 가져와 해당 부분의 텍스트를 추출한 뒤 StringBuilder 객체에 추가합니다.
C#를 사용하여 PPTX를 TXT로 변환하는 코드
이 코드는 C#를 사용하여 PPTX에서 텍스트를 추출하는 방법을 보여줍니다. PresentationFactory.Instance.GetPresentationText(inputPath, TextExtractionArrangingMode) 메서드.Unarranged) 메서드는 각 슬라이드의 내용을 UTF-8 인코딩된 출력 파일에 기록합니다. 각 슬라이드마다 본문 텍스트, 발표자 노트, 마스터 슬라이드 텍스트, 레이아웃 텍스트를 포함한 네 가지 텍스트 구성 요소가 기록됩니다.
이 문서는 프레젠테이션에서 모든 텍스트를 추출하는 방법을 알려주었습니다. PowerPoint를 MP4 비디오로 변환하려면, 기사 Convert PowerPoint to Video using C#를 참조하십시오.