이 짧은 자습서에서는 환경 구성, 단계 목록 및 실행 가능한 코드에 대한 세부 정보를 통해 C#에서 Word 문서를 읽는 방법을 배웁니다. 코드는 다양한 방법으로 Word 파일을 읽는 방법을 보여줍니다. DOCX, DOC, RTF 또는 HTML 등과 같은 Word 파일을 로드한 다음 처리하거나 볼 다른 요소에 액세스하여 C#이 Word 문서를 읽는 방법을 배웁니다.
C#의 Word 문서에서 데이터를 읽는 단계
- NuGet 패키지 관리자에서 Aspose.Words를 사용하도록 프로젝트 환경 구성
- 입력 DOCX 파일을 Document 클래스 개체에 로드
- 문서에서 Paragraph 유형의 모든 노드 가져오기
- 각 단락을 문자열로 변환하여 콘솔에 표시
- 문서에서 모든 실행 유형 노드 가져오기
- 각 실행 항목을 문자열로 변환하고 글꼴 이름 및 크기와 함께 표시
이 단계는 Word 파일 판독기 프로그램을 작성하는 동안 수행할 작업과 환경을 구성하는 데 필요한 자세한 정보를 제공합니다. 소스 파일을 Document 클래스 인스턴스에 로드한 다음 모든 단락에 액세스하여 텍스트를 표시하여 C#이 DOCX 파일을 읽는 방법을 보여줍니다. 또한 단락, 표 등에서 데이터를 읽는 방법을 설명합니다. 따라서 다른 스타일의 텍스트 세그먼트가 분리되거나 각 표 셀 값이 처리를 위해 별도로 액세스됩니다.
C#에서 Word 파일을 읽는 코드
이 코드는 Paragraph, Run, Section, Body, HeaderFooter, Comment 등과 같은 노드 유형을 가져와야 하는 Document.GetChildNodes() 함수를 사용하여 *C#*에서 Word 파일을 읽는 방법을 보여줍니다. 일단 자식 노드에 액세스하면 , 메서드와 속성을 사용하려면 해당 형식으로 캐스팅해야 합니다. 예를 들어, 우리는 문서를 두 번 읽었는데, 처음에는 일반 단락이나 표 등에 관계없이 전체 문서의 모든 텍스트가 표시되고 두 번째에는 스타일 및 콘텐츠 유형의 변경에 따라 읽습니다.
이 문서에서는 Word 파일을 읽는 방법을 배웠지만 Word 문서를 HTML로 변환하는 방법에 대해 알아보려면 C#을 사용하여 Word 문서를 HTML로 변환하는 방법에 대한 문서를 참조하세요.