이 빠른 자습서는 Python에서 DOCX 파일을 읽는 방법에 대해 안내합니다. 여기에는 환경을 구성하는 데 필요한 전체 정보, 코드를 작성하는 동안 따라야 할 단계, 실행 가능한 샘플 Python 코드가 포함되어 있습니다. 동일한 지침을 사용하여 Python에서 DOC 파일을 읽을 수 있을 뿐만 아니라 다른 모든 MS Word 지원 파일도 읽을 수 있습니다.
Python에서 DOCX 파일을 읽는 단계
- DOCX 파일 읽기에 .NET을 통한 Python용 Aspose.Words을(를) 사용하도록 개발 환경 설정
- aspose.words 네임스페이스 가져오기 및 별칭 설정
- Python을 사용하여 읽을 Document 클래스 객체에 입력 DOCX 파일을 로드합니다.
- 루프를 실행하여 로드된 DOCX에서 모든 단락 노드를 가져옵니다.
- 각 노드를 단락으로 캐스트
- 각 단락에서 내용을 추출하고 표시를 위해 문자열로 변환
이 단계는 구성 및 기타 필요한 세부 정보를 공유하여 Python이 Word 문서를 읽을 수 있는지에 대한 질문에 답합니다. 필요한 네임스페이스 가져오기, DOCX 파일 로드 방법, 이 샘플 코드의 Paragraph와 같은 특정 유형의 모든 노드를 반복한 다음 각 단락 내용을 콘솔에 표시할 문자열로 변환하는 방법을 안내합니다.
Python에서 Word 파일을 읽는 코드
Python의 이 코드는 Word 파일을 로드한 다음 모든 내용을 반복하여 읽습니다. 단락 사이에서 선택한 텍스트를 읽고 섹션, 본문, 표, 모양, 주석 및 머리글 바닥글과 같은 다양한 유형의 노드에 액세스하여 몇 가지를 나열할 수도 있습니다. Document.built_in_document_properties 컬렉션을 반복하고 각 항목의 “이름” 및 “값” 속성을 사용하여 필요한 정보를 가져옴으로써 기본 제공 속성과 같은 문서 수준 정보를 얻을 수도 있습니다.
이 기사에서는 Python에서 Word 파일을 읽는 방법을 설명했습니다. Word 파일을 만드는 데 관심이 있는 경우 Python을 사용하여 Word 문서를 만드는 방법에 대한 문서를 참조하세요.