토픽 모델링에 따른 고등학생 논설문의 응결성과 응집성의 상관분석
이슬기
한국교원대학교
국어교육학연구 52권 3호 135-162 (2017)
초록
이 연구의 목적은 토픽 모델링을 사용하여 산출한 고등학생 논설문의 응결성 지수와 응집성의 상관관계를 분석하고, 응결성 측정 방법에 대한 타당성을 고찰하는 데 있다. 이를 위해 응결성을 국지적, 포괄적, 글 전체 응집성으로 세분한 후 토픽 유사도로 응결 지수를 분석하였고, 결과 값을 교사 채점자들의 응집성 점수와 비교하였다. 연구 결과, 국지적 응결성 지수는 부적 상관관계에 있었는데, 문장 간의 유사도가 높은 글을 교사 평가자들은 내용 생성의 어려움을 겪는 글로 평가했다. 포괄적 응결성 지수는 교사 채점 결과와 유의하지 않았고, 글 전체 응결성 지수는 정적 상관관계를 보였다. 이는 교사 채점자가 인식하는 응집성 수준에 따라 글 전체에 드러나는 토픽의 유사도에 특정한 경향성이 존재한다는 것을 의미한다. 이 연구를 통해 응집성은 글 전체의 응결성과 유관하고, 토픽 모델링이 글에 대한 객관적 정보를 제공하는 타당한 도구가 될 수 있음을 확인할 수 있었다.
키워드
응결성응집성응결 장치토픽 모델링LDA기계 학습준 지도 학습텍스트 마이닝RASCH 모형일반화 가능도
