전이(Transfer) 평가를 위한 세트형 서·논술형 과제 설계 체계 연구— 구인·과제·증거의 정렬(Alignment) 메커니즘을 중심으로
박고운
한국교원대학교
국어교육학연구 61권 1호 103-153 (2026)
초록
본 연구는 깊이 있는 학습을 요구하는 서·논술형 평가가 현장에서 단답화·형식화되는 현상을 ‘정렬 붕괴’로 진단하고, 전이(transfer) 수행을 관찰 가능한 증거로 포착하기 위한 세트형 과제 설계 체계를 제안하는 데 목적을 둔다. 증거중심설계(ECD)와 개념기반 탐구학습(CBIL)을 결합하여 구인-과제-증거의 정렬을 복원하는 3층위 설계 모델을 구축하고, 2022 개정 ‘독서와 작문’ 맥락에서 여론조사 자료 비평 세트를 설계 사례로 제시한다. 전이를 ‘조건부 근거 판단’으로 운영화하고, 지문 기능 분업(개념 토대 → 맥락 적용 → 공적 규범)과 문항 간 책임 이전을 통해 사고 경로를 누적하는 과제 구조를 제시하였다. 루브릭은 관점/기준 이원화 원리와 CBIL 경로 기반 질적 차등으로 설계하며, 역방향 검증을 통해 구인 충실성과 구인 무관 분산(CIV) 통제를 점검한다. 본 연구는 서·논술형 평가를 ‘정렬 가능한 설계 체계’로 재정식화하며, 전이 수행을 증거화하는 과정적 평가 구조의 이론적·실천적 토대를 제공한다. 후속 연구는 학습자 수행 데이터와 채점자 간 신뢰도 검증을 통한 경험적 타당화가 필요하다.
키워드
서·논술형 평가전이(transfer)증거중심설계(ECD)개념기반 탐구학습(CBIL)정렬(alignment)학문 문식성독서와 작문
참고문헌
- 교육부(2022), 『2022 개정 국어과 교육과정(교육부 고시 제2022 - 33호[별책5])』, 세종: 교육부.
- 김경희(2020), 「서·논술형 평가의 평가학적 의미 탐색」, 『교육평가연구』 33(4), 839 - 862.
- 김경희·이명진(2021), 「교수학습과 학생평가 개선을 위한 서·논술형 평가 지침 활용 및 피드 백 효과 제고 방안」, 『교육과정평가연구』 24(3), 27 - 51.
- 김수진·김희경·나우열·민호기·백승주·성경희·이미숙·이민형·이영미·한금영(2025), 『서· 논술형 평가에 대한 쟁점 및 요구 분석(KICE 이슈페이퍼ORM 2025 - 41 - 8)』, 진천: 한국 교육과정평가원.
- 김영란(2021), 「학문 문식성(disciplinary literacy)의 의미와 중등교육에의 시사점」, 『리터러시 연구』 12(1), 367 - 401.
- 김형성(2024), 『국어 교사의 논술형 평가 전문성 신장 방안 연구』, 한국교원대학교 박사학위논문.
- 남가영·김호정(2023), 「서술형·논술형 평가 실행에 관한 국어 교사의 최적화 행동 분석」, 『교 과교육학연구』 27(1), 31 - 50.
- 박고운(2025), 「GenAI - HITL 기반 ‘독서와 작문’ 연계 서술형 평가 과제 개발 및 타당성 검토」, 『국어교육학연구』 60(4), 129 - 174.
- 박종임(2024), 「국어과 서·논술형 평가의 도입 현황 및 실행 상의 쟁점 탐색 연구」, 『청람어문 교육』 101, 273 - 307.
- 박혜영·김성숙·김경희·이명진·김광규·김지영(2019), 『수업-평가 연계 강화를 통한 서·논 술형 평가 내실화 방안(연구보고RRE 2019 - 6)』, 진천: 한국교육과정평가원.
- 송슬기(2024), 「깊이 있는 학습을 위한 필요조건으로서의 논술형 평가의 특징과 지원 방향에 관한 탐색」, 『교육문화연구』 30(4), 149 - 172.
- 송슬기(2025), 「개념적 학습을 유도하는 확장형 논술의 운영 조건 탐색」, 『열린교육연구』 33(1), 79 - 98.
- 장성민(2025), 「학문 문식성 기반의 논술형 평가 방향 탐색: 수능 서·논술형 평가 도입의 맥락 에서」, 『리터러시 연구』 16(5), 623 - 657.
- 정민주·서수현·남민우·최숙기·이상일·남가영(2022), 「좋은 국어과 평가 문항 특성에 관 한 질적 분석 연구: 국어과 평가 문항 양호도 분석틀 개발 연구(2)」, 『청람어문교육』 89, 7 - 42.
- 최숙기(2021), 「서·논술형 수능 도입을 대비한 2022 개정 국어과 교육과정의 개정 방향 탐색」, 『청람어문교육』 83, 129 - 156.
- 최숙기·박종임(2023ㄱ), 「2022 개정 국어과 교육과정 「독서와 작문」 교육과정 개발의 원리와 방향」, 『작문연구』 57, 165 - 199.
- 최숙기·박종임(2023ㄴ), 「인공지능 시대의 작문 평가를 위한 ChatGPT 활용 방안 연구」, 『청람 어문교육』 95, 65 - 109.
- 편지윤(2021), 「학문 문식성 교육 내용으로서 지식에 대한 시론」, 『새국어교육』 129, 9 - 48. American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (2014), Standards for educational and psychological testing, American Educational Research Association.
- Bjork, E. L. & Bjork, R. A. (2011), “Making things hard on yourself, but in a good way: Creating desirable difficulties to enhance learning”, In M. A. Gernsbacher, R. W. Pew, L. M. Hough, & J. R. Pomerantz(Eds.), Psychology and the Real World: Essays illustrating fundamental contributions to society (pp. 56 - 64), Worth Publishers.
- Bransford, J. D. & Schwartz, D. L. (1999), “Rethinking transfer: A simple proposal with multiple implications”, Review of Research in Education 24, 61 - 100.
- Brookhart, S. M. (2013), 『루브릭, 어떻게 만들고 사용할까?』, 장은경·김민아·남예지·양하 늬·조은비·주혜란·차혜경(역), 서울: 우리학교, 2022.
- Bruner, J. S. (1960), The process of education, Cambridge, MA: Harvard University Press.
- Erickson, H. L., Lanning, L. A., & French, R. (2017), 『생각하는 교실을 위한 개념기반 교육 과정 및 수업』, 온정덕·윤지영(역), 서울:학지사, 2019.
- Fang, Z. (2012), “Language correlates of disciplinary literacy”, Topics in Language Disorders 32(1), 19 - 34.
- Fisher, D. & Frey, N. (2013), Better learning through structured teaching: A framework for the gradual release of responsibility (2nd ed.), ASCD, Alexandria.
- Hevner, A. R., March, S. T., Park, J., & Ram, S. (2004), “Design science in information systems research”, MIS Quarterly 28(1), 75 - 105.
- Jonsson, A. & Svingby, G. (2007), “The use of scoring rubrics: Reliability, validity and educational consequences”, Educational Research Review 2(2), 130 - 144.
- Kane, M. T. (2013), “Validating the interpretations and uses of test scores”, Journal of Educational Measurement 50(1), 1 - 73.
- Kapur, M. (2008), “Productive failure”, Cognition and Instruction 26(3), 379 - 424.
- Kapur, M. & Bielaczyc, K. (2012), “Designing for productive failure”, Journal of the Learning Sciences 21(1), 45 - 83.
- Messick, S. (1989), “Validity”, In R. L. Linn(Ed.), Educational measurement (3rd ed., pp. 13 - 103), NY: American Council on education and Macmillan.
- Mislevy, R. J., Steinberg, L. S., & Almond, R. G. (2003), “On the structure of educational assessments”, Measurement: Interdisciplinary Research and Perspectives 1(1), 3 - 62.
- Panadero, E. & Jonsson, A. (2013), “The use of scoring rubrics for formative assessment purposes revisited: A review”, Educational Research Review 9, 129 - 144.
- Scardamalia, M. & Bereiter, C. (1987), “Knowledge telling and knowledge transforming in written composition”, In S. Rosenberg (Ed.), Advances in applied psycholinguistics, Vol. 1. Disorders of first - language development; Vol. 2. Reading, writing, and language learning (pp. 142 - 175). Cambridge University Press.
- Shanahan, T. & Shanahan, C. (2008), “Teaching disciplinary literacy to adolescents: Rethinking content - area literacy”, Harvard Educational Review 78(1), 40 - 59. van de Pol, J., Volman, M., & Beishuizen, J. (2010), “Scaffolding in teacher - student interaction: A decade of research”, Educational Psychology Review 22(3), 271 - 296.
- Wineburg, S. S. (1991), “Historical problem solving: A study of the cognitive processes used in the evaluation of documentary and pictorial evidence”, Journal of Educational Psychology 83(1), 73 - 87.
- Wood, D., Bruner, J. S., & Ross, G. (1976), “The role of tutoring in problem solving”, Child Psychology & Psychiatry & Allied Disciplines 17(2), 89 - 100.
