자녀가 학교에서 집으로 돌아오면 시험 결과에 알 수 없는 빨간색 표시가 나타납니다(153은 무엇을 의미합니까? 200개 부터인가요? 154?) 첫 번째 질문은 아마도 "평균 점수는 얼마였습니까?"일 것입니다. 자녀가 천재일 필요는 없지만 최소한 평균 이상이라는 사실을 아는 것은 좋습니다. 그렇기 때문에 루브릭 기반 온라인 평가 도구인 Gradescope에서 수행한 연구의 이기적이지만 겉보기에는 정당해 보이는 결과가 매우 불안합니다. 나쁜 수학 점수는 나쁜 수학이라는 렌즈를 통해 오랫동안 이해되어 왔습니다.
“평범한 학생은 없다” Gradescope의 Liz Carlson은 회사 블로그에서 선언합니다.. 실제로 이 연구에 따르면 7개의 기말고사 문제에 대한 답을 제출한 1,500명의 컴퓨터 공학 학생 중 오직 하나 7개 문항 모두에서 평균 20% 이내의 점수를 받았습니다. Gradescope의 팀은 7개의 질문과 26개의 하위 질문으로 구성된 1,500명의 학생 컴퓨터 과학 과정에서 채점 데이터를 분석했습니다. 만점은 (어느 정도?) 80점이었고, 학생들의 평균 점수는 46점이었다. 그러나 연구원들은 학생 중 단 한 명만이 7개 질문 모두에서 평균 20% 이내의 점수를 받았다는 것을 발견했습니다.
25명 중 1명 미만의 학생이 5개 이상의 질문에서 평균 범위 내에서 점수를 받았습니다. 거의 25%의 학생들이 평균 점수를 얻지 못했습니다. 하나의 질문에.
현재 Gradescope의 연구는 피어 리뷰 저널에 게재되지 않았으며 연구원들은 상당한 이해 충돌을 겪고 있습니다. 예를 들어 결과는 채점에 대한 보다 개별화되고 상세한 접근 방식이 필요함을 나타냅니다. 그리고 바로 이것이 바로 Gradescope가 판매하는 것입니다. 그럼에도 불구하고 연구 결과는 에코 사전 연구 이는 시험과 같은 획일적인 표준이 구식이며 진정한 평균 학생(및 일반 사람들)이 아마 존재하지 않을 것임을 암시합니다.
더 혼란스러운 것은 전체 점수를 평균의 20% 이내로 얻은 소수의 학생들(즉, 41.4에서 50.6 사이) 14개 이상은 7개 항목 중 어느 것에서도 평균 20% 이내의 점수를 갖지 않았습니다. 질문. 즉, 전체 성적은 평균이었지만 개별 시험 문항에 대한 성적은 그렇지 않았다. 연구 결과는 후속 조치와 동료 검토가 필요하지만 곡선에 따른 채점과 실제로 우리가 알고 있는 기존의 채점은 학생의 강점과 약점을 포착하지 못한다는 점을 광범위하게 시사합니다.
“우리는 평균 점수를 받은 학생들 사이의 불일치가 40% 이상일 수 있음을 발견했습니다. 이는 각 학생이 정확히 무엇을 배웠는지에 있어 정말 중요한 차이입니다."라고 Carlson은 씁니다. “우리는 시험에서 80점 만점에 51.5점을 받은 두 학생을 살펴보았습니다. 동일한 점수를 얻었음에도 불구하고 67개의 루브릭 항목 불일치가 있었습니다. 이는 전체 루브릭 항목의 거의 44%였습니다.”
"그들은 본질적으로 동일한 자료의 절반만 이해했습니다."