Když se vaše dítě vrátí domů ze školy s nevyzpytatelnou červenou známkou na výsledcích testu (co vůbec znamená 153? Je to z 200? 154?) vaše první otázka je pravděpodobně „jaké bylo průměrné skóre?“ Vaše dítě nemusí být génius – ale je hezké vědět, že je alespoň průměrné. To je důvod, proč samoúčelná, ale zdánlivě legitimní zjištění ze studie provedené online hodnotícím nástrojem Gradescope založeném na rubrikách jsou tak znepokojující. Špatné matematické výsledky byly dlouho chápány optikou špatné matematiky.
"Neexistuje průměrný student," Liz Carlson z Gradescope prohlašuje na blogu společnosti. Studie skutečně uvádí, že z 1 500 studentů informatiky, kteří zaslali odpovědi na sedm otázek závěrečné zkoušky, jeden skóre v průměru 20 procent ve všech sedmi otázkách. Tým Gradescope analyzoval data hodnocení z kurzu informatiky pro 1 500 studentů, který se skládal ze sedmi otázek a 26 podotázek. Perfektní skóre bylo (nějak?) 80 a průměrné skóre mezi studenty bylo 46. Přesto výzkumníci zjistili, že pouze jeden ze studentů dosáhl ve všech sedmi otázkách v průměru 20 procent.
Méně než 1 z 25 studentů dosáhlo průměrného skóre u pěti nebo více otázek. Téměř 25 procent studentů nedosáhlo průměrné známky na jedinou otázku.
Studie Gradescope nyní není publikována v recenzovaném časopise a výzkumníci mají značné střety zájmů. Výsledky například naznačují, že je nutný individualizovanější a podrobnější přístup k hodnocení – a to je právě to, co Gradescope prodává. Nicméně zjištění ano echo předchozí výzkum což naznačuje, že jednotné standardy, jako jsou testy, jsou zastaralé a že skutečně průměrní studenti (a lidé obecně) pravděpodobně neexistují.
Ještě více matoucí je, že mezi hrstkou studentů, kteří dosáhli celkového skóre v rozmezí 20 procent průměru (tj. mezi 41,4 a 50,6) ne méně než 14 nemělo skóre, které spadalo do průměru 20 procent u žádného ze sedmi otázky. Jinými slovy, jejich celkové známky byly průměrné, ale jejich výkony v jednotlivých testových otázkách ne. Zjištění vyžadují následnou kontrolu a vzájemné hodnocení, ale obecně naznačují, že známkování na křivce – a vlastně konvenční známkování, jak ho známe – nedokáže zachytit silné a slabé stránky studentů.
“Zjistili jsme, že rozdíl mezi studenty s průměrným skóre může být více než 40 procent – skutečně významný rozdíl v tom, co se každý student přesně naučil,“ píše Carlson. „Podívali jsme se na dva studenty, kteří oba u zkoušky získali 51,5 z 80 bodů. Navzdory tomu, že získali stejné skóre, měli mezi sebou 67 nesrovnalostí v položkách rubriky, neboli téměř 44 procent všech položek rubriky.“
"V podstatě rozuměli jen polovině stejného materiálu."