Når barnet ditt kommer hjem fra skolen med et uutgrunnelig rødt merke på testresultatene (hva betyr egentlig 153? Er det av 200? 154?) ditt første spørsmål er sannsynligvis "hva var gjennomsnittlig poengsum?" Barnet ditt trenger ikke å være et geni - men det er fint å vite at han eller hun er minst gjennomsnittlig. Det er derfor de selvtjenende, men tilsynelatende legitime funnene fra en studie utført av det rubrikkbaserte vurderingsverktøyet Gradescope, er så nervepirrende. Dårlige mattepoeng har lenge vært forstått gjennom linsen til dårlig matematikk.
"Det er ingen gjennomsnittlig student," Gradescopes Liz Carlson erklærer på selskapets blogg. Studien rapporterer faktisk at av 1500 informatikkstudenter som leverte svar på syv spørsmål ved avsluttende eksamen, en scoret innenfor gjennomsnittet 20 prosent på alle de syv spørsmålene. Gradescopes team analyserte karakterdata fra et 1500-studenters informatikkkurs, som besto av syv spørsmål og 26 underspørsmål. En perfekt score var (på en eller annen måte?) 80, og gjennomsnittsskåren blant elevene var 46. Likevel fant forskerne at bare én av studentene skåret innenfor gjennomsnittet 20 prosent på alle de syv spørsmålene.
Færre enn 1 av 25 studenter skåret innenfor gjennomsnittsområdet på fem eller flere spørsmål. Nesten 25 prosent av studentene fikk ikke gjennomsnittskarakterer på ett enkelt spørsmål.
Nå er ikke Gradescopes studie publisert i et fagfellevurdert tidsskrift, og forskerne har betydelige interessekonflikter. Resultatene indikerer for eksempel at en mer individualisert og detaljert tilnærming til gradering er nødvendig – og det er tilfeldigvis nettopp det Gradescope selger. Likevel gjør funnene det ekko tidligere forskning som antyder at ensartede standarder som tester er utdaterte, og at virkelig gjennomsnittlige studenter (og folk generelt) sannsynligvis ikke eksisterer.
Enda mer forvirrende, blant de håndfulle studentene som oppnådde en samlet poengsum innenfor 20 prosent av gjennomsnittet (det vil si, mellom 41,4 og 50,6) ikke mindre enn 14 hadde ikke skårer som falt innenfor gjennomsnittlig 20 prosent på noen av de syv spørsmål. Med andre ord, deres generelle karakterer var gjennomsnittlige, men deres prestasjoner på individuelle testspørsmål var det ikke. Funnene krever oppfølging og fagfellevurdering, men antyder i store trekk at karaktersetting på en kurve – og faktisk konvensjonell karaktersetting slik vi kjenner den – ikke klarer å fange opp styrker og svakheter til elevene.
“Vi fant ut at avviket blant gjennomsnittsskårende elever kunne være over 40 prosent – en virkelig betydelig forskjell i nøyaktig hva hver elev lærte,” skriver Carlson. «Vi så på to studenter som begge fikk 51,5 av 80 poeng på eksamen. Til tross for at de oppnådde en identisk poengsum, hadde de 67 rubrikkelementer mellom seg, eller nesten 44 prosent av alle rubrikkelementer."
"De forsto i hovedsak bare halvparten av det samme materialet."