Toetsing bij geschiedenis
Toetsing
In de rubriek toetsing vindt u informatie over allerlei aspecten van toetsing bij het vak geschiedenis.
Inhoud
Cesuur
De cesuur is de zak/slaaggrens bij de
beoordeling van een toets. Daarbij stel je jezelf dus de vraag
welke score een student tenminste moet behalen om een voldoende
te halen of om te slagen. Het aantal punten wat voldoende is
voor een voldoende wordt norm genoemd.
Leerlingen kunnen bij een (schoolexamen)toets vaak een bepaald
aantal punten halen (een score). Vervolgens wordt het aantal
behaalde punten of de score omgezet naar een cijfer (vaak op een
schaal van 1 tot 10). Dit omzetten doe je met behulp van een
score-cijfer transformatieschaal (zie figuur). In een
score-cijfer transformatieschaal worden de scores die behaald
kunnen worden afgezet tegen het cijfer wat daarbij hoort.
De lijn van een transformatieschaal is meestal lineair. Toch
zijn er verschillende mogelijkheden om deze lijn te trekken. In
andere woorden er zijn verschillende cesuurmethoden die
toegepast kunnen worden.
Voorbeeld van een Score-cijfer transformatieschaal
Verschillende cesuurmethoden
Bij een absolute cesuurmethode wordt de zak/slaaggrens al
bepaald voordat de studenten de toetsing hebben afgelegd. Het
referentiepunt voor de cesuur ligt hierbij dus in de inhoud van
het tentamen en de uiteindelijke scores van de studenten hebben
daar bij deze methode dan ook geen invloed meer op.
Nadeel: er wordt geen rekening gehouden met de omstandigheden
waarin de toetsing heeft plaatsgevonden met als gevolg mogelijk
onterecht gezakte studenten (te strenge norm).
Bij een relatieve cesuurmethode ligt het referentiepunt voor de
zak/slaaggrens niet in de inhoud van het tentamen maar in de
betrouwbaarheid van de toets, de resultaten van een
studentenpopulatie uit een eerder cohort of de resultaten van
het huidige cohort.
Nadeel: studenten die zich onvoldoende hebben voorbereid op de
toetsing hebben wel invloed op de gemiddelde toetsprestatie met
als gevolg mogelijk onterecht geslaagde studenten (te coulante
norm).
In de praktijk kom je vaak combinaties van zowel een absolute
als relatieve cesuurmethode tegen, die worden ook wel
compromismethoden genoemd. Hieronder worden de meest gebruikte
cesuurmethoden beschreven.
Absoluut
1. Vast: Bij een vaste cesuurmethode wordt vooraf aan de toets
op basis van de aard van de vragen en een eventuele correctie
voor gokkans een cesuur vastgesteld. Het lastige aan deze manier
van cesuur bepalen is dat de norm vrij arbitrair is. Er wordt
immers niet op basis van inhoudelijke argumenten gekozen voor
een bepaalde cesuur.
2. Nedelsky: De Nedelsky methode gaat ook uit van een absolute
cesuurmethode, maar hierbij wordt de norm wel beargumenteerd
vastgesteld. Nedelsky (1954) stelde voor om een student die een
5,5 zou halen in gedachten te nemen. Vervolgens worden de
tentamenvragen door de ogen van deze student bekeken. Daarbij
stel je jezelf de vraag: welke antwoordmogelijkheden zou een
(hypothetische) 5,5 student kunnen wegstrepen en tussen welke
antwoordmogelijkheden zou een 5,5 student twijfelen? Op basis
van het aantal antwoordmogelijkheden dat niet wordt weggestreept
door een 5,5 student kan de gokkans worden berekend.
Bijvoorbeeld: wanneer van een 5,5 student verwacht wordt dat
hij/zij een van de vier antwoordmogelijkheden kan wegstrepen is
de gokkans 0.33, aangezien er drie mogelijke antwoorden over
blijven.
Door deze gokkans voor iedere vraag te berekenen vanuit het
perspectief van de 5,5 student kan een beredeneerde cesuur
worden bepaald.
3. Angoff: De cesuurmethode van Angoff (1971) is ook een manier
om een beredeneerde absolute cesuur te bepalen. In plaats van
het maken van een schatting van hoeveel antwoordmogelijkheden
een 5,5 student kan wegstrepen, adviseert Angoff om per vraag te
schatten welk percentage van een hypothetische groep 5,5
studenten de vraag goed beantwoordt. Door voor alle vragen de
geschatte kansen op te tellen ontstaat een beredeneerde norm.
Relatief
4. Wijnen: De aanname van Wijnen (1971) was dat de
moeilijkheidsgraad van een toets in een specifieke context onder
specifieke condities alleen afgelezen kan worden aan de scores
van studenten. De redenering achter deze cesuurmethode is dan
ook dat studenten op basis daarvan beoordeeld moeten worden. In
de praktijk betekent dat dat de gemiddelde score van de
studenten als uitgangspunt wordt genomen. Deze gemiddelde score
min twee standaardmeetfouten geeft een relatief beargumenteerde
cesuur. Dit wordt ook wel grading on the curve genoemd.
Compromismethode
5. Cohen-Schotanus: Het uitgangspunt bij de methode die is
voorgesteld door Cohen-Schotanus en collega’s (1996) is in
principe een absolute cesuur met een relatief referentiepunt
namelijk de groep beste studenten. In plaats van het nemen van
de theoretisch hoogst haalbare score kan bijvoorbeeld uitgegaan
worden van de daadwerkelijk hoogst behaalde score (met name bij
grote groepen studenten). Ook kan er bijvoorbeeld gekeken worden
naar het gemiddelde van de studenten die scoren in het 95e
percentiel en hoger. In de score-cijfer transformatieschaal van
figuur zou dan bijvoorbeeld niet 100 als hoogste score worden
opgenomen, maar 93 omdat dat de hoogst behaalde score was.
Bij het vaststellen van de cesuur in ene toets kun je kiezen
voor de absolute of de relatieve methode.
Voordelen van een absolute cesuur
• is gebaseerd op minimum eisen op basis van de
leerstof
• geeft leerlingen duidelijkheid
Nadelen van een absolute cesuur
• Een absolute cesuur blijkt soms achteraf toch niet zo
verantwoord (omdat deze moeilijk is vast te stellen).
• Er wordt geen rekening gehouden met de kwaliteit van de toets.
• De kwaliteit van het onderwijs beïnvloedt het percentage
(on)voldoendes.
Voordelen van een relatieve cesuur
• De kwaliteit van de toets kan worden meegewogen.
• De cesuur wordt bepaald door de afnamegroep, waardoor de
kwaliteit van het onderwijs minder invloed heeft.
• Deze is eenvoudig vast te stellen aan de hand van een
toetsanalyse
• Het aantal leerlingen met een onvoldoende is telkens ongeveer
even groot.
Nadelen van een relatieve cesuur
• Relatief zwakke leerlingen verhogen de slaagkans voor andere
leerlingen
• De kwaliteit van het onderwijs en de toets wordt niet
zichtbaar
• Kan niet worden gebruikt bij kleine groepen
• Kan niet worden gebruikt bij herkansers