Toetsing bij geschiedenis

Toetsing

In de rubriek toetsing vindt u informatie over allerlei aspecten van toetsing bij het vak geschiedenis.

Cesuur

De cesuur is de zak/slaaggrens bij de beoordeling van een toets. Daarbij stel je jezelf dus de vraag welke score een student tenminste moet behalen om een voldoende te halen of om te slagen. Het aantal punten wat voldoende is voor een voldoende wordt norm genoemd.

Leerlingen kunnen bij een (schoolexamen)toets vaak een bepaald aantal punten halen (een score). Vervolgens wordt het aantal behaalde punten of de score omgezet naar een cijfer (vaak op een schaal van 1 tot 10). Dit omzetten doe je met behulp van een score-cijfer transformatieschaal (zie figuur). In een score-cijfer transformatieschaal worden de scores die behaald kunnen worden afgezet tegen het cijfer wat daarbij hoort.

De lijn van een transformatieschaal is meestal lineair. Toch zijn er verschillende mogelijkheden om deze lijn te trekken. In andere woorden er zijn verschillende cesuurmethoden die toegepast kunnen worden.


 

Voorbeeld van een Score-cijfer transformatieschaal

 

Verschillende cesuurmethoden

Bij een absolute cesuurmethode wordt de zak/slaaggrens al bepaald voordat de studenten de toetsing hebben afgelegd. Het referentiepunt voor de cesuur ligt hierbij dus in de inhoud van het tentamen en de uiteindelijke scores van de studenten hebben daar bij deze methode dan ook geen invloed meer op.
Nadeel: er wordt geen rekening gehouden met de omstandigheden waarin de toetsing heeft plaatsgevonden met als gevolg mogelijk onterecht gezakte studenten (te strenge norm).

Bij een relatieve cesuurmethode ligt het referentiepunt voor de zak/slaaggrens niet in de inhoud van het tentamen maar in de betrouwbaarheid van de toets, de resultaten van een studentenpopulatie uit een eerder cohort of de resultaten van het huidige cohort.
Nadeel: studenten die zich onvoldoende hebben voorbereid op de toetsing hebben wel invloed op de gemiddelde toetsprestatie met als gevolg mogelijk onterecht geslaagde studenten (te coulante norm).

In de praktijk kom je vaak combinaties van zowel een absolute als relatieve cesuurmethode tegen, die worden ook wel compromismethoden genoemd. Hieronder worden de meest gebruikte cesuurmethoden beschreven.

Absoluut
1. Vast: Bij een vaste cesuurmethode wordt vooraf aan de toets op basis van de aard van de vragen en een eventuele correctie voor gokkans een cesuur vastgesteld. Het lastige aan deze manier van cesuur bepalen is dat de norm vrij arbitrair is. Er wordt immers niet op basis van inhoudelijke argumenten gekozen voor een bepaalde cesuur.

2. Nedelsky: De Nedelsky methode gaat ook uit van een absolute cesuurmethode, maar hierbij wordt de norm wel beargumenteerd vastgesteld. Nedelsky (1954) stelde voor om een student die een 5,5 zou halen in gedachten te nemen. Vervolgens worden de tentamenvragen door de ogen van deze student bekeken. Daarbij stel je jezelf de vraag: welke antwoordmogelijkheden zou een (hypothetische) 5,5 student kunnen wegstrepen en tussen welke antwoordmogelijkheden zou een 5,5 student twijfelen? Op basis van het aantal antwoordmogelijkheden dat niet wordt weggestreept door een 5,5 student kan de gokkans worden berekend.
Bijvoorbeeld: wanneer van een 5,5 student verwacht wordt dat hij/zij een van de vier antwoordmogelijkheden kan wegstrepen is de gokkans 0.33, aangezien er drie mogelijke antwoorden over blijven.
Door deze gokkans voor iedere vraag te berekenen vanuit het perspectief van de 5,5 student kan een beredeneerde cesuur worden bepaald.

3. Angoff: De cesuurmethode van Angoff (1971) is ook een manier om een beredeneerde absolute cesuur te bepalen. In plaats van het maken van een schatting van hoeveel antwoordmogelijkheden een 5,5 student kan wegstrepen, adviseert Angoff om per vraag te schatten welk percentage van een hypothetische groep 5,5 studenten de vraag goed beantwoordt. Door voor alle vragen de geschatte kansen op te tellen ontstaat een beredeneerde norm.

Relatief
4. Wijnen: De aanname van Wijnen (1971) was dat de moeilijkheidsgraad van een toets in een specifieke context onder specifieke condities alleen afgelezen kan worden aan de scores van studenten. De redenering achter deze cesuurmethode is dan ook dat studenten op basis daarvan beoordeeld moeten worden. In de praktijk betekent dat dat de gemiddelde score van de studenten als uitgangspunt wordt genomen. Deze gemiddelde score min twee standaardmeetfouten geeft een relatief beargumenteerde cesuur. Dit wordt ook wel grading on the curve genoemd.

Compromismethode
5. Cohen-Schotanus: Het uitgangspunt bij de methode die is voorgesteld door Cohen-Schotanus en collega’s (1996) is in principe een absolute cesuur met een relatief referentiepunt namelijk de groep beste studenten. In plaats van het nemen van de theoretisch hoogst haalbare score kan bijvoorbeeld uitgegaan worden van de daadwerkelijk hoogst behaalde score (met name bij grote groepen studenten). Ook kan er bijvoorbeeld gekeken worden naar het gemiddelde van de studenten die scoren in het 95e percentiel en hoger. In de score-cijfer transformatieschaal van figuur zou dan bijvoorbeeld niet 100 als hoogste score worden opgenomen, maar 93 omdat dat de hoogst behaalde score was.
Bij het vaststellen van de cesuur in ene toets kun je kiezen voor de absolute of de relatieve methode.

Voordelen van een absolute cesuur
• is gebaseerd op minimum eisen op basis van de leerstof
• geeft leerlingen duidelijkheid

Nadelen van een absolute cesuur
• Een absolute cesuur blijkt soms achteraf toch niet zo verantwoord (omdat deze moeilijk is vast te stellen).
• Er wordt geen rekening gehouden met de kwaliteit van de toets.
• De kwaliteit van het onderwijs beïnvloedt het percentage (on)voldoendes.

Voordelen van een relatieve cesuur
• De kwaliteit van de toets kan worden meegewogen.
• De cesuur wordt bepaald door de afnamegroep, waardoor de kwaliteit van het onderwijs minder invloed heeft.
• Deze is eenvoudig vast te stellen aan de hand van een toetsanalyse
• Het aantal leerlingen met een onvoldoende is telkens ongeveer even groot.

Nadelen van een relatieve cesuur
• Relatief zwakke leerlingen verhogen de slaagkans voor andere leerlingen
• De kwaliteit van het onderwijs en de toets wordt niet zichtbaar
• Kan niet worden gebruikt bij kleine groepen
• Kan niet worden gebruikt bij herkansers