Toetsing bij geschiedenis
Toetsing
In de rubriek toetsing vindt u informatie over allerlei aspecten van toetsing bij het vak geschiedenis.
Inhoud
Waarom toetsen?
Toetsen is een belangrijk onderdeel van het leren van
leerlingen en van het werk van leraren. De laatsten besteden
tussen de 30% en 50% van hun tijd aan het voorbereiden,
uitvoeren en nakijken van toetsen (Plake, 1993; Stiggins &
Conklin, 1992). Waarom wordt er zoveel aandacht en tijd aan
toetsing besteed? Toetsing wordt gezien als een belangrijk
instrument om de kwaliteit van (lange termijn) leren én van het
onderwijs te borgen. Het wordt een steeds belangrijker criterium
wanneer het gaat om het borgen van examenkwaliteit en het
voorkomen van te grote verschillen tussen de cijfers voor het
schoolexamen en het centraal examen (www.vo-raad.nl).
Toetsing wordt steeds minder beschouwd als het exclusieve domein
van de psychometrici, ook vanuit leertheoretisch perspectief is
er steeds meer aandacht voor toetsing. Dit betekent dat naast de
gangbare kwaliteitscriteria van betrouwbaarheid en validiteit
ook steeds meer wordt gekeken naar criteria als aansluiting
tussen leren, instructie en toetsing en de mate waarin
leerlingen worden betrokken bij toetsing (Baartman, Bastiaens,
Kirschner, & Van der Vleuten, 2006). Toetsing wordt sterker
verweven met het onderwijs, waardoor het mogelijk is resultaten
van toetsen ook te gebruiken om het leerproces te ondersteunen
(Sluijsmans, 2008). Toetsen worden dan niet alleen ingezet om te
komen tot beslissingen als certificering en selectie - ook wel
summatief toetsen genoemd - maar ze krijgen ook toenemend de
functie van het ondersteunen van het leren - het zogenaamde
formatief toetsen.
Opgelegde toetsen belemmeren regelmatig het leren omdat het
toetsen niet toebehoort aan de leerling, maar iets is dat de
leerling ondergaat (Boud, 2000). Als de leerling nauwelijks
betrokken wordt bij de voorbereiding, uitvoering en bespreking
van de toets, zal het effect van toetsing op leren minimaal zijn
(Sluijsmans, Dochy, & Moerkerke, 1999). Onderzoek laat zien dat
toetsen die gericht zijn op certificering en selectie waarbij
geen sprake is van informatieve feedback of inbedding in het
leerproces zelfs negatief zijn voor leren, omdat ze leerlingen
belemmeren om verantwoordelijkheid te nemen zich te motiveren om
te leren (Hattie & Timperley, 2007). Toetsen op deze wijze leidt
tot aangeleerde afhankelijkheid, een leerling leert niet zelf
verantwoordelijkheid te nemen voor het leren (Yorke, 2003).
Dat toetsing in functie van leren kan staan is nog niet zo oud:
pas eind jaren tachtig is toetsing gerelateerd aan het leren van
leerlingen en een eerste onderscheid werd gemaakt tussen
assessment of learning en assessment for learning (Sadler,
1989). Toetsen van het leren - ook wel summatief toetsen genoemd
- verwijst naar het vaststellen, beschrijven en rapporteren van
leeruitkomsten (kennis, vaardigheden) op een bepaald tijdstip.
De toetsresultaten worden gebruikt voor het nemen van
beslissingen over zakken of slagen en voor externe
verantwoording. Toetsen voor het leren – het formatief toetsen -
betreft het proces van het zoeken, aggregeren en interpreteren
van informatie die leerlingen en leraren gebruiken om te bepalen
waar leerlingen staan in hun leerproces, waar zij naar toe
moeten werken en op welke manier (ARG, 2002).
De betrokkenheid van leerlingen wordt versterkt door vormen van
co-, self- en peer-assessment, waardoor de leerlingen leren
verantwoordelijkheid te dragen voor hun en andermans
leren (Sluijsmans, Dochy, & Moerkerke, 1999). Deze vormen van
toetsen stimuleren leerlingen zelf sturing te nemen over het
leren, een belangrijk doel van formatief toetsen (OECD/CERI,
2005; 2008). Zelfsturend vermogen wordt gezien als de meest
essentiële vaardigheid voor leren op de lange termijn (Boud,
2000; Sluijsmans, 2008). Het geven van controle aan leerlingen
over de wijze waarop, wanneer en door wie ze worden getoetst kan
leiden tot een actievere betrokkenheid en verantwoordelijkheid
van leerlingen. Dit kan vervolgens tot een hogere motivatie en
tot meer leren leiden dan wanneer het beoordelen volledig extern
wordt aangestuurd (Wulf, Raupach, & Pfeiffer, 2005).
Het balanceren van toetsen als leren (AaL- Assesment as
learning), toetsen om te leren (AfL=Assessment for learning) en
toetsen van het leren (AoL=Assessment of learning).
formatief toetsen in de breedste zin des woords verwijst naar
het proces van het zoeken, aggregeren en interpreteren van
informatie die leerlingen en leraren gebruiken bij het bepalen
waar leerlingen staan in hun leerproces, waar zij naar toe
moeten werken en op welke manier (ARG, 1999);
De grootste gemene deler van de vele definities die er zijn van
formatief toetsen is dat het continu plaatsvindt tijdens het
onderwijs en leren, op verschillende manieren uitgevoerd kan
worden waarbij intensieve interactie tussen de leraar en de
leerling het leren stimuleert. Dit betekent dat toetsen niet
alleen plaatsvindt na afronding van een leerproces, maar ook
wordt ingezet om het leerproces te plannen en te monitoren. Ook
blijkt formatief toetsen te kunnen worden gepositioneerd op een
zevental dimensies (zie paragraaf 4.1.2).
Een eerste kritiekpunt op summatief toetsen is dat zij niet
leiden tot verder leren (Cauley & McMillan, 2010). Summatieve toetsen zijn vaak retrospectief en vinden
plaats na het leren (Simpson-Beck,
2011). Dit retrospectief karakter wordt als nadelig voor leren
gezien (Lee, 2011), omdat het weinig activiteit van de leerling
vraagt (Sadler, 1989). Hierdoor wordt betwijfeld of summatief
toetsen past bij constructivistische leertheorieën (Pryor &
Crossouard, 2008). Een tweede punt van kritiek is dat
gestandaardiseerde, centraal aangestuurde summatieve examens hun
beperkingen hebben in termen van validiteit (Bell en Cowie,
2001). Summatieve toetsen in de zin van ‗high-stakes‘ toetsen
bevatten vaak overwegend meerkeuzevragen, waardoor niet met
zekerheid kan worden geborgd dat wordt gemeten wat men beoogt te
meten. De focus ligt vooral op betrouwbaarheid, waarbij het doel
is de mate van consistentie tussen metingen te kunnen
vaststellen (Black & Wiliam, 1998). Een andere constatering is
dat summatieve toetsen vooral in Amerikaanse onderwijssystemen
normgericht zijn en bedoeld om leerlingen te kunnen vergelijken
(Yin et al., 2008). Normgerichte beoordelingsmodellen gaan
echter uit van een gemiddelde leerling - de gemiddeld behaalde
score door de groep als geheel bepaalt de cesuur - met als
gevolg dat er altijd leerlingen zullen falen. Dit maakt
aanpassing van instructie voor de zeer laag en zeer hoog
presterende leerlingen lastig. Een vierde kritiekpunt is dat
summatieve toetsen vooral bedoeld zijn om vast te stellen hoe
goed een school het doet. Als leraren vooral worden beoordeeld
op scores op summatieve, landelijke toetsen, is de consequentie
dat leraren vooral onderwijzen en trainen wat er op deze toetsen
wordt gevraagd (teaching to the test; Popham,
2011) en dat zij minder geneigd zijn om toetsen in functie van
leren van elke leerling te stellen
(Alonzo, 2011). De paradox is dat het gebrek aan leerwaarde van
summatieve toetsen niet in verhouding staat met de vaak zware
consequenties en beslissingen ten gevolge van de uitslagen op
deze toetsen. Tot slot blijkt de frequentie van summatieve vaak
te laag te zijn om zinvol te kunnen zijn voor leren (Stiggins,
2005). Hierdoor is het niet mogelijk om instructie tijdig aan te
passen aan de behoeften van de leerlingen.
Doorgaans wordt informatie van summatieve toetsen gebruikt om
leerlingen te certificeren of de effectiviteit van een
curriculum te evalueren. Formatief toetsen wordt vooral ingezet
om het proces van curriculumontwerp, onderwijzen en leren te
verbeteren (Pryor & Crossouard, 2008). Als summatieve toetsen in
lijn zijn met instructie en ingebed in het curriculum, kan
summatief toetsen ook een positieve leerwaarde hebben
(Brookhart, 2011). Negatieve associaties over summatief toetsen
Referentie
Sluijsmans, D, Joosten-ten Brinke, D en Vleuten, C. van der
(2013). Toetsen met leerwaarde. Een reviewstudie naar de
effectieve kenmerken van formatief toetsen
.