Toetsrevolutie: naar een feedbackcultuur in het voortgezet onderwijs

Formatief toetsen is hot. In plaats van toetsen te gebruiken als beoordeling van het leren, worden toetsen juist ingezet als onderdeel van het leerproces. Niet alleen biedt dit belangrijke kansen voor het verbeteren van het onderwijs en leerprocessen, maar ook om leerlingen meer eigenaarschap te bieden in het onderwijs waar ze aan deelnemen.


Dit artikel is eerder gepubliceerd als inleiding in het boek ‘Toetsrevolutie: naar een feedbackcultuur in het voortgezet onderwijs’ (2016) van Dominique Sluijsmans en René Kneyber (red.).

Inleiding

Wij opereren (…) voortdurend met de veronderstelling, dat een deel van onze leerlingen wel niet zal kunnen volgen wat wij ze trachten bij te brengen en dus “gewoon” een onvoldoende zal krijgen. Daardoor wordt de vraag of ons onderwijs wel geschikt is voor de leerlingen, nooit scherp gesteld: je kunt er altijd onderuit, want een deel van de leerlingen “mag gerust” niet geschikt voor het onderwijs zijn.
(…)
En wat de leerling betreft: het ligt bijna altijd aan hèm als hij niet slaagt; hij wordt nooit met zoveel woorden als geschikt aanvaard, alle vóórselectie ten spijt. Hem of haar hangt in principe de mogelijkheid tot falen-door-eigen-ongeschiktheid op ieder moment als een zwaard van Damocles boven het hoofd – tot op de dag van zijn eindexamen.
– Adriaan de Groot, in: Vijven en Zessen (1966, p. 43-44).

Bovenstaande passage komt uit Vijven en zessen, een boek uit 1966 van psycholoog Adriaan de Groot. In het boek keerde hij zich fel tegen de gangbare beoordelings- en examenmethoden, het cijfersysteem en de manier waarop dat werd gebruikt; hij verzette zich tegen het afrekenen van leerlingen en tegen praktijken van machtsmisbruik en willekeur. Hoewel het boek al vijftig jaar geleden verscheen, zijn de uitdagingen waar we voor staan met toetsing nog even actueel. Zo geeft De Groot allerlei praktijkvoorbeelden die een tijdloos karakter lijken te hebben: leerlingen die een 1 krijgen omdat ze zich niet goed gedragen; leerlingen die het laatste rapport ‘inzakken’ en daardoor het hele jaar opnieuw moeten doen; een leraar die bij toetsen veel hogere eisen stelt dan zijn collega’s; en rapportvergaderingen waarbij gekeken wordt naar gemiddelden over vakken, met dubieuze rekenformules. Veel van deze voorbeelden zijn te herleiden tot ondoorzichtige individuele keuzes van docenten, tot willekeur. Omdat hij van mening was dat een leerling nooit de dupe mag zijn van onzorgvuldige toetspraktijken, verhief De Groot deze kwestie tot ‘volkszaak’ en ‘Staatszaak’ (De Groot, 1966, p. 2). Met het boek wilde hij ‘“opruien” tot democratisch protest tegen een systeem dat ons beheerst, in plaats dat wij het beheersen’ (De Groot, 1966, p. 21). Hij pleitte voor een objectieve toets waarmee leraren inzicht konden krijgen in het hele kind.

Het boek van De Groot had veel invloed, en die toets die kwam er: de Cito-eindtoets. Op het eerste gezicht heeft deze niet het gewenste effect gehad; tenslotte zou niemand vandaag de dag willen beweren dat de deze eindtoets ons daadwerkelijk een valide en betrouwbare inkijk biedt in het hele kind. Maar wie nauwkeuriger kijkt, ziet dat er in de loop der tijd wel degelijk iets is veranderd. De Cito-eindtoets is essentieel gebleken voor de emancipatie van arbeiderskinderen, die baat hadden bij een onafhankelijk oordeel. Maar de ontwikkelingen schoten ook dit doel voorbij: aan het einde van zijn leven ergerde De Groot zich eraan dat ‘zijn’ Cito-eindtoets door de Inspectie wordt gebruikt als instrument om scholen te beoordelen. Daar was zijn toets nooit voor bedoeld.

Strenger selecteren op cijfers

Hoe goed de intenties van de Inspectie ongetwijfeld ook zijn, de focus op indicatoren zoals rendement en resultaten leidt tot ongewenste effecten (Kneyber & Evers, 2013). Waar het toezicht in het primair onderwijs op de gemiddelde Cito-scores teaching to the test tot gevolg heeft, leidt de aandacht voor examenresultaten, slagingspercentages en doorstroomcijfers in het voortgezet onderwijs de laatste jaren ook tot een bestendiging van sociale ongelijkheid. Uit angst voor tegenvallende resultaten gaan de cijfers zwaarder wegen, waardoor fouten in de toch al vroege selectie niet meer worden gecorrigeerd (Inspectie van het Onderwijs, 2016). In de door De Groot zo gehekelde rapportvergaderingen gaat het nu allang niet meer om het bieden van kansen: ‘de geheime formule’ waarmee overgang, opstroom en afstroom worden gereguleerd wordt steeds scherper afgesteld.

Ondanks het pleidooi van De Groot om voorzichtig te zijn met cijfers geven en vooral te investeren in het begrip van cijfers, zijn de cijfers anno 2016 nog steeds de basis voor het oordelen over leerlingen. Cijfers worden gezien als het eindproduct van een proces waarin van hoofdstuk naar hoofdstuk en van toets naar toets wordt gewerkt. Het is niet ongebruikelijk dat vaksecties afspraken maken over het aantal cijfers dat een leerling per rapportperiode moet krijgen. En op die cijfers vindt intensieve monitoring plaats, door schoolleiding, mentoren, ouders en leerlingen.

Het cijfersysteem heeft er tevens toe geleid dat leerlingen zich ernaar gaan gedragen. Leraren klagen dat als ze een leuke opdracht verzinnen, leerlingen direct vragen of het voor een cijfer is. Als het antwoord daarop ontkennend is, blijken leerlingen minder moeite te willen doen. Ernstiger nog is dat de gesprekken over onderwijs, thuis of op school, niet meer gaan over wat we met het kind willen bereiken, maar eerder gaan over welk cijfer er is gehaald, of moet worden gehaald. De vraag wat de leerling moet doen voor school is veel dominanter dan de vraag wat de school kan doen voor het kind, wat zich bijvoorbeeld uit in gebrek aan differentiatie in het voortgezet onderwijs (OESO, 2016). Deze ontkoppeling van de bedoelingen van onderwijs (zie bijv. Biesta, 2012) geeft al aan dat de huidige toetspraktijken in de kern onvoldoende worden gevoed vanuit de pedagogische en vormende opdracht van het onderwijs.

Weg met de cijfers

In 2016 hebben we in het onderwijs nog steeds te kampen met vraagstukken die te herleiden zijn tot de manier waarop toetsen worden ingezet in het onderwijs. De overeenkomsten tussen deze vraagstukken en de problematiek die De Groot vijftig jaar geleden schetste, is schrikbarend groot. We kunnen constateren dat het pleidooi voor een objectieve, gestandaardiseerde toets slechts een deel van het probleem heeft opgelost. De huidige toetspraktijken zijn inmiddels zo’n traditie in het voortgezet onderwijs, dat leraren zich vaak moeilijk kunnen voorstellen dat toetsen ook een andere functie kunnen hebben. Tegelijkertijd hebben zij er behoefte aan dat er op een andere manier naar de functie van toetsing wordt gekeken. Veel docenten geven aan dat ze moeite hebben met het ‘afrekenen’ van leerlingen en dat zij liever onderwijs geven dan toetsen afnemen en nakijken.

In dit boek presenteren we daarom ideeën om een andere weg in te slaan. Door toetsen te integreren in alle leeractiviteiten, als een natuurlijk onderdeel van het leerproces, liggen er kansen om niet alleen alle leerlingen ruimte te geven om te groeien, maar ook de mogelijkheid om écht een beeld te krijgen van het hele kind. Vijftig jaar na Vijven en zessen willen we met dit boek pleiten voor een nieuwe revolutie, tegen een systeem dat ons beheerst, in plaats van dat wij het beheersen. Weg met de cijfers; het is tijd voor een feedbackcultuur met rijke, formatieve toetsing.

Formatief toetsen

Toetsing kan twee functies hebben. Bij formatief toetsen worden toetsen tijdens het leerproces gebruikt om het leren verder te helpen, om het leren te vormen. Bij de tegenhanger ervan, summatief toetsen, worden toetsen gebruikt als afsluiting of als conclusie van het leren. Deze laatste vorm wordt meestal geassocieerd met toetsen waarvoor een cijfer wordt gegeven, maar dat is niet helemaal correct. Zowel bij formatief als summatief toetsen is er sprake van feedback aan de leerling. Feedback in de vorm van een cijfer is echter zo informatiearm, dat ook als de toetsing formatief is bedoeld, ze in de praktijk gewoonweg summatief uitvalt: voor de leerling is na het krijgen van een cijfer het leren meestal voorbij, en is het leerrendement van korte duur (Wiliam, 2013). Dit illustreert direct een belangrijk aspect van deze twee begrippen, namelijk dat het niet zozeer gaat om de intentie waarmee een toets wordt afgenomen, maar vooral over de manier waarop de ‘uitkomsten’ van de toets in de praktijk hun werking hebben. Wat dat betreft is de definitie van Black en Wiliam (2009) behulpzaam, namelijk dat een toets formatief is als:

bewijsmateriaal van het niveau wordt verzameld, geïnterpreteerd en gebruikt door leraren, leerlingen en hun klasgenoten om beslissingen te maken over de volgende stappen in het onderwijs die waarschijnlijk beter, of beter onderbouwd, zijn dan de beslissingen die genomen zouden zijn in de afwezigheid van dergelijk verzameld bewijsmateriaal.

Voor een juist begrip van formatief toetsen lijkt het ten eerste goed om te beseffen dat een toets van zichzelf niet formatief kan zijn; het is geen inherente eigenschap van een toets. Formatief toetsen is een proces, waarin de leerdoelen centraal staan. Leraar en leerlingen proberen actief helder te krijgen wat de leerdoelen precies inhouden, en proberen daar betekenis aan te verlenen. Die doelen zijn niet per definitie extern opgelegd, maar worden het liefst door de leerlingen zelf vormgegeven en opgehelderd en zijn betekenisvol. Leerlingen ervaren bij formatief toetsen veel zeggenschap en eigenaarschap over de leerdoelen.

Een volgend element in het proces van formatief toetsen is achterhalen waar de leerling staat ten opzichte van de leerdoelen. Dit kan door middel van een opdracht op papier of door directe observatie, maar daarnaast zijn er nog veel meer manieren om het niveau van het leren inzichtelijk te maken. Ook hier kunnen leerlingen zelf een rol spelen, bijvoorbeeld in de vorm van peer-evaluatie of zelfevaluatie.

Tot slot is, zoals reeds genoemd, feedback een essentieel onderdeel van het proces van formatief toetsen. De leraar geeft feedback aan de leerling, maar de leerling geeft zelf ook feedback aan medeleerlingen, de leraar, of aan zichzelf. Die feedback richt zich niet per se op het verhelpen van geobserveerde hiaten tussen het leerdoel en wat de leerling al beheerst, maar kan zich bijvoorbeeld ook richten op de ontwikkeling van zelfsturing van het leerproces.

Wanneer er sprake is van externe sturing door de leraar, dan neemt die bij formatief toetsen altijd de rol aan van scaffolding[1], die uiteindelijk tot bedoeling heeft om de leerlingen te helpen om zelfsturing te ontwikkelen. Er is sprake van ‘gedeelde sturing’ tot het moment dat zelfsturing mogelijk is (Kirschner & Van Merriënboer, 2013). Het helpt de leerling om ‘beter taken te selecteren, relevante ondersteunende informatie te vinden, de benodigde aanpakken of oplossingsstrategieën te kiezen, en nuttige deeltaken te onderscheiden’ (Kirschner & Van Merriënboer, p. 44).

Over dit boek

In de Nederlandse onderwijspraktijk is formatief toetsen in opkomst. Op vele scholen zijn er leraren die, vaak uit eigen beweging en in relatief isolement, experimenteren met formatief toetsen. Hun motivatie daartoe is veel persoonlijker dan de hierboven beschreven voordelen van formatief toetsen. Als docenten zich tegen de cijfercultuur keren, is dat vaak omdat ze zich zorgen maken over de consequenties die cijfers hebben voor de motivatie en verdere mogelijkheden van leerlingen. Ook kunnen ze met formatief toetsen veel beter een vinger aan de pols houden wat betreft de voortgang van de leerlingen; het contact met hen is inniger. Uiteindelijk gaat hen vooral om wat formatief toetsen voor hen persoonlijk en voor de leerlingen als persoon kan betekenen.

Voor dit boek gingen we met leraren in gesprek over waarom ze met formatief toetsen aan de slag zijn gegaan en hoe zij dit in de praktijk vormgeven. Hierbij hebben we ervoor gekozen om zo veel mogelijk verschillende vakken, niveaus en leerjaren te beslaan, van vmbo tot vwo, van natuurkunde tot lichamelijke opvoeding, en van de brugklas tot aan de examenklassen. Het werk van deze pionierende docenten bevindt zich in verschillende stadia van implementatie. Sommigen zijn nog maar net begonnen met opstellen en verhelderen van leerdoelen, en met het betrekken van leerlingen daarbij. Andere docenten hebben de examendoelen volledig losgelaten, om formatief toetsen als centraal mechanisme in hun lessen toe te passen.

Naast deze portretten staat in dit boek ook een aantal artikelen die wat dieper ingaan op een aantal (theoretische) aspecten van formatief toetsen. In het eerste artikel laat Ed van den Berg door middel van praktijkvoorbeelden van verschillende theorievakken zien hoe leraren aan de hand van slimme antwoordmodellen leerlingen razendsnel van feedback kunnen voorzien. In het tweede artikel bespreken Gerrit ter Horst, Trudy van de Kam-van Lent, Rob van Stiphout, Diana Baas en Jos Castelijns hoe zelfsturing bij leerlingen wordt ontwikkeld door interacties met de leerkracht. Het onderwerp leerlingmotivatie komt aan bod in het artikel van Renske de Kleijn, Frans Prins, Christel Lutz, Karin van Look en Jan van Tartwijk, die divers onderzoek naar de effecten van formatief toetsen op motivatie op een rij zetten. In het artikel van Gerdineke van Silfhout leest u hoe de vijf strategieën van formatief toetsen ingezet kunnen worden bij het vak Nederlands, en hoe leerlingen daar actief bij betrokken worden. Wilma Kippers, Christel Wolterinck, Kim Schildkamp en Cindy Poortman geven een theoretisch overzicht van formatief toetsen en laten door middel van onderzoek zien dat de verschillende strategieën slechts sporadisch in de praktijk worden ingezet. Tot slot bespreken Larike Bronkhorst en Jan van Tartwijk de resultaten van het ProFeed-traject waarin docenten zich op verschillende wijzen professionaliseren in het geven van feedback aan hun leerlingen.

In de conclusie schetsen we in de vorm van zes kernboodschappen een vergezicht voor formatief toetsen: als we het wenselijk vinden dat de toetspraktijk op alle scholen in het voortgezet onderwijs verandert, wat is daar dan voor nodig?

[1] Met scaffolding wordt in het Engels verwezen naar het bouwen van steigers en het bouwen van bruggen tussen die steigers, en laat zich als term moeilijk vertalen. Het is een manier van ‘“aanbieden” of “voordoen”, die de lerende steeds naar een iets hoger niveau brengt’ (Kirschner & Merriënboer, 2013). Kirschner en Merriënboer vergelijken in dit geciteerde artikel scaffolding ook met het leren fietsen met zijwieltjes: de zijwieltjes worden steeds hoger afgesteld, tot het moment dat het kind zelfstandig kan fietsen.


Literatuur

Biesta, G.J.J. (2012). Goed onderwijs en de cultuur van het meten. Ethiek, politiek en democratie. Den Haag: Boom Lemma.

Black, P., & Wiliam, D. (2009). Developing the theory of formative assessment. Educational assessment, Evaluation and Accountability, 21(1), 5-31.

Groot, A.D. de (1966). Vijven en zessen. Groningen: Wolters.

Inspectie van het Onderwijs (2016). Staat van het Onderwijs 2014/2015. Utrecht: Inspectie van het Onderwijs.

Kirschner, P.A., & Merriënboer, J.J.G. van (2013). De zelfsturende leerling? Van Twaalf tot Achttien, september, 42-44.

Kneyber, R., & Evers, J. (2013). Het Alternatief. Weg met de afrekencultuur in het onderwijs. Amsterdam: Boom.

OESO (2016). Netherlands 2016: Foundations for the future. Parijs: OESO.

Wiliam, D. (2013). Cijfers geven werkt niet. Meppel: Ten Brink.

Wij bekijken iedere reactie. U hoort binnen drie dagen of we het bericht plaatsen.

annuleer