Toetsing in het basisonderwijs: nuttig of belemmerend?
Karen Heij
Zelfstandig toetsexpert bij Parrhesia onderwijsadvies
Geraadpleegd op 06-12-2024,
van https://wij-leren.nl/toetsing-in-het-basisonderwijs-karen-heij.php
Onderwijs en toetsing worden veelal in één adem genoemd, als zou het één niet zonder het ander kunnen. Zeker: als het goed is, kan toetsing onderwijs versterken. Maar soms blijken toetsen in de praktijk heel andere effecten te hebben dan aanvankelijk bedacht of voorzien. Dat is zeker het geval bij toetsing in het basisonderwijs, waar blijkt dat toetsing een brede ontwikkeling van kinderen en zicht op kwaliteit van onderwijs vooral in de weg staat.
De eindtoets is bedoeld om te bepalen wie aan het eind van het basisonderwijs naar welke vorm van vervolgonderwijs gaat. Wie bepaalt wie toelaatbaar is tot het vhmo (de voorloper van het huidige vwo) is al een meer dan vijftig jaar durend twistpunt. Moet die bal liggen bij het vervolgonderwijs, dat met de leerling verder moet, of juist bij het onderwijs waar het kind vandaan komt en waar men de leerling het beste kent?
Waar komt de eindtoets vandaan?
In 1965 werd bij wet vastgelegd dat alléén het oordeel van de toeleidende school niet langer voldoende is. Men vond dat nader onderzoek met behulp van toetsen nodig was. Dit bood ruimte voor de ontwikkeling van een toets, zodat een tweede, onafhankelijk gegeven voor selectie beschikbaar zou komen. Destijds werd gekozen voor toetsing van taal en rekenen, omdat taal en rekenen in ieder geval onderwerpen waren die met grote waarschijnlijkheid op alle scholen onderwezen werden. Er was destijds geen centraal curriculum met uitgewerkte einddoelen.
Om de toets eenduidig te kunnen nakijken met behulp van de computer, die net zijn intrede deed, werd gekozen voor het gebruik van uitsluitend meerkeuzevragen. Zo kwam een eerste versie van de eindtoets, de Amsterdamse Schooltoets, tot stand die in inhoud en opzet nog altijd veel overeenkomsten vertoont met de Centrale Eindtoets van nu.
Hoe werkt de eindtoets?
Op dit moment zijn er meerdere eindtoetsen waaruit scholen kunnen kiezen. De kaders voor de ontwikkelingen van deze eindtoetsen zijn echter vergelijkbaar. De scores op de onderdelen taal en rekenen worden nog altijd bij elkaar opgeteld om zo te komen tot één getal op basis waarvan de leerlingen geordend worden, van hoog naar laag scorend.
Om de waarde van de toets aan te tonen werd aanvankelijk onderzocht of de leerlingen die een vhmo-advies hadden gekregen, zich ook daadwerkelijk bij de 20% best scorenden bevonden. Want in de tijd van het ontstaan van de eindtoets was dat het percentage leerlingen dat een vhmo-advies kreeg in Amsterdam. Er bleek een overlap van zo’n 85% te zijn tussen de hoogst scorenden op de toets van destijds en degenen die een vhmo-advies hadden gekregen.
Met de komst van de Mammoetwet (vastgesteld in 1963 en in werking getreden op 1 augustus 1968) en verlenging van de leerplicht (in 1969 van 8 naar 9 jaar, in 1975 naar 10 jaar) veranderde het landschap van het voortgezet onderwijs. Er moest voor iedereen een plek in het voortgezet onderwijs worden gecreëerd. Daarmee was ook meer differentiatie in het schooladvies nodig. De komst van het vmbo, begin deze eeuw, zorgde opnieuw voor aanpassing van schooladviezen.
"De eindtoets zelf bleef in opzet en inhoud echter vrijwel gelijk."
Nog altijd geldt voor selectie dat de scores voor taal en rekenen worden opgeteld. Die gecombineerde score wordt tegenwoordig omgezet naar een score op een schaal van 501-550, wat zodanig gebeurt dat nog altijd 20% van de leerlingen een vwo-advies krijgt en de helft van de leerlingen een advies krijgt richting vmbo. Het kan dus per jaar verschillen hoe vaardig of kundig de groep is die naar het vwo gaat. En andersom: ook na het afgelopen schooljaar, waarin leerlingen door de coronapandemie niet of nauwelijks naar school zijn gegaan, is er nog altijd een groep van 20% hoogst scorenden.
Dit vergelijkend meten past bij een toets die primair gericht is op het jaarlijks selecteren van de – op de combinatie van taal- en rekenopgaven – best presterenden voor het vwo en het stabiel verdelen van de overige leerlingen over de overige vormen van onderwijs, die op hun beurt weer voorsorteren op verschillende vormen van beroeps- en wetenschappelijk onderwijs.
“Vergelijkend toetsen verwordt al snel tot een ordening van slim naar dom.”
Die focus op het zo goed mogelijk selecteren van de besten voor de hoogste vormen van vervolgonderwijs is met het verplichte gebruik van een leerlingvolgsysteem (LVS) verder vervroegd. Al vanaf begin groep 3 zijn scholen verplicht een LVS te gebruiken voor taal en rekenen. Het meest gebruikte LVS, dat van Cito, is net als de eindtoets gericht op het vergelijken van kinderen met elkaar. Kinderen worden geordend in percentielgroepen waarbij een score A staat voor de score die hoort bij de 20% best scorenden en E voor de score die hoort bij de 20% slechtst scorenden. Deze vergelijkende manier van meten zorgt weliswaar voor een ordening van leerlingen van laag naar hoog scorend, maar verwordt in de dagelijkse praktijk al snel tot een ordening van ‘goed’ naar ‘slecht’ of van ‘bovengemiddeld’ naar ‘ondergemiddeld’ en daarmee voor je het weet van ’slim’ naar ‘dom’. Vooral dat laatste heeft gevolgen.
Wat zijn de gevolgen van deze manier van toetsen
De LVS-scores vormen etiketjes die op kinderen geplakt worden en dat heeft gevolgen voor hoe leerkrachten en ouders naar de kinderen kijken, en kinderen ook naar zichzelf kijken. Die etikettering werkt als een selffulfilling prophecy: leerlingen én hun omgeving gaan zich ernaar gedragen. De uitkomst van de eindtoets is dan uiteindelijk voor de meesten de bevestiging van het beeld dat zich dan al stevig in hun hoofd heeft verankerd.
“Inclusiviteit staat haaks op een selectiegericht onderwijsmodel.”
Deze aanpak is wellicht effectief in het licht van een beoogd selectieproces en acceptatie van de uitkomsten door leerlingen en hun ouders, maar verhoudt zich slecht tot onderwijs waarmee men kansen wil bieden aan álle leerlingen, ongeacht hoe ze aan de start verschijnen. De verplichte combinatie van LVS en eindtoets maakt het lastig voor kinderen die vanuit een achterstandsituatie of met een andere taalachtergrond het onderwijs instromen. Zij moeten tijd en ruimte krijgen het been bij te trekken. Het voortdurend vergelijken van kinderen met elkaar belemmert dit, ook omdat de anderen niet stilstaan.
Bovendien biedt deze vergelijkende manier van meten maar weinig zicht op het al dan niet behalen van doelen die met onderwijs worden beoogd. Prestaties zijn afhankelijk van prestaties van andere leerlingen, niet van het wel of niet behalen van bepaalde doelen. En ook niet van ‘geschiktheid’.
De vergelijkende manier van meten heeft ook gevolgen voor prestaties van scholen en leerkrachten. Ook zij worden geordend en daarmee beoordeeld als boven- of ondergemiddeld. Dat is niet zozeer een kwaliteitsoordeel maar vooral een statistisch gegeven: hoe goed alle scholen ook zijn, er is altijd een zwakste tien procent. Deze manier van beoordelen onttrekt ook grote inspanningen én resultaten van individuele scholen en leerkrachten met individuele leerlingen aan het zicht. En dat frustreert.
“Ook leerkrachten en scholen worden beoordeeld als boven- of ondergemiddeld.”
Daarbij ‘dekt’ de eindtoets maar een beperkt deel van het curriculum, dat immers over veel meer gaat dan alleen taal en rekenen. Bij taal is er ook al veel meer dan alleen begrijpend lezen. Er is geen onderzoek waaruit blijkt dat schrijfvaardigheid minder belangrijk is, of spreekvaardigheid of luistervaardigheid. Dat wat met meerkeuzevragen bevraagd kan worden, is centraal gesteld in de toets, maar is daarmee niet het belangrijkst. Toch is dat niet wat we in onderwijs zien. Integendeel, het overgrote deel van de onderwijstijd gaat naar datgene wat in de eindtoets aan bod komt. De toets is zo de feitelijke bepaler van het curriculum geworden. En dat zien we ook terug in lesmethodes.
De toets bepaalt niet alleen in hoge mate wat er in de klas gebeurt en hoeveel tijd eraan wordt besteed, maar erger nog, de toets is ook de waarde en waardering gaan bepalen die aan begrijpend lezen en rekenen wordt toegekend. Andere kennis, vaardigheden, talenten en kwaliteiten van leerlingen raken zo niet alleen buiten beeld maar worden ook veel minder gewaardeerd. Ze lijken er niet toe te doen. Terwijl we weten dat voor succes in onderwijs, arbeidsmarkt en samenleving ook die andere aspecten buitengewoon relevant zijn en juist het verschil maken.
Met dit systeem van toetsen zijn we vooral gaan waarderen wat meetbaar gemaakt kan worden en niet zozeer wat van waarde is. De wens om in een klas te kunnen differentiëren lijkt op het eerste gezicht een sympathieke manier om kinderen het onderwijs te kunnen bieden dat bij hen past. Maar de toetsen van het LVS fungeren niet als diagnostisch instrument in het kader van ontwikkelen en leren. Ze worden vooral gebruikt om vanaf groep 3 te differentiëren om zo de selectie aan het eind van het basisonderwijs met toetsresultaten te kunnen onderbouwen, vooral ingegeven vanuit verantwoordingsperspectief richting derden.
Conclusie
Met de feitelijke praktijk van LVS-toetsen en eindtoets is een stelsel opgetuigd om kinderen in te delen in winnaars en verliezers. Daardoor worden zij in voortdurende concurrentie met elkaar geplaatst. Ons onderwijsmodel is daarmee vooral te typeren als een wedstrijdmodel. Dat verhoudt zich slecht tot onderwijs dat zegt inclusief te willen zijn. Inclusiviteit is gericht op het insluiten van iedereen en dat staat haaks op een op selectiegericht onderwijsmodel.
Hoe meer scholen en leerkrachten afgerekend worden op prestaties op basis van uitkomsten op vergelijkende metingen bedoeld voor selectie en betrekking hebbend op een smal deel van het curriculum, hoe kleiner de kans is dat inclusief onderwijs een succes kan worden voor alle leerlingen. Het wordt tijd om onder ogen te zien dat de huidige manieren van toetsen inclusief onderwijs onmogelijk maken.