Referentiesets

3 | Waarom zijn referentiesets nodig?

Het is niet altijd mogelijk om leerlingen uit verschillende onderwijssectoren die hetzelfde referentieniveau moeten behalen dezelfde toets voor te leggen. Dit kan te maken hebben met de inhoud van de toetsen, maar ook met de geschiktheid van de opgaven voor een bepaalde groep.

Inhoud van toetsen
Het is denkbaar dat de inhoud van opgaven niet aansluit bij de belevingswereld van de leerlingen van alle onderwijssectoren. Denk bijvoorbeeld aan teksten in een taaltoets die gericht zijn op leerlingen in het basisonderwijs, waarschijnlijk zullen leerlingen in het mbo deze teksten minder interessant vinden. Daarnaast is het bijvoorbeeld onwenselijk om rekenopgaven die aansluiten bij de belevingswereld van een mbo-student elektrotechniek voor te leggen aan basisschoolleerlingen.

Bevoordeelde leerlingen
Een ander probleem dat kan optreden, is dat leerlingen uit de ene onderwijssector een vraag moeilijker vinden dan leerlingen uit een andere onderwijssector. Deze leerlingen hoeven niet minder vaardig te zijn, maar kunnen bijvoorbeeld gewend zijn met een bepaald type vraag om te gaan. Zo kan het voorkomen dat opgaven die we rangordenen op moeilijkheid, voor de ene onderwijssector anders geordend worden dan voor de andere.

In een vmbo-examen waarin het referentieniveau 2F getoetst wordt, kunnen opgaven voorkomen die ook deel uit maken van een centraal ontwikkeld examen 2F voor het mbo. Een probleem dat daarbij kan optreden, is dat studenten uit het mbo een vraag moeilijker vinden dan vmbo-leerlingen.
In hoofdstuk 2 Doorlopende toetslijnen is gesteld dat een context die bijzonder aansprekend is voor Wouter (vmbo-bb), dat niet hoeft te zijn voor Mark (mbo-3). Mark zou daardoor slechter kunnen scoren op deze vraag dan Wouter, terwijl Mark een hoger vaardigheidsniveau heeft dan Wouter.
Hoewel er overlap in de vragen kan zijn, zal een 2F-examen in het mbo dus (deels) uit andere opgaven bestaan dan een 2F-examen voor het vmbo. En een 2F-toets voor het primair onderwijs zal nog weer andere opgaven bevatten. Met name de contexten waarin de vragen gesteld worden, zullen daarbij verschillen, maar niet de vaardigheden die de kandidaten moeten demonstreren.

Voorbeeld
Een vraag naar de omtrek van een terrein kan gegoten worden in de context van een grasveldje waarop Martijn zijn pony wil laten grazen. Om te voorkomen dat de pony wegloopt, wil Martijn een hek plaatsen. Gevraagd: de lengte van het hek.

Deze context zal een leerling van groep 8 meer aanspreken dan student mbo-3 Mark. Omgekeerd zal een context over twee werknemers met een verschillend salaris die beide in verhouding dezelfde loonsverhoging krijgen voor Mark heel bekend zijn, maar wellicht minder bekend voor groep 8.
Bij dezelfde vraag naar de omtrek kan een andere context bedacht worden die Mark wel aanspreekt. Omgekeerd kan de vraag naar de verhoudingsgewijs zelfde stijging door een andere context ook toegankelijk gemaakt worden voor leerlingen uit groep 8.

Dat kandidaten uit de ene schoolsoort een vraag moeilijker vinden, hoeft dus niet te komen doordat zij minder vaardig zijn, maar kan bijvoorbeeld komen doordat zij niet gewend zijn om met een bepaald type vraag om te gaan. Zo kan het voorkomen dat opgaven die we sorteren op moeilijkheid, voor de ene onderwijssoort anders geordend worden dan voor de andere. Deze verschillende ordening kan er voor zorgen dat een toets bepaalde groepen onterecht bevoordeelt. Dit effect wordt Differential Item Functioning (DIF) genoemd.

Prestatiestandaard en referentiesets
Het is belangrijk dat de prestatiestandaard die vastgelegd wordt om vast te stellen of een leerling een bepaald referentieniveau gehaald heeft, een eerlijke standaard voor alle groepen is. We moeten dus voorkomen dat de prestatiestandaard bepaalde groepen leerlingen bevoordeelt. Wanneer we de prestatiestandaard vastleggen op basis van één toets is het echter waarschijnlijk dat de leerlingen voor wie de toets gemaakt is hier voordeel van hebben ten opzichte van leerlingen uit andere groepen. Om (centrale) toetsen en examens te maken die passend zijn voor de doelgroep, maar tegelijkertijd ook een prestatiestandaard hanteren die gelijk is voor alle groepen, zijn referentiesets ontwikkeld.

>> Lees verder: 4 | Wat zijn referentiesets?


Datum: 19 augustus 2016

Meer informatie

Wikipedia:
Differential Item Functioning