Stagebeoordelingen: Hoe kunnen deze beter verlopen?
In 2016-2017 startten we een onderzoek naar pistes ter verbetering van stagebeoordelingen. Na een literatuurstudie werden vier opleidingen geselecteerd (i.e., PBKLO = Professionele Bachelors Kleuter- en Lager Onderwijs, VPK = Verpleegkunde, en AFI = Accountancy en Fiscaliteit). Voor elke opleiding werd de stagebeoordeling van het laatste jaar doorgelicht op zoek naar verbeteropties. Vervolgens werd telkens een onderzoeksdesign uitgewerkt voor het academiejaar 2017-2018. In de uitwerking van de designs probeerden we een belangrijke aanbeveling uit de literatuur voor ogen te houden: een goede stagebeoordeling dient naast een summatief aspect ook een formatief aspect te hebben.
Om te weten of verandering ook verbetering is, moesten we op zoek naar geschikte criteria. We kwamen uit bij het Competentie Assessment Wiel (Baartman et al., 2006; 2007) waarin een reeks kwaliteitscriteria voor beoordelingsprogramma’s naar voren geschoven worden. In 2016-2017 plande een onderzoeksteam van de UAntwerpen een interventie in het Flextraject van PBLO die aansloot bij onze doelstelling. Ideaal om de vragenlijst te testen die we opstelden om de kwaliteitscriteria te meten. Die doorstond de test vrij goed, wat toeliet uitspraken te doen over de interventie (i.e., D-PAC, een methode voor paarsgewijze beoordeling). Over het algemeen werd de interventie door begeleiders eerder neutraal en door studenten eerder negatief beoordeeld. In Voorstudie 2 bij tweedejaars VPK werd onze vragenlijst geoptimaliseerd. De stagebeoordeling werd er positief beoordeeld, al vonden studenten dat de beslissingen die worden genomen gebaseerd waren op een te beperkt aantal assessmentsituaties en beoordelaars.
In Studie 1 en 2, werd het aantal assessmentsituaties en beoordelaars verhoogd binnen een experimenteel design. In Studie 1 (in PBKO & PBLO) werden voor de helft van de studenten meer begeleiders ingeschakeld die ook vaker op lesbezoek gingen. In Studie 2 (in VPK) werden voor de helft van de studenten de medestudenten ingeschakeld via peer assessments. De effecten werden gemeten aan de hand van de eerder genoemde kwaliteitscriteria. Die werden gemeten op het niveau van de algemene beoordeling (= in de controlegroep en de experimentele groep) en op het niveau van de specifieke interventie (= in de experimentele groep). Tot slot vergeleken we de controlegroep en de experimentele groep ook in termen van Leereffect en Selectie. De bevraging in de experimentele groep leerde ons dat de interventies goed onthaald werden, maar uit de groepsvergelijkingen kwamen weinig effecten van de interventies aan het licht. Of toch minstens voor begeleiders. De studenten bleken geen voorstanders van peer assessment te zijn. In Studie 3 (in AFI) gooiden we het over een andere boeg. Via leergroepen probeerden we de studenten soft skills aan te leren en via een nieuw beoordelingsformulier probeerden we die mee in het eindoordeel te betrekken. Omwille van het geringe studentenaantal werden de kwaliteitscriteria enkel gemeten op niveau van de specifieke interventie. Voor Leereffect en Selectie werd een vergelijking gemaakt met het voorgaande jaar. Beide interventies werden goed onthaald door studenten en begeleiders. Op het gebied van Selectie waren er geen verschillen, maar de meerwaarde van de interventie op het Leereffect werd duidelijk doordat studenten meer competentiegroei rapporteerden. In de discussie staan we stil bij hoe het komt dat sommige interventies beter onthaald werden en meer effect hadden dan andere. We eindigen met een aantal aanbevelingen en beperkingen.
Duriez, B., Coppens, S., Heynderickx, T., & Verheyen, H. (2018). Stagebeoordelingen: Hoe kunnen deze beter verlopen? Antwerpen, Karel de Grote Hogeschool: Intern Rapport.