Taaltoetsen voor taalzwakke leerlingen in het primair onderwijs Erik van Schooten, Ed Smeets & Geert Driessen

  • Published on
    22-Apr-2015

  • View
    1.058

  • Download
    3

Embed Size (px)

DESCRIPTION

 

Transcript

<ul><li> 1. Taaltoetsen voor taalzwakke leerlingen in het primair onderwijs E. van Schooten1 E. Smeets2 G. Driessen2 1 SCO-Kohnstamm Instituut, Universiteit van Amsterdam 2 ITS, Radboud Universiteit Nijmegen </li> <li> 2. CIP-GEGEVENS KONINKLIJKE BIBLIOTHEEK, DEN HAAG Schooten, E. van, Smeets, E., Driessen, G. Taaltoetsen voor taalzwakke leerlingen in het primair onderwijs. E. van Schooten, Amsterdam : SCO-Kohnstamm Instituut van de Faculteit der Maatschappij- en Gedragswetenschappen, Universiteit van Amsterdam (SCO-rapport nr. 771 projectnummer 40077), E. Smeets &amp; G. Driessen, Nijmegen: ITS van de Radboud Universiteit Nijmegen. ISBN 978-90-6813-826-9 Alle rechten voorbehouden. Niets uit deze uitgave mag worden verveelvoudigd, opgeslagen in een geautomatiseerd gegevensbestand, of openbaar gemaakt, in enige vorm of op enige wijze, hetzij elektronisch, mechanisch, door fotokopien, opnamen, of op enige manier, zonder voorafgaande schriftelijke toestemming van de uitgever. All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or transmitted, in any form or by any means, electronic, mechanical, photocopying, or otherwise, without the prior written permission of the publisher. Uitgave en verspreiding: SCO-Kohnstamm Instituut Nieuwe Prinsengracht 130, Postbus 94208, 1090 GE Amsterdam tel.: 020-525 1201 http://www.sco-kohnstamminstituut.uva.nl Copyright SCO-Kohnstamm Instituut, 2007 </li> <li> 3. Inhoudsopgave Voorwoord Managementsamenvatting 1 1.1 Aanleiding.................................................................................................1 Probleemstelling en onderzoeksvragen......................................................1 2 2.1 2.2 2.3 2.4 Opzet van het onderzoek .........................................................................5 Keuze van de te evalueren taaltoetsen ......................................................5 Afnamedesign ............................................................................................9 Steekproefkader .......................................................................................10 Afnameprocedures ...................................................................................13 3 3.1 3.2 Analyses ..................................................................................................15 Kwantitatieve analyses.............................................................................15 Kwalitatieve analyses...............................................................................19 4 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 Resultaten ...............................................................................................21 Steekproeftrekking en respons .................................................................21 Afname van de toetsen.............................................................................25 Aantallen afgenomen toetsen ...................................................................27 Achtergrondkenmerken van de leerlingen ...............................................29 De betrouwbaarheid van de (sub)toetsen .................................................32 Validiteit van de (sub)toetsen ..................................................................41 Selectie van leerlingen met de laagste taalvaardigheid............................78 Verschil in afnamekwaliteit testleiders en leerkrachten.........................142 Afnamegemak ........................................................................................147 Oordelen schoolleiders over toetsen van jonge leerlingen.....................158 Praktische aspecten van de toetsing van taalvaardigheid.......................163 </li> <li> 4. 5 Eindconclusies ......................................................................................171 6 Samenvatting ........................................................................................181 Literatuur ..........................................................................................................195 Appendix </li> <li> 5. Voorwoord In het voorliggende rapport wordt verslag gedaan van een onderzoek naar de kwaliteit van taaltoetsen voor het meten van taalvaardigheid bij leerlingen in groep n en twee van het basisonderwijs. Het onderzoek is aangevraagd en gefinancierd door het Ministerie van OCW en gezamenlijk uitgevoerd door twee onderzoeksinstituten, het ITS van de Radboud Universiteit en het SCOKohnstamm Instituut van de Universiteit van Amsterdam. Hoewel gedurende het onderzoek regelmatig is overlegd tussen de auteurs over aanpak, interpretatie van resultaten en rapportage, is wel aan te geven welk instituut hoofdverantwoordelijk was voor onderscheiden delen van de studie en het rapport. De data zijn verzameld door het ITS en de analyses zijn verricht door het SCO-Kohnstamm Instituut, behalve de analyses gerapporteerd in paragraaf 4.1 tot en met 4.4 en de analyses gerapporteerd in tabel 77. De dataverzameling is gecordineerd door Hans Versteegen van het ITS en voor de individuele toetsafnamen op de scholen zijn testleiders van het ITS ingezet. De paragrafen 4.1 tot en met 4.4, een deel van 4.10 en paragraaf 4.11 zijn geschreven door het ITS, de overige delen van het rapport zijn geschreven door het SCO-Kohnstamm Instituut. </li> <li> 6. Taaltoetsen voor taalzwakke leerlingen in het primair onderwijs </li> <li> 7. Managementsamenvatting Aanleiding Het SCO-Kohnstamm Instituut en het ITS zijn door het ministerie van OCW verzocht om een onderzoek te doen naar de geschiktheid van taaltoetsen voor het identificeren van leerlingen met een taalachterstand bij aanvang van het basisonderwijs. Daarbij werd gevraagd speciale aandacht te besteden aan de geschiktheid voor het toetsen van de meest taalzwakke leerlingen. Onderzoeksvragen Het onderzoek moet antwoord geven op de vraag hoe de toetsing ter bepaling van taalachterstanden bij jonge kinderen, dat wil zeggen kinderen in groep n en twee van de basisschool, het best kan worden uitgevoerd. Na overleg met de opdrachtgever zijn voor dit onderzoek de volgende onderzoeksvragen geformuleerd: 1) Zijn er deugdelijke taaltoetsen voor het meten van de taalvaardigheid van leerlingen in groep n en twee van het basisonderwijs? Welke taaltoetsen of onderdelen daarvan zijn het meest geschikt om de in het Nederlands minst taalvaardige leerlingen te oormerken? Welk type leerlingen kan met behulp van deze toetsen worden geselecteerd? 2) Indien er voor het hierboven genoemde doel geschikte toetsen zijn, hoe kan de taaltoetsing dan in de praktijk het best worden georganiseerd, wat zijn de kosten van grootschalige invoering in groep n en twee van het basisonderwijs en wat is de administratieve en organisatorische belasting voor de school bij het gebruik van deze toetsen? 3) Zijn deze taaltoetsen geschikt bij gebruik voor diagnostische doeleinden door leerkrachten? Gevalueerde toetsen Op grond van verschillende criteria is gekozen voor het evalueren van (delen van) vier verschillende taaltoetsen: van de toets Taal voor Kleuters het onderdeel passieve woordenschat (TvK), de Peabody, die eveneens passieve woordenschat meet, van de Taaltoets Alle Kinderen (TAK) de onderdelen passieve woordenschat, klankarticulatie en klankonderscheiding en de gehele OBIS (Onderbouw Informatiesysteem) die naast passieve woordenschat, klankarticulatie en klankon- </li> <li> 8. Taaltoetsen voor taalzwakke leerlingen in het primair onderwijs derscheiding nog dertien andere subtoetsen kent, waarvan zes bedoeld als taaltoetsen en zeven als rekentoetsen. Conclusies De belangrijkste conclusies van het onderzoek zijn: De verschillende (sub)toetsen blijken voor leerlingen van vier tot acht jaar oud over het algemeen voldoende systematische variatie te bevatten of anders gezegd, een niet te grote proportie ruis te vertonen. Elk van de (sub)toetsen blijkt op zich in voldoende mate n vaardigheid te meten om somscores over de toetsen te rechtvaardigen.Hiermee is nog niet zeker dat de (sub)toetsen de vaardigheden meten waarvoor ze bedoeld zijn, maar wel dat de vragen behorend bij n (sub)toets in voldoende mate dezelfde vaardigheid meten. In andere woorden, de mate van willekeurige variatie in de scores overschrijdt voor vrijwel alle (sub)toetsen niet de algemeen geldende methodologische normen. De stabiliteit van de (sub)toetsen is minder goed. Hiermee bedoelen we de mate waarin de (sub)toetsen bij herhaalde afname gelijke resultaten per getoetste leerling opleveren. Acht van de 21 (sub)toetsen scoren onvoldoende volgens de algemeen geldende methodologische normen voor toetsing op individueel niveau. Taal voor Kleuters en de OBIS subtoetsen doen het hier iets beter dan de subtoetsen van de Taaltoets Alle Kinderen en de Peabody. De stabiliteit van de (sub)toetsen in het oormerken van de 25% minst taalvaardige leerlingen is alleen voldoende voor de TvK en voor de OBIS-subtoetsen passieve woordenschat, klankarticulatie, kennis van letters en kennis van getallen. Als we nagaan in hoeverre verschillende (sub)toetsen overeenstemmen in het oormerken van de 25% slechtst presterende leerlingen, dan blijken de (sub)toetsen hierin flink te verschillen. Het maakt dus veel uit welke (sub)toets men kiest om de zwakst taalvaardige leerlingen te selecteren. Uit de samenhang tussen (sub)toetsscores en de oude indeling naar leerlinggewicht1, blijkt dat de (sub)toetsen niet erg hoog samenhangen met 1 De gewichtenregeling is de basis voor de financiering van basisscholen in het kader van het onderwijsachterstandenbeleid. De hoogte van het leerlinggewicht onder de oude gewichtenregeling was o.a. afhankelijk van het opleidingsniveau en de etnische afkomst van ouders. Onder de huidige regeling is het leerlinggewicht alleen afhankelijk van het opleidingsniveau van ouders. </li> <li> 9. Managementsamenvatting deze indeling. Ook de indeling van leerlingen naar of ze een vreemde taal spreken thuis dan wel Nederlands hangt niet erg hoog met de toetsscores samen. Duidelijk is dat een belangrijk deel van de leerlingen die voorheen het hoogste gewicht kregen (allochtoon van lage sociaal economische status) niet de minst taalvaardige leerlingen zijn; Er is een forse partijdigheid geconstateerd in de (sub)toetsscores, wat wijst op een probleem dat nader onderzocht moet worden om zicht te krijgen op de vraag wat de consequenties zijn voor de inzetbaarheid van de (sub)toetsen bij jonge leerlingen, bij leerlingen die het Nederlands niet als moedertaal hebben en bij leerlingen uit verschillende sociaaleconomische milieus. Duidelijk is dat de (sub)toetsen in de onderscheiden groepen niet alleen op een verschillende schaal (thuistaal en leeftijd), maar zelfs ongelijke vaardigheden meten (thuistaal, leerlinggewicht en leeftijd). Schaalverschil betekent dat leerlingen van gelijke vaardigheid, maar behorend bij verschillende groepen, ongelijke scores krijgen. Deze schaalverschillen belopen een halve tot een hele standaarddeviatie, wat veel is. Het meten van verschillende vaardigheden is overigens nog veel vervelender. Bij gevonden verschil in schaal zou men kunnen kiezen om (sub)toetsen te normeren per groep. Daar er echter in de voornoemde groepen verschillende vaardigheden gemeten worden, is gebruik van de (sub)toetsen over deze groepen heen niet te verdedigen. Partijdigheid kan getoetst worden aan de hand van een strenge en een coulante vorm van toetsing. De hierboven beschreven partijdigheid is aangetoond met de strenge toets. Bij gebruik van de coulante vorm van toetsing, vinden we dat alleen de partijdigheid naar leeftijd geschonden blijft. De resultaten laten zien dat ook bij coulante toetsing de in het onderzoek onderzochte (sub)toetsen bij leerlingen respectievelijk jonger en ouder dan zes jaar ongelijke aspecten van taalvaardigheid meten. Om meer duidelijkheid te krijgen over de mogelijke oorzaak van de gevonden partijdigheid naar leeftijd, zijn nadere analyses verricht. Het blijkt dat de gehanteerde meetmethode (papier versus p.c.) niet verantwoordelijk is voor de gevonden partijdigheid. Wel blijkt dat het model dat weergeeft welke aspecten van taalvaardigheid door de verschillende (sub)toetsen gemeten wordt, zeer goed past bij leerlingen ouder dan zes en relatief slecht bij de leerlingen jonger dan zes. De conclusie luidt dat, zelfs als we uitgaan van de coulante vorm van toetsing, is gebleken dat de (sub)toetsen niet bij </li> <li> 10. Taaltoetsen voor taalzwakke leerlingen in het primair onderwijs leerlingen van vier tot zes jaar afgenomen moeten worden als de scores consequenties hebben op individueel niveau. Het vooraf selecteren van leerlingen op grond van leerlinggewicht, sekse, thuistaal en het oordeel van de leerkracht over de taalvaardigheid Nederlands van de leerling, om zo bij slechts een deel van de leerlingen taaltoetsen af te nemen en op een efficintere wijze de 25% slechtst presterende leerlingen te detecteren, is niet aan te raden. De voorspellende kracht van de genoemde variabelen blijkt relatief gering. Om na te gaan hoe goed de voorspellende waarde van de toetsen is voor later presteren, is een meting van het taalvaardigheidniveau van dezelfde leerlingen in groep drie en vier nodig. Zou men besluiten tot deze longitudinale dataverzameling, dan kan tevens nagegaan worden in hoeverre de taalscores schools presteren voorspellen en of de gevonden partijdigheid bij oudere leerlingen vermindert. Gegeven de uitstekende modelfit bij leerlingen van zes tot acht jaar lijkt dit voor partijdigheid naar leeftijd zeer waarschijnlijk. Of de andere gevonden partijdigheid leeftijdafhankelijk is, is een open vraag. Overigens bleek deze andere partijdigheid bij coulante toetsing geen probleem....</li></ul>