11
1 Teachers’s room: 488437 Toetsen, voorkennis en leeropbrengsten Stephan Ramaekers, PhD Collegereeks thema Didactiek 20 november 2015 Hoe stel ik de leeropbrengsten van mijn leerlingen vast? Hoe zie ik of ze voldoende progressie maken? In hoeverre beïnvloedt toetsing het leren? Waar moet een goede toets aan voldoen? Etc.   Dit college 1. Toetsen: waarover hebben we het? Waarom doen we het? 2. Waarom is toetsen moeilijk? Welke eisen worden gesteld? 3. Toetsen van leren, toetsen voor leren, toetsen als leren 4. Hoe maak je toetsen? Hoe kun je de kwaliteit borgen? werkobservatie Multiple choice examen PTA Proefwerk DTT opdracht feedback tentamen werkstuk oefentoets Centraal examen simulatie Mondelinge overhoring ERK-toetsen Onderlinge beoordeling CITO-toets vaardighedentest instaptoets Peerfeedback Open-boek toetsen beoordeling Classroom assessment TIA RTTI a. Om het bereikte niveau bij leerlingen vast te stellen b. Om leerlingen feedback te (kunnen) geven c. Om ouders / collega’s te informeren d. Om leerlingen aan het werk te zetten e. Om effectiviteit van eigen onderwijs te evalueren Waarom toetsen? Functies Beginniveau / voorkennis bepalen Tussentijds: hoe verder? Vaststellen: leerresultaten bereikt? Beslissen over vervolgtraject Evaluatie: effectiviteit van lessen?

College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

1

Teachers’s room: 488437

Toetsen, voorkennis en leeropbrengsten

Stephan Ramaekers, PhD

Collegereeks thema Didactiek

20 november 2015

Hoe stel ik de leeropbrengsten van mijn leerlingen vast? Hoe zie ik of ze voldoende progressie maken? In hoeverre beïnvloedt toetsing 

het leren? Waar moet een goede toets aan voldoen? Etc.   

Dit college

1. Toetsen: waarover hebben we het? Waarom doen we het?

2. Waarom is toetsen moeilijk? Welke eisen worden gesteld?

3. Toetsen van leren, toetsen voor leren, toetsen als leren

4. Hoe maak je toetsen? Hoe kun je de kwaliteit borgen?

werkobservatie

Multiple choice

examen

PTAProefwerk

DTT

opdracht

feedback

tentamen

werkstuk

oefentoets

Centraalexamen

simulatie

Mondelinge overhoring

ERK-toetsen

Onderlinge beoordeling

CITO-toets

vaardighedentest

instaptoets

Peerfeedback

Open-boek toetsen

beoordeling

Classroom assessment

TIA

RTTI

a. Om het bereikte niveau bij leerlingen vast te stellen

b. Om leerlingen feedback te (kunnen) geven

c. Om ouders / collega’s te informeren

d. Om leerlingen aan het werk te zetten

e. Om effectiviteit van eigen onderwijs te evalueren

Waarom toetsen? Functies

• Beginniveau / voorkennis bepalen

• Tussentijds: hoe verder?

• Vaststellen: leerresultaten bereikt?

• Beslissen over vervolgtraject

• Evaluatie: effectiviteit van lessen?

Page 2: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

2

Functies van toetsing

• Formatief ‐ summatief

• Diagnostisch ‐ voorspellend

• Stimulerend ‐ concluderend

• Selecterend – adviserend

• Etc.

“Als ‘goed onderwijs’ – in de zin, dat je er veel van leert – niet gepaard gaat 

met hogere cijfers en minder onvoldoendes, dan is het slecht onderwijs”. (de 

Groot, 1966)

“Als leerling c.q. student kun je gebrekkig onderwijs vaak wél maar 

gebrekkige toetsen meestal niet ontwijken”. (Boud, 1995)

“Prestaties van leerlingen hebben pas waarde als die uitstijgen boven het 

schoolse leven of het halen van goede cijfers voor triviale of betekenisloze 

kennis”. (Newmann, 1996)  

“Toetsing heeft een diepgaande invloed op wat, hoe en hoe lang studenten 

studeren”. (Dochy et al, 2001)

Wat maakt toetsen gecompliceerd?

Toetsen; onvolkomen meetinstrumenten

Menselijke bekwaamheden; moeilijk te meten

toetsen met grote consequenties

Page 3: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

3

toetsen met kleine consequenties

Toetsing stuurt het leren

Toetsing stuurt het leren

o.a. Thomas & Bain 1984; Ramsen 1992; Scouller & Prosser 1994; Scouller

1995, 1996, 1998; Scouller & Chapman 1999; Biggs 1999, 2011; Dochy 2003, 

2011, 2014, etc. Voorbeelden:

o Toetsvormen die leiden tot stress en die het herinneren van feiten 

benadrukken leiden tot een oppervlakkige studieaanpak (Ramsden, 1992). 

o Strategisch leergedrag gericht door verwachtingen over: type toets, 

perceptie van wat docent belangrijk vindt, en inschatting van benodigde 

tijd voor leerstof (Dochy, 2014)

o Bij MC meer oppervlakkig leren; bij OV/essays meer diepgaand leren 

(gepercipieerd als het meten van hogere niveaus)

Meervoudige effecten van toetsen (Gielen, Dochy & Dierick, 2003)

• Post‐ assessment effect: leren op basis van feedback n.a.v. 

de evaluatie

• Pre‐assessment effect: anticiperen op verwachte toetseisen 

en ‐vorm (Scouller)

• True (‘ ware’)‐assessment effect: leren tijdens het uitvoeren 

van evaluatie/assessment taken

Verklaringen voor invloed van toetsen op leerresultaten

• Time on task is vergroot

• De toetsen genereren juiste leeractiviteiten

• Goede toetsing geeft snelle feedback: “To get better in 

playing darts, you have to be able to see where the darts 

land”.

• Internalisatie van de criteria die kwaliteit bepalen. 

• Geoefend raken in het toetsformat. 

Uit college 2 (doelen, werkvormen, etc.)

Page 4: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

4

Wat maakt toetsen gecompliceerd?

• Menselijke capaciteiten zijn moeilijk te meten

• Toetsen zijn onvolkomen meetinstrumenten

• Toetsresultaten kunnen grote consequenties hebben

• Toetsen beïnvloeden wat en hoe leerlingen leren

• We stellen het samenstellen van toetsen vaak uit

“Toetsgericht leren is minder problematisch als toetsen nauw aansluiten bij de leerdoelen”

Uit college 2 (doelen, werkvormen, etc.)

a. Inhoudelijk juiste vragen /opgaves

b. Eenduidige uitslag / resultaten

c. Eerlijk / objectief

d. Gemakkelijk / goedkoop

e. Zet leerlingen aan tot leren

Kwaliteitseisen/ ‐aspecten

Validiteit

Betrouw‐baarheid

Kosten

Impact

Transparantie acceptatie

U = (Vg x Bg x Ig x Ag) /Kg

V= validiteitB= betrouwbaarheidI= impact op onderwijsA= acceptatieK= kosten(g= gewogen)

Validiteit: inhoud

Page 5: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

5

Validiteit: inhoud

Validiteit: inhoud

• Kritisch denken

• Vraagstukken / problemen oplossen

• Een onderbouwd oordeel …

• oorspronkelijkheid (bv. in werkstuk)

• Burgerschap

• Morele ontwikkeling

• Etc.

Validiteit: inhoud

Taxonomie Bloom (Krathwohl, 2002)

Niveau: voorbeeld overeenstemming

30,0%

50,0%

10,0% 10,0%

0,0% 0,0%

44,3%

38,3%

15,7%

0,9% 0,9% 0,0%0%

20%

40%

60%

Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren

Doelen Vragen

Niveau: voorbeeld discrepantie

0,0%

33,3%

20,0%

13,3%

20,0%

13,3%

41,0%

18,4%

29,2%

11,5%

0,0% 0,0%0%

20%

40%

60%

Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren

Doelen Vragen

Page 6: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

6

Betrouwbaarheid

Toetsen; betrouwbare resultaten?

Wet van Posthumus: bij het 

beoordelen van proefwerken 

en tentamens in het 

onderwijs krijgt standaard 

een kwart van de leerlingen 

een onvoldoende, de helft 

een middelmatig cijfer en 

een kwart een goed cijfer, 

onafhankelijk van het niveau 

van het geleverde werk. 

(Kees Postumus, 1940)

a. Vragen rechtstreeks ontleend aan boek

b. Gesloten toetsvorm (= eenduidig)

c. Eerlijk in beoordeling / blind nakijken

d. Objectief

e. Afgestemd met collega’s

Taxonomie Bloom (Krathwohl, 2002)

Niet‐consistente beslissingen als functie van betrouwbaarheid en % onvoldoende

% gezakt

Betrouwbaarheid (α)

0.50 0.60 0.70 0.80 1.00

10 14 12 11 9 0

20 23 20 17 14 0

30 29 25 22 18 0

40 32 29 24 20 0

50 33 30 25 20 0

• Bij schriftelijke toetsen zoals Multiple Choice: interne 

consistentie (Cronbach’s alpha) en afgeleiden

• Bij werkstukken: via beoordeling door meerdere personen en 

bepaling van interbeoordelaars betrouwbaarheid

• Bij complexere vaardigheden en competenties: door vaak 

herhaalde beoordelingen (test‐hertest betrouwbaarheid)   

Betrouwbaarheid

Page 7: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

7

beginner geoefend gevorderd competent

criteria

1

2

3

4

…..

Rubrics: criteria en niveaus

Rubrics: criteria en niveaus

Optimalisatieprobleem

.40.30

.15

0

.50.60

.70

.80.90

1.0

.40.30

.15

0

.50.60

.70

.80

.90

1.0

.40.30

.15

0

.50.60

.70

.80

.90

1.0

.40.30

.15

0

.50.60

.70

.80.90

1.0

Betrouwbaar /valide

Uitvoerbaar /kostenimpact studiegedrag

Transparant /fair

Samengevat op hoofdlijnen

• goede toetsing is gericht op totaalbeeld

• enkelvoudige toetsen zijn onvolkomen meetinstrumenten

• inhoud van de toets blijkt bepalender voor resultaten dan vorm

• betrouwbaarheid ≠ objectiviteit

• toetsing stuurt het leren in sterke mate

• eenvoudige kwaliteitscontrole heeft al sterk effect

Veel succes!

Page 8: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

8

vervolg

1. Toetsen: waarover hebben we het? Waarom doen we het?

2. Waarom is toetsen moeilijk? Welke eisen worden gesteld?

3. Toetsen van leren, toetsen voorleren, toetsen als leren

4. Hoe maak je toetsen? Hoe kun je de kwaliteit borgen?

Ontwikkelingen in perspectief

• Toetsen van leren

• Toetsen voor leren 

• Toetsen als leren

Alignment (Biggs)

Afstemming van onderwijs en toetsing, via de doelen

Ontwikkelingsgericht toetsen

• Leerling volgsysteem / leerlingprofielen

• Diagnostische tussentoets

• RTTI‐methoden

• Portfolio

• Adaptief toetsen

• Frequent formatief toetsen

Voorbeelden op programmaniveau

Progressie in niveaus

Page 9: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

9

Wanneer? in de klas

Hoofdvragen toetsing

1. Waarom? (Functie)

2. Wat? 

3. Wanneer?

4. Hoe? 

5. Wie beoordeelt? 

Ontwerpen

Construeren

Controleren

AfnemenNakijken

Analyseren

Normeren

toetscyclus

Ontwerpen    

‐ toetsmatrijs

‐ procedure

‐ normering

Construeren‐ Keuze Vragen / opdracht ‐Antwoordmodel / rubrics

‐ tijdens onderwijs‐meerdere afnames

Controleren

‐ collegae  

‐ ouderejaars, leken

‐ analyse vooraf

Afnemen

‐ instructie

‐ condities

‐ tijd

Nakijken

‐Nakijkmodel

‐ nakijkprocedure 

Analyseren‐ verwachte vs gebleken 

kwaliteit‐ evt. aanpassen items, 

sleutel, cesuur

Normeren‐ resultaten

‐ itemverbetering– invoer vragenbank

kwaliteit borgen

Voorbeeld toetsmatrijs

DoelenSchriftelijke toets Totaal lesoefening Grote opdrachten

Onderwerp kennis Inzicht toepassing

A 4 1 5 1

B 2 2 2 6 2 1

C 2 4 6 2

D 2 1 3 2

Totaal 8 5 7 20 6 2

Cijfer‐aandeel

50% 30% 20%

Voorbeeld toetsmatrijs

Page 10: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

10

Taxonomie Bloom (Krathwohl, 2002)

Van niveau naar activiteiten

Welke vormen gebruik jij?

Knows

Shows how

Knows how

Does

format: kennis georiënteerdMethode: schriftelijk, open, computer-based, mondeling

format: scenario, simulatie, oefeningmethode: schriftelijk, opdrachten, mondeling, computer-based

format: hands-on standaard (scenario) of simulatiemethode: directe observatie, checklists, beoordelingsschalen

format: beoordeling dagelijkse praktijk methode: directe observatie, checklijsten, beoordelingsschalen (rubrics), narratieven

Keuze van toetsvormen (Miller)

Open versus gesloten toetsvormen

Gesloten vragen Open vragen

constructietijd Nakijktijd

Leesvaardigheid Schrijf‐ / formuleervaardigheid

Breedte toetsing Diepte toetsing

Objectieve scoring Subjectieve scoring

Anonimiteit Performance

Gokken Bluffen

Page 11: College 2 toetsing LO nov2015.ppt - Universiteit Utrechtdaeme101/College did1 toetsing LO... · Kennen Begrijpen Toepassen Analyseren Synthetiseren Evalueren Doelen Vragen Niveau:

11

Vraag: Wat is een verkavelingspatroon? En geef daarvan twee 

voorbeelden

Antwoord 1: Een bepaalde regelmaat in kavelvormen. 

Voorbeelden: strookverkaveling, blokverkaveling

Antwoord 2: De wijze waarop een gebied verkaveld is. 

Voorbeelden: ‐ regelmatig, ‐ onregelmatig

Antwoord 3: De vorm en verdeling van kavels over een 

gebied. Voorbeelden: – rationeel bepaald, – door erfrecht 

bepaald

constructproblemen

Context/intro: Uit bijgaand artikel blijkt dat Duisenberg

voorstander was van het verlagen van de reële arbeidskosten

t.o.v. rendementen. Duisenberg maakt daarbij gebruik van de

zgn. jaargangentheorie.

Vraag/opdracht: Laat m.b.t. het jaargangenmodel van het CPB

zien dat de verlaging van de reële arbeidskosten kan leiden tot

meer werkgelegenheid. Maak daarbij gebruik van een grafische

weergave en de elementen: economische veroudering,

arbeidscoëfficiënt en economische levensduur

Voorbeeld essay

Aantal deelnemers 90 Cronbach's alfa 0.920Aantal vragen 9 Standaardmeetfout 4.95

totaal vr 1 vr 2 vr 3 vr 4 vr 5 vr 6 vr 7 vr 8 vr 9

maximum score 74.27 8.88 9.5 9.5 9 10 9 7.5 9 8minimum score 2 0 0 0 0 0 0 0 0 0moeilijksheidsgraad 0.43 0.43 0.41 0.48 0.43 0.33 0.41 0.39 0.37 0.61

item-totaal correlatie (Rit) 0.71 0.73 0.73 0.74 0.74 0.75 0.84 0.83 0.40item-rest correlatie (Rir) 0.63 0.64 0.66 0.68 0.62 0.68 0.80 0.78 0.31variantie 305.76 5.27 7.58 6.35 4.68 12.50 6.22 4.47 5.21 3.45standaard deviatie 17.49 2.30 2.75 2.52 2.16 3.54 2.49 2.11 2.28 1.86

slaagpercentage 33%, hoogste score 7,4

Toetsanalyse open vragen

Cesuurbepaling

Absoluut of relatief ? 

Beoordelen en toetsen op programmaniveau

a. Bewust geplande combinaties en reeksen van 

beoordelingsmomenten,

b. Waardoor de beperkingen van enkelvoudige toetsen 

worden opgeheven,

c. Gericht op ontwikkeling: samenhang, opbouw en 

accumulatie (constructive alignment)

d. En het bereiken van het niveau van basiscompetentie

e. Met als functies: monitoring van voortgang in niveau en 

zorgen voor feedback / feedforward