56
Enkele oplossingen Oefenboek Statistiek WIP Pagina 43 oefening 16 : Bij de schedelomtrek is je meeteenheid arbitrair maar het nulpunt vast. Je hebt namelijk geen omtrek bij een omtrek van 0 , maar kan de omtrek in centimeter, meter, kilometer, ... uitdrukken. Vandaar de verhoudingsschaal (meeteenheid arbitrair en nulpunt vast) Pagina 44 oefening 23: als een transformatie wel heeft beïnvloedt dan betekent dat er iets niet zou kloppen met die schalen. Eb iedere schaal heeft zo zijn transformatie zoals ordinale dat het strikt monotoon stijgend is. In deze tabel klopt dat want als het in de 1ste rij bijvoorbeeld 24 is en dan 10 dus men gaat ban een groter getal naar een kleiner. Dan moet dat in de tweede ook en dat klopt want van 35 naar 7 is ook van groter naar kleiner. Wat dus betekent dat die transformatie geen invloed heeft gehad want het klopt. Oké dus dan moet ge gaan kijken waarbij dat het niet klopt, die geordende daar moeten we niet naar kijken want die hebben we nie gezien haha. De transformatie van een intervalschaal in de eerste rij zou zijn: 24-10 = 14 en 56-40= 16 Dus 14/16 En als ge aan de andere kant net hetzelfde doet met de overeenkomstige Getallen. Komt ge het zelfde uit, dus da klopt en die transformatie heeft geen invloed. De verhouding kijkt ge na door te zien hoe ge van 24 naar 35 geraakt en dat is maal 1,458...En dan moet ge gaan kijken of dat ook zo is bij 10 en 7. En das duidelijk niet zo, dus die transformatie heeft wel invloed. En om de transformatie van absolute na te gaan is het denk ik gewoon zo dat als je in de eerste rij 24 hebt staan dat in de tweede rij ook 24 zou moeten staan En dat is hier ook niet want in de eerste rij staan andere getallen als in de tweede. P.S. Ah ja en bij de verhouding best u getallen in een orde zetten dan alleen komt ge op strikt monotoon stijgend Pagina 45 oefening 27 : Waarom geen ordinale schaal voorbeeld : een correct voorbeeld is -5 en 4 --> allebei tot de macht 4 krijg je respectievelijk 25 (want -5*-5 25) en 16. Hier blijft de rangorde niet behouden

pedagogischekringleuven.files.wordpress.com · Web viewDan bereken je hiervan het geometrische gemiddelde --> dan krijg je als y-waarden : 2, 4 , 8, 16 en 32 en dan bereken je daarvan

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Enkele oplossingen Oefenboek Statistiek WIP

Pagina 43 oefening 16 : Bij de schedelomtrek is je meeteenheid arbitrair maar het nulpunt vast. Je hebt namelijk geen omtrek bij een omtrek van 0 , maar kan de omtrek in centimeter, meter, kilometer, ... uitdrukken.Vandaar de verhoudingsschaal (meeteenheid arbitrair en nulpunt vast)

Pagina 44 oefening 23:  als een transformatie wel heeft beïnvloedt dan betekent dat er iets niet zou kloppen met die schalen. Eb iedere schaal heeft zo zijn transformatie zoals ordinale dat het strikt monotoon stijgend is. In deze tabel klopt dat want als het in de 1ste rij bijvoorbeeld 24 is en dan 10 dus men gaat ban een groter getal naar een kleiner. Dan moet dat in de tweede ook en dat klopt want van 35 naar 7 is ook van groter naar kleiner. Wat dus betekent dat die transformatie geen invloed heeft gehad want het klopt. Oké dus dan moet ge gaan kijken waarbij dat het niet klopt, die geordende daar moeten we niet naar kijken want die hebben we nie gezien haha. De transformatie van een intervalschaal in de eerste rij zou zijn: 24-10 = 14 en 56-40= 16 Dus 14/16 En als ge aan de andere kant net hetzelfde doet met de overeenkomstige Getallen. Komt ge het zelfde uit, dus da klopt en die transformatie heeft geen invloed. De verhouding kijkt ge na door te zien hoe ge van 24 naar 35 geraakt en dat is maal 1,458...En dan moet ge gaan kijken of dat ook zo is bij 10 en 7. En das duidelijk niet zo, dus die transformatie heeft wel invloed. En om de transformatie van absolute na te gaan is het denk ik gewoon zo dat als je in de eerste rij 24 hebt staan dat in de tweede rij ook 24 zou moeten staan En dat is hier ook niet want in de eerste rij staan andere getallen als in de tweede.P.S. Ah ja en bij de verhouding best u getallen in een orde zetten dan alleen komt ge op strikt monotoon stijgend

Pagina 45 oefening 27 : Waarom geen ordinale schaal voorbeeld : een correct voorbeeld is -5 en 4 --> allebei tot de macht 4 krijg je respectievelijk 25 (want -5*-5 25) en 16. Hier blijft de rangorde niet behouden

Pagina 68 oefening 3 : Zetten we alle 30 gegevens op een rij --> 101, 101, 102, 102, 103, 106 ,...dan is P60 de score waaronder ten minste 60% van de scores gesitueerd is. 60% van de scores betekent 18 scores in dit voorbeeld want dat komt neer op een relatieve cumulatieve frequentie van 18/30 = 0.6 = 60%Er IS een score waarmee het percentage overeenkomt in het stamdiagram, we hebben op p. 89 gezien dat dan het percentiel gelijk wordt gesteld aan het midden van alle scores waarvoor dit percentage een relatieve cumulatieve frequentie is.We moeten de variabele als continu beschouwen, dus dat betekent dat ook 133, 134, 135, en alle decimale scores hiertussen tot een relatieve cumulatieve frequentie van 18/30 behoren --> het 60ste percentiel wordt dan gedefinieerd als het midden van dit interval ! (Als je deze uitleg over de theorie niet heel goed begrijpt kan dat op zich niet heel veel kwaad, weet gewoon dat indien je percentage in de tabel voorkomt, je op deze manier moet tewerk gaan en dat het 60ste percentiel niet de score zelf is die overeenkomt met deze relatieve cumulatieve frequentie.).Dat betekent dus dat het interval [132, 136[ een relatieve cumulatieve score van 18/30 heeft. 136 zelf hoort er theoretisch gezien niet bij, vandaar het open haakje aan die kant, maar we gaan die er in de berekening wel bij doen omdat we vanaf 135 eindeloos in de decimalen mogen gaan (135,999999...) en dat dus het verschil hiertussen verwaarloosbaar is (alweer, mocht je deze theorie niet direct snappen, breek je hoofd er niet over).We zoeken dus het midden van het interval [132, 136[ , dit komt overeen met het rekenkundig gemiddelde van dit interval en is dus (132 + 133 + 134 + 135 + 136)/5 = 134.

Pagina 75 oefening 18:  Hiervoor moet je je logartimen omdraaien. je krijgt log2 X = Y als je dit omdraait krijg je 2^y = x en dan kan je je ganse frequentietabel hierin plakken. Dan bereken je hiervan het geometrische gemiddelde --> dan krijg je als y-waarden : 2, 4 , 8, 16 en 32 en dan bereken je daarvan het geometrisch gemiddelde.

Pagina 75 oefening 19:

Pagina 79 oefening 2:

pagina 80 oef 5 --> zie Alien haarzelfde vraag : "Multiply Stem.Leaf by 10**-4" betekent dat je je gegevens maal 10 tot de min vierde macht doet.Dit komt overeen met "4 komma's naar links" zoals ze zeggen.Dat betekent van onder aan te beginnen 0.0102, 0.0102, 0.0102...Probeer eens zo alle gegevens in je lijst te zetten en dan de standaardafwijking te berekenen ? dan kom ik iig A uit.wat je sneller kan doen --> alle mogelijke scores in Lijst 1 zetten (dus 102,103,104,105,...) en in L2 de frequenties (2, 4, 1 , ...)Daarna bereken je de standaardafwijking, en doet deze maal 10^-4

pagina 83 oefening 18 : HEEL KORTE UITLEG sorry , als je het niet snapt hiermee stuur me dan een bericht en leg ik het langer uit ! 't is met dat het al laat is :) : 40 vragen correct komt overeen met een z-score van 7 ( merk op dat het theoretisch mogelijk is om zelfs hoger dan dit te hebben, je kan dus theoretisch gezien meer dan 40/40 hebben op je toets :p even fyi ).Dit is een vrij extreem getal, je wil weten hoe groot de kans is dat iemand dit gaat behalen en dan berekenen voor je aantal studenten --> ongelijkheid van Tchebycheff (zie pagina 105)je constante c=7 --> 1/7^2 = 1/49 233 studenten * (1/49) = 4,755102041Het aantal studenten dat dus alle 40 vragen correct KAN (belangrijk) hebben is kleiner dan 5 = Antwoord C

Pagina 83 oefening 20:

Pagina 84 oefening 21:

Pagina 84 oefening 22:

Pagina 84 oefening 23 :  Ik heb mijn Z-score gezocht van 360 (360-300/15)Dit was 4. En dan 1/4² (1/c²). Dan kwam ik 1/16 uit. Daarna heb ik 1100 (=n)/16 gedaan en zo kwam ik d uit

pagina 84 oefening 24 : je gaat kijken naar de relatieve heterogeniteit van de variabele SPORTKEUZE.Neem dus maar de mannen en vrouwen samen om het volledig aantal per sport te verkrijgen . Op die manier zie je dat Tennis de meeste frequenties (268) heeft --> Tennis is dus de modus in je formule.Je hebt Basket, Tennis, Atletiek, Voetbal en Wielrennen dus dat zijn in totaal 5 sporten (of 5 categorieën --> dit is je "k")in totaal zijn er 1254 scores op alle categorieën in totaal.De relatieve frequentie van de modus (tennis) is dus 268/1254 = 0,213716108 of 134/627Toegepast op de formule van relatieve heterogeniteit krijgen we 5*(1-(134/627))/(5-1) = 0,982854864 = 0,95 = Antwoord C

p 85 oef 25 : Vergt een beetje theoriekennis om deze oefening te maken.Eerst en vooral het rug- aan rug stamdiagram. Staat best goed beschreven in het boek op pagina 154 (hier ga ik dus niet uitgebreid op in).Eigenlijk kan je dus de linkerkant als een enkele stamdiagram zien maar dan gespiegeld zogezegd.In de legende staat dat je stam.loof * 2 moet doen--> voor je gegevens is dit dus 4.1*2 , 4.7*2 , 5.0*2 ... en zo door.Dit voer je het best in in Lijst 1.We moeten een populatievariantie schatten , dit is uit de inferentiële statistiek en is dus een lichtelijk andere formule dan die van de gewone variantie. Het voordeel is echter wel dat we vanuit de gewone variantie van onze gegevens de populatievariantie kunnen berekenen (zie pagina 102 handboek voor de formule).We berekenen dus gewoon met ons rekenmachine de variantie van Lijst 1 (maw het kwadraat van de standaardafwijking).en dan passen we de formule toe om de schatter te bekomen namelijk (n/n-1)* S^2x --> merk op dat S^2x dus het symbool is voor de gewone variantie.Je n is in dit geval het totaal aantal scores voor de vrouwen, ik bespaar je het rekenwerk het zijn er 11 Formule toepassen en voilà !dan krijg je (11/10)*11.32231405 = 12.45454545 Werk echter wel met de oorspronkelijke symbolen om zo min mogelijk afrondingsfouten te hebben Ik raad je aan om de oefening nog eens te maken !

Pagina 86 oefening 1 en 2 : als ge van uw eerste ruwe moment naar uw 2de wil gaan moet ge ^2 doen, dus 5^2=25, maar er staat dat uw 2e ruwe moment gelijk is aan 28. Om zo uw variantie te zoeken doet ge 28-25=3of anders gezegd…Variantie is gelijk aan tweede ruwe moment - gemiddelde in het kwadraat. Bij oefening 3 is het hetzelfde formuletje maar dan nog aanpassen zodat je de standaardafwijking krijgt van de populatie.

Pagina 86 oefening 28:

Pagina 86 oefening 29: die moet je oplossen met de formule (Sax+b)^2 = a^2 x (Sx)^2, a is hier 5 (kan je uit de opgave halen) en Sx is 1 omdat het een gestandaardiseerde variabele is

Pagina 86 1,2 en 3: variantie is gelijk aan tweede ruwe moment - gemiddelde in het kwadraat En bij 3 is het hetzelfde formuletje maar dan nog aanpassen zodat je de standaardafwijking krijgt van de populatie

p87 oef 4 : Daar heb ik een mini uitleg op gegeven op de bachelor groep en Evi heeft uitgebreid het voorbeeld op een blad getekend.Mijn mini uitleg : Het tweede ruwe moment kan gezien worden als de som van de gekwadrateerde standaardafwijking en het gekwadrateerde gemiddelde --> hier dus 9^2+3^2 = 81+9 = 90.Als je je afvraagt WAAROM dat dus zo is , dan kijk je best eens naar Evi haar berekening. Je kan het afleiden uit de formules

pagina 88 oefening 12 : Wat je bv. kan doen is ipv de tijd in minuten op te schrijven het in seconden doen. dan zijn je gegevens 71,74,81 en 71. Met deze gegevens kan je wel te werk :)Aangezien je in de formule van a3 kan zien dat ze werken met z-scores, moet je je dus geen zorgen maken om die transformatie van minuten naar seconden ! Je kan ook gewoon dezelfde getallen dus gebruiken die er staan zonder transformatie!;)

Pagina 91 oefening 1,2,3,4 en 5: 1)Je modus bij een standaardnormale verdeling is het gemiddelde (bevat de meeste scores)(voor volgende oefeningen : alsook de mediaan , die vallen allemaal samen).Deze is bij een standaardnormale verdeling per definitie 0.De berekening geldt dus voor oefening 1,2 en 3.Dan vul je je dichtheidsfunctie in voor een standaardnormale verdelingZ - N(0,1) <=> p(z)= 1/(√(2π))*e^((-1/2)*0^2)) = 0,39894228Let vooral op je notatie in het Rekenmachine. Liever een haakje teveel dan te weinigHier heb ik er teveel gezet om duidelijk te maken wat waar hoort4) Zelfde principe als bij 1, 2 en 3 alleen zit je hier niet met een standaardnormale verdeling maar met een normale verdeling. Je gebruikt dus de formule X - N (U,o) <=> p(x) = 1/(10√(2π))*e^((-1/2)*((X-0.5)/10)^2= 0,039894228 = 0,04 = Antwoord DMerk dat het eigenlijk hetzelfde is als de voorgaande oefening omdat je in het laatste deel van je formule eigenlijk de z-score berekent van je gegeven X. Aangezien de gegeven X hier het gemiddelde was kwam dit overeen met de vorige oefeningen (waar we ook altijd het gemiddelde/mediaan/modus kregen = z-score van 0)5) Exact hetzelfde als de vorige oefening qua berekening alleen andere gegevens --> X= 16 , U=10 en o=3 .Gebruik makend van de formule X - N (U,o) <=> p(x) = ....

Pagina 93 oefening 12:

Pagina 93 oefening 14

Hoe kom je nuweer aan die -2? Bij - voor de haakjes verandert uw teken dus valt uw Xoud weg, (x-x=0) en dan blijft er -2 over

Pagina 93 oefening 15

 15 is hetzelfde principe, maar wordt er slechts 1 bijgeteld dus de z-score van uw oud gemiddelde = -1 en dan kijk je ook in je tabel bij -1 bij opp na z en dan bekom je 15.87 %

Pagina 94 oefening 16

Pagina 94 oefening 17

Pagina 94 oefening 18 :

z = 3, (want het zit er 3 standaardafw boven), als je kijkt in de tabel is de opp na z dan 0.13%. Dan neem je 0.13% van alle inwoners (dus van 10 000 000) en dan heb je het

Pagina 94 oefening 19

Pagina 94 oefening 20

pagina 95 oefening 21 en 22: is gelijk aan oefening 20 en soortgelijk aan 22 --> Eigenlijk hoef je voor deze beide oefeningen geen berekeningen te maken. We weten dat de scores normaal verdeeld zijn met een variantie van 1 en gemiddelde ook 1.Het verschil met een standaardnormale verdeling is alleen maar het gemiddelde, dat respectievelijk bij oefening 20 en 22 één hoger ligt en één lager ligt dan 0.De 10% besten komt overeen met een z-score van 1,285 (in je tabel zie je dat er na deze z-score nog 0,1 oppervlakte komt --> dit zijn de 10% besten dus vanaf hier moeten ze de scores halen voor z-waarde).je kan eigenlijk dan al meteen redeneren dat je er respectievelijk 1 bij en 1 af moet trekken voor oefening 20 en 22 (omdat je gemiddelde 1tje verder ligt dan bij een standaardnormale verdeling waar je de z-score van hebt gehaald).Stel dat je het toch nog wil narekenen --> dan voer je eigenlijk een ongelijkheid in met de formule van de Z-score namelijk : z = (X-U)/o met U als gemiddelde en o als standaardafwijking omdat ze er een beetje op trekken.Toegepast : 1,285 = (x - 1)/1 --> als je dit uitwerkt kom je x = 2,285 uit (afgerond 2,28 in het boek)hetzelfde principe voor oefening 22

Pagina 95 oefening 23:

Pagina 95 oefening 26:

pagina 96 oefeningen 28-31 --> Gemaakt voor oefening 29 : je zoekt X in het interval, maw , je zoekt het interval dat begint vanaf -1,5 en eindigt bij X waarin 20% van de scores liggen (aangezien 80% erbuiten valt).Je gaat hier moeten werken met z-scores --> je hebt je gemiddelde en variantie (waaruit je de standaardafwijking kan berekenen namelijk 1/2) dus kan je je z-scores berekenen.Om je op weg te helpen : bereken de z-score van het begin van je interval --> (-1,5+1)/(1/2)= -1 = z-scoreprobeer het je visueel voor te stellen op je standaardnormale verdeling ! Als je kijkt in de tabel van de z-scores zie je dat tussen 0 en -1 zo'n 0,3413 van de oppervlakte ligt (of dus 34,13 % van de gegevens).Je moet aan 20% komen --> 34,13-20= 14,13Je moet dus de z-score zoeken waar 14,13% van de scores tussen 0 en je z-score vallen (snap je dit ? anders vragen !)In je tabel zie je dat dit ongeveer -0,36 is (snap je waarom er een minteken voor staat? gespiegeld rond het gemiddelde!)[-1, -0.36] is je interval in Z-scores ! dus nu moet je alleen nog maar de omgekeerde bewerking doen om je normale score te berekenen uit -0.36 namelijk -0.36= (x+1)/(1/2) --> X= -1,18

pagina 96 oefening 32 : Je weet dat je gemiddelde 10 is, je gegevens zijn normaal verdeeld en je weet dat tussen 8 en 12 90% van de gegevens liggen.Z-scores it is zoals je zei !We gaan eigenlijk gewoon kijken tussen welke 2 getallen die EVEN VER van het gemiddelde liggen 90% van de scores liggen. Een snelle berekening maakt dat je al snel weet dat je tussen je 0 en je z-score 45% van de gegevens moet hebben.Dat betekent dat respectievelijk 8 en 12 als z-score -1,645 en 1,645 hebben (snap je hoe je dit moet zien in het tabel ? anders vragen!).Eigenlijk heb je al genoeg met 1 z-score om je ongelijkheid te berekenen --> je vult alles in in je formule van de z-score en voilà ! je standaardafwijking : 1,645 = (12-10)/Sx --> Sx= 2/1,645 = 1,22 = Antwoord B

Pagina 97 oefening 33:

Pagina 97 oefening 34:

pagina 97 oefening 37 : De dichtheid is het grootst rond het gemiddelde (veel scores dicht bij een) en het kleinst aan de uiteindes (scores heel erg uitgespreid) .hij moet een totaal hebben van 0.4 oppervlakte dus 0.2 aan de beiden uiteindes (om zo optimaal mogelijk gebruik te maken van die kleine dichtheid). De z-scores die overeenkomen met 0.20 van de oppervlakte NA de z-score is ongeveer -0.84 en 0.84:)

Pagina 98 oefening 40 : Hier is het heel belangrijk dat je het principe van de standaardafwijking bij normaal verdeelde scores begrijpt.Er staat dat de standaardafwijking van Y GROTER is dan die van X. Dat betekent dat de gegevens van Y eigenlijk meer uitgespreid liggen over je normaal verdeelde (en dus minder dicht tegen je gemiddelde dan bij X).Ik heb nog eens geprobeerd een tekening te maken. (photo 6)Misschien zie je op die manier wel wat ik bedoel !De oppervlakte onder een normaalverdeling is dus het totaal aantal scores. Hoe groter de oppervlakte in een bepaald interval, hoe groter de proportie scores !Ga je voor zowel X als Y 1 punt lager op de X-as, dan zie je dat bij X MEER oppervlakte gearceerd is dan bij Y (dit is OVERDREVEN voorgesteld om het idee weer te geven !)Vandaar dat de proportie scores verder dan 1 van het gemiddelde bij Y groter is, omdat er proportioneel vergeleken met X MINDER scores dichter bij het gemiddelde liggen.Merk op dat 1 score bij deze oefening NIET 1 standaardafwijking is, anders was de proportie scores hetzelfde geweest.Misschien is hier een tekening niet de beste manier omdat het er moeilijk uit af te leiden valt, maar ik hoop dat het een beetje visueel helpt !Hou je vooral vast aan de mate van spreiding bij een hogere of lagere standaardafwijking

Pagina 108 oefening 68: Uw correlatie is covariantie gedeeld door SxSy, je hebt uw covariantie al, nu moet gewoon nog delen door SxSy en die zijn gegeven!

Pagina 108 oefening 19:

Pagina 108 oefening 20 en 21

Pagina 111 oefening 33 :

Pagina 112 oefening 38:

Pagina 112 oefening 39 en 40:

Pagina 113 oefening 45 : Waarom antwoord C fout is Het klopt dat je zegt dat gestandaardiseerde scores altijd een standaardafwijking van 1 hebben ( en bij gevolg dus een variantie van 1 ). Het is echter niet zo dat als een bepaalde variabele een gelijke standaardafwijking en variantie heeft, het een gestandaardiseerde variabele is !heel stom voorbeeld : de scores 5 , 5 , 5 , 5 , 5 , 5 , 5 -->Je standaardafwijking is 0, ook je variantie is 0 , maar de variabele X is geen gestandaardiseerde variabele.Je mag dus niet zomaar concluderen dat als een variantie gelijk is aan de standaardafwijking dit wel 1 moet zijn en dus een gestandaardiseerde variabele.

Pagina 114 oefening 46:

Pagina 117 oefening 13: 13) aangezien uw gemiddelde van X gelijk is aan 0 is het 4de ruwe moment gelijk aan het 4de centrale moment.Daarna gebruik je uw formule van de 4de a-coëfficiënt en zet je Sx ^ 4 naar de andere kant.Je komt dus a4 x (Sx²)²=300.Aangezien a4 groter is dan 3 (want het is hoog gewelfd) en de variantie nog gekwadrateerd wordt, mag de variantie niet groter of gelijk zijn aan 10, want anders kom je een hoger getal dan 300 uit.

Pagina 126 oefening 22 :

Pagina 135 oefening 3: Ge moet de cumulatieve frequentie nemen, dus voor de man: 13+16+41=70 , en voor de vrouw: 10+14+46=70

Pagina 136 oefening 5: je moet totaal geneeskunde +totaal onderwijs/ totaal prof + tot academisch en dan 100%- 33% ( wat je uitkomt met de berekening hier bovenaan) en dan bekom je 67%En de reden dat je het van die 100% moet aftrekken is omdat er niet voor de studierichting staat in de opgave

Pagina 138 oefening 4: Je berekent met je rekenmachine de populatiestandaardafwijking (door stam.loof x2 in te geven). Als je dat gedaan hebt, doe je de populatiestandaardafwijking tot de tweede, en dan heb je de variantie

Pagina 140 oefening 5:

Pagina 141 oefening 6:  Bij oefening 6 moet je gewoon de reeks cijfers uit de opgave ingeven bij L1 en dan de andere reeksen om de beurt bij L2. Je moet telkens kijken bij 2-var stat hoe hoog de correlatie is en dan kan die die vergelijken om te zien welke de hoogste is

Pagina 141 oefening 7: Bij oefening 7 moet je ook gewoon alle mogelijke combinaties invullen bij L1 en L2. De r kan je trouwens aflezen bij 2-var stats als je daar redelijk ver naar onder gaat, dan kom je na alle gemiddelde en standaardafwijkingen en zo de r tegen

Pagina 141 oefening 8 : Voor Sx: In L1 geef je dan uw x-jes allemaal in, en in L2 uw proporties en dan 1 var stat want je werkt met proporties. En dan uit die lijst moet je nr. 4 nemen zo dat bolletje met x. En voor Sy hetzelfde maar in L1 uw getalletjes van de y-kolom en en L2 uw proporties, 1 var stat en dan terug het 4e nemenDit is de tabel die je in je lijsten moet invoegen:

13 713 713 713 714 1015 1216 1916 1916 1916 19

Pagina 142 oefening 9: Je moet eerst het gemiddelde berekenen van A. Die is gelijk aan:0.02*26 + 0.96 * 25 + 0.02 * 1 = 24.54Het gemiddelde van B= 0.02 *-20000 + 0.96 * -30000 + 0.02 * -40000 = -30000Dan de standaardafwijking: Sa= 0.02 (26-24.54)² + 0.96(25-24.54) ²+ 0.02*(1-24.54)² en daar de vkw van . Voor Sb analoog, maar dus zeker niet de procenten vergeten! (of proporties)dan komt men voor Sa = 3.37 uit en voor Sb = 200 uit. Dan gewoon de formule voor correlatie toepassen. Maar weer de proporties zeker ni vergeten ! dus rAB= (26-24.54)(-200000+3000)*0.02 + (25-24.54)(-30000+30000)*0.96 + (1-24.54)(-40000+30000)*0.02 en dit alles dan delen door het product van de standaardafwijkingen

Pagina 142 oefening 10 : Zie vorige oefening! Bij 10 kan je bijvoorbeeld meteen 1 3 3 5 5 in L1 zetten en in L2 9 5 5 5 5 zetten en daar de correlatie van nemen, dan staan al je cijfers er al in tussen de welke je de correlatie moet berekenen

Pagina 134 oefening 12:  Je moet het gemiddelde van het gemaakte aantal rekenfouten en het gemaakte aantal taalfouten berekenen. Dus GEMIDDELDE Y 82*4 fouten + 104*5 fouten + 14*7 fouten= 946 fouten IN TOTAAL gedeeld door 200 studenten --> = 4.73GEMIDDELDE X 60*1 + 90*2 + 50*3 = 390 fouten IN TOTAAL gedeeld door 200 studenten --> = 1.95IN TOTAAL zijn er 946 taalfouten gemaakt op 200 leerlingen. Gemiddeld dus 4.73 per leerlingIN TOTAAL zijn er 390 rekenfouten gemaakt door 200 leerlingen. Gemiddeld dus 1.95 per leerling.

Pagina 147 oefening 21:

Pagina 149 oefening 30 :

Pagina 152 oefening 32: Alle scores van de vrouwen onder elkaar opschrijven (zouden er 10 moeten zijn), dan de relatieve cumulatieve frequenties berekenen en kijken of 20% er tussen staat. Deze staat er tussen dus moet je het gemiddelde berekenen van die score en de score er boven --> dus gemiddelde van 47 en 50 en dan krijg je 48,5

Pagina 152 oefening 3: b1= .10x2 en b0= 10-.20x12 . De variantie van Frans is viermaal zo groot dan die van Latijn, dus bij de standaardafwijking is het dan tweemaal zo groot

Pagina 154 oefening 19:

Pagina 156 oefening 17: (MOEILIJKE MANIER) We gaan hier berekeningen moeten maken met de formules van de enkelvoudige lineaire regressie ! vooral ook de formule van de regressiescore zelf.We zoeken eerst de b0 en b1 zodat we daarna verschillende andere berekeningen kunnen maken om uiteindelijk tot de variantie van de voorspelde scores te komen. Als we al onze gegevens even naast elkaar zetten, dan krijgen we...Gemiddelde van X=Gemiddelde van Y= 0 --> hieruit kunnen we afleiden vanuit de formule van b0 dat b0 ook gelijk is aan 0.We krijgen ook voor de voorspelde score van ÿ (y-dakje hier) = 12 dat X =4Ingevuld in onze regressiescore formule krijgen we 12=0+b1*4--> een ongelijkheid waaruit we makkelijk b1 kunnen berekenen namelijk b1= 3op pagina 193 hebben we gezien dat b1 ook geschreven kan worden als Sxy/S^2x --> S^2x hebben we gegeven, we kunnen dus Sxy berekenen door de ongelijkheid in te vullen namelijk 3=Sxy/4 --> Sxy= 12We zijn al een stapje verder... We hebben b0, b1, beide gemiddeldes, Sxy, S^2x en dus SxWe kijken nu nog eens naar de formule van b1 en naar die van de Pearson correlatie coëfficiënt. We zien dat we b1 kunnen schrijven als (Sxy/Sx*Sy)*Sy/Sxhieruit kunnen we Sy berekenen ! --->3= (12/2*Sy)*Sy/2 --> we kunnen 1 Sy schrappen in de noemer van het eerste gedeelte en de 2de Sy in de teller van het tweede gedeelte (gedeeld door en maal heft elkaar op)dan krijgen we 3=24/Sy --> Sy= 8Nu hebben we alles om onze finale berekening te maken, namelijk de variantie van de gereconstrueerde scores !deze is S^2ÿ = r^2xy*S^2yanders geschreven ... (Sxy/Sx*Sy)^2 * S^2y--> (12/2*8)^2 * 8^2 = 0,75^2 * 64 = 36 = Antwoord AMAKKELIJKE MANIER

Pagina 157 oefening 19 :

trouwens, eigenlijk ...rye= vierkantswortel 1-rxy² invullen: vierkantswortel 1-0.74²= 0.67

Pagina 158 oefening 24: Beetje wanordelijk maar je moet beginnen met je b1

Pagina 160 oefening 37 : in je formule wordt X gezien als je predictor en Y als je criterium.Hier wordt er in de oefening gezegd dat het gemiddelde inkomen per wijk wordt voorgesteld als Y als predictor voor het gemiddelde aantal inbraken per wijk X  het criterium).Het hangt dus af van de opgave van de oefening.Lees altijd goed je oefening en bepaal op voorhand welke variabele de predictor(=X in de formules) en welke variabele het criterium(=Y in de formules) is.

Pagina 161 oefening 38: standaardfout van de schatting is gelijk aan het gemiddelde van e²e²(gem.) = S²y(1-r²xy) = 3(1-0.6²) = 1.92 en dan nog onder een wortel zetten en dan kom je op 1.385

Pagina 161 oefening 40: Je zoekt Se maar je hebt enkel de formule S^2e dus op het einde nog eens de vierkantswortel nemen

Pagina 164 oefening 52:

Pagina 167 oefening 64:

Pagina 167 oefening 65:

Pagina 167 oefening 67: De correlatie tussen de standaardwaarden is gelijk aan -1, en men weet dat de standaardafwijking van standaardwaarden altijd gelijk is aan 1. Dus rxy= -1 = Sxy/SxSy <-> Sxy= -1.Men vraagt de variantie van de verschillen, dus men vraagt S²x-y. Die is gelijk aan S²x + S²y -2Sxy.S²x= 1, S²y = 1 (beide standaardafwijkingen van standaardwaarden) en Sxy= -1. Dus S²x-y = 1+1-2(-1) = 4 Oefening 64, 65, 66 : ok gewoon de formules toepassen  je hebt al de gegevens die je nodig hebt.oef 64: S²x+y= S²x+S²y+2Sxy = 2²+2²+2*1 = 10oef 65 en 66 zijn juist hetzelfde maar daar moet je de formule voor variantie van het verschil nemen en staan in de gegevens al de variantie van de X en Y.Dus oef 65= S²x-y= 2+2-2*0 = 4oef 66 vragen ze de standaardafwijking, dus moet je van de uitkomst van S²x-y de vierkantswortel nemen

Pagina 169 oefening 72: Ik heb de residuele scores in het grm ingeven. Dan geef je een antwoord keuze er ook bij in. Dus L1 zijn dan de residuen en 1 antwoord mogelijkheid. L2 is allemaal 1. Dan bereken je het gem en als dat op 0 uitkomt heb je het antwoord.

Pagina 169 oefening 73 : b1(1) van Y op X bedraagt 0.25, b1(2) van X op Y 0.5.Als men rxy afleidt uit de formule van b1 krijg je:rxy = b1 * Sy/Sx voor de eerste b1 en rxy= b1 * Sx/Sy voor de tweede b1.Zo kan men rxy² afleiden= b1(1) *b1(2) * Sy/Sx * Sx/Sy--> De breuken met de standaardafwijkingen vallen dus weg.Dus allen nog maar 0.5*0.25 doen en daar de vkw van

Pagina 169 oefening 74:

Pagina 176 oefening 25 en 26 : Maak zelf een kleine data set anders!x heeft de waarden 0 en 1 en f(x) is 50 en 100. Zet dat in uw rekenmachine (L1: 0 en 1, L2: 50 en 100) dan 2VARS STAT, kijken naar r=1. Zelfde bij oef 26 maar dan 0 en 1 omwisselen. En r=-1

Pagina 180 oefening 39 : De reden waarom dat het antwoord er hier niet tussen staat is omdat er niet genoeg gespecifieerd is. Er staat dat de variabelen X en Y worden gedeeld door respectievelijk c en d --> Dit is dus een transformatie die je maakt !We hebben gezien dat een positieve lineaire transformatie bij de Pearson correlatiecoëfficiënt niet uitmaakt voor het resultaat. Bij de covariantie is dit wel zo. Ik probeer het kort uit te leggen, als je het niet begrijpt wil ik het gerust nog wel uitschrijven.Om tot de covariantie te komen van beide variabelen gedeeld door hun constante zou je dus de covariantie van de oorspronkelijke X en Y moeten delen door het product van de beide constanten, dit is om de transformatie ongedaan te maken.De reden waarom het antwoord niet B is , is omdat er niet gespecifieerd is in de opgave of dat de constanten al dan niet positief of negatief zijn.Als beide constanten positief of beide constanten negatief waren, dan klopt antwoord B (omdat negatief*negatief elkaar opheft en resulteert in positief).Als echter 1 constante negatief en 1 constante positief was, dan zou het teken van je covariantie veranderen. Dit wordt op pagina 176 beschreven voor de Pearson coëfficiënt , maar mag je ook doortrekken naar de Covariantie aangezien de Pearson coëfficiënt de Covariantie is van de gestandaardiseerde scores.Daarom kloppen er geen antwoordmogelijkheden.

Pagina 201 oefening 1,2, 3, 4 en 5 : er zijn in totaal 274² waarden, maar men moet alleen de informatieve waarden hebben. Dit zijn bij de covariantiematrix alle waarden buiten diegene die er dubbel instaan. (dus diagonaal is wel informatief! )2 manieren om het te berekenen:1) 274²/2 + 137 (+137 want dit is de helf van de diagonaal die je mee hebt 'weggedeeld)2)( 274² - 274) /2 + 274  bij oef 4 is het dan (274²-274)/2 en oef 5: men heeft in totaal 9 variabelen, niet informatief is bij correlatiematrix= diagonaal + dubbele waardenDus de niet-informatieve waarden zijn 3 (diagonaal) + 3 (dubbele waarden) =6

en op een andere vraag …Hierbij is de theorie van pagina 209 en 210 heel belangrijk.De diagonaal is per definitie steeds 1 en de waarden worden met elkaar gespiegeld (alles komt er 2 keer in voor).Daarmee rekening houdend proberen we eens oefening 1 -->Je hebt 274 variabelen ; dat betekent dat je matrix dus uit 274x274 elementen bestaat : 75076.Eerst filteren we de diagonaal eruit, dat zijn namelijk alle waardes die met zichzelf correleren. Aangezien we 274 variabelen hebben zijn dit er dus 274.75076-274 = 74802Van deze 74802 waardes zijn echter maar de helft bruikbaar , want ze staan er allemaal dubbel in -->74802/ 2 = 37401Het aantal niet-informatieve waarden, zijn dan het totaal aantal waarden - de informatieve waarden.Als het niet helemaal duidelijk is zeg je het maar, en anders nog veel succes !

Pagina 202 oefening 7 : Een beetje gelijkaardig met de oefening die we in het college hebben gemaakt met informatieve correlaties.Je moet 6²= 36Daar dan de diagonaal van aftrekken (36-6=30)En dat dan delen door 2 (30/2= 15)

Pagina 214 oefening 15 : Uw B1 kan je berekenen met al de gegeven correlaties! Formule staat op pagina 282 van het theorieboek. Je weet uw standaardafwijkingen niet, maar wel de verhoudingen en die kan je op die manier invullen in de formule --> s2^2= x S1^2 = 2X S3^3 is x/2 en daar de vierkantswortel van om tot je standaardafwijking te komen. b1 = B1 * (Sy/S1) verder gewoon uitrekenen

Pagina 213 oefening 8 en 9: Oefening 8: IQKIND = 62.1792 + 0.2150 IQMOEDER + 0.1176 IQVADER. Dat is eigenlijk de gereconstueerde score (Yi ^ = b0 + b1*X1i + b2*X2i). Die 62.1792 = b0, 0.2150 = b1 en 0.1776 = b2. Je wil B1 en B2 hebben, maar zonder correlaties te gebruiken want die heb je niet. b1 = B1 * Sy/S1 --> B1 = b1 * S1/SyStandaardafwijking --> Std Dev, IQKIND is Sy, IQMOEDER is S1 en IQVADER is S2Oefening 9 is hetzelfde principe!

Pagina 218 oefening 27:

Pagina 221 oefening 33: 1) in data 2 lijsten ingeven (L1 is ene lijst, L2 is andere lijst) 2) quit3) 2nd stat4) 2 var stat5) xdata = L1 / ydata = L2 -> calc6) gaan tot F -> r =En dan heb je dus je correlatiecoefficient -> invullen in formule

Pagina 228 oef 59: De formule van b0=Ygem -b1Xgem1- b2 Xgem2X1 is hier G(t-1) en X2 is hier G(t-2). De gemiddeldes van deze variabelen zijn gelijk aan 0. Dus men moet b1 en b2 niet berekenen want die vallen toch weg, want je gaat ze vermenigvuldigen met 0. Dus b0=Ygem= 0.68

Pagina 229 oefening 60 : Hier moet je het mechanisme proberen te begrijpen van de enkelvoudige regressies die je berekent om bepaalde coëfficiënten te bekomen.We zoeken de proportie variantie in W die verklaard wordt door variantie in X, als beide variabelen uitgezuiverd werden voor Y.Schematisch voorgesteld zie je op de tekening wat we eerst gaan zoeken, alvorens de proportie van de variantie in W die overblijft en beschreven kan worden door de variantie in X, na controle van Y. maw we zoeken dus de partiële correlatie^2(handboek pagina 229) en om deze te berekenen de partiële correlatie zelf eerst.Op de slides 24 en 8-12 van les 12 staat in bepaalde mate het principe dat we gaan hanteren.Om de unieke bijdrage van X tot Y te berekenen moeten we een enkelvoudige regressie uitvoeren met Y als predictor voor het criterium X. Deze enkelvoudige regressie komt overeen met kolom 2. We verkrijgen hiervoor de residuele scores (maw het unieke stukje in X , niet verklaard door Y) (dit principe van berekeningen staat op de slides 8-12).Hetzelfde doen we voor W met Y als predictor.Deze enkelvoudige regressie komt overeen met kolom 4.De residuele scores hier is dus het unieke stukje in W niet verklaard door Y.We hebben nu beide unieke stukjes en zetten deze in het rekenmachine om de correlatie te kunnen berekenen.Omwille van al de uitzuiveringen die je gedaan hebt krijg je dan de partiële correlatiecoëfficiënt.Deze kwadrateren geeft je de proportie verklaarde variantie in W door X, beide uitgezuiverd voor Y. Foto hieronder

Pagina 234 oefening 9 : B1ry1 = .76 (en B1ry1 = r^2 y1) en dan de vierkantswortel nemenB1 doet hier hetzelfde als rxy --> want als je maar één predictor hebt dan --> b1= rxy. Sy/Sx (B1 bij de formule voor 2 predictoren heeft dezelfde 'functie' als rxy bij de formule met 1 predictor. Als je dan de vierkantswortel neemt van rxy is die uitkomst ook gelijk aan B1)Bij twee predictoren --> b1: B1. Sy/SxJe neemt dus de vierkantswortel van r^2xy om B1 te vinden.

Pagina 240 oefening 33 : neem je eerst de formule R²Y.12= r²Y1 + r²Y(2.1) erbij.Aangezien je niet r²Y(2.1) maar r²Y2.1 nodig hebt, ga je de formules van partiële en semi-partiële correlatiecoëfficiënt met elkaar vergelijken.Dan zie je dat je rY(1.2) gedeeld door de vierkantswortel van 1-r²Y1 moet doen om rY2.1 te bekomen.Als je dan de vierkantswortel van 1-r²Y1 aan de andere kant zet bekom je rY(2.1)= rY2.1 maal de vierkantswortel van 1-r²Y1.Dit moet je dan nog kwadrateren en vervang je dus de gekwadrateerde semi-partiële correlatiecoëf. door dit en dan kom je D uit.:)