29
BAZELE STATISTICII - anul universitar 2014-2015 -

Curs10 Testare 2015 Final

Embed Size (px)

DESCRIPTION

curs testare 2015 final statistica

Citation preview

  • BAZELE STATISTICIIBAZELE STATISTICII- anul universitar 2014-2015 -

  • 6. Testarea statistic6.1. Aspecte generale ale testrii statistice

    6.1.1. Obiectivele testrii statistice6.1.2. Demersul testrii statistice 6.1.3. Teste parametrice versus teste neparametrice

    6.2. Testarea ipotezelor asupra unui eantion6.2.1 Testarea ipotezelor asupra mediei: testul t, testul Z6.2.2 Testarea ipotezelor asupra proporiei: testul t, testul Z

  • 6. Testarea statistic6.3. Testarea ipotezelor privind dou eantioane (cazul

    eantioanelor independente)- verificarea egalitii mediilor.

    6.4. Testarea ipotezelor privind 3 i mai multe eantioane6.4. Testarea ipotezelor privind 3 i mai multe eantioaneindependente (Testul Fisher ANOVA)

  • 6.1. Aspecte generale ale testrii statisticeNecesitatea testrii

    6.1.1. Obiectivele testrii statistice- verificarea ipotezelor asupra unui parametru al unei populaii;- verificarea ipotezelor privind legea de distribuie a unei

    populaii;- verificarea ipotezelor privind dou sau mai multe populaii.

    6.1.2. Demersul testrii statistice

  • 6.1. Aspecte generale ale testrii statistice

    a) Formularea ipotezelor statisticeO ipotez este o presupunere cu privire la valoarea unuiparametru, legea de distribuie a variabilei studiate, etc.H0 : egalitatea unui parametru cu o valoare fix; oH0 : egalitatea unui parametru cu o valoare fix; opresupunere cu privire la legea de repartiie a unei variabile.H1: este opusul ipotezei nule.

  • 6.1. Aspecte generale ale testrii statisticeTest bilateral:

    Test unilateral la dreapta:0100

    :H:H

    =

    Test unilateral la dreapta:

    Test unilateral la stnga:

    0100

    :H:H

    >=

    0100

    :H:H

  • 6.1. Aspecte generale ale testrii statistice

    b) Alegerea testului statistic- exist dou categorii de teste statistice: teste parametrice iteste neparametrice.

    c) Alegerea pragului de semnificaie al testului i citireavalorii critice (teoretice)- riscul (pragul de semnificaie) reprezint probabilitatea dea respinge ipoteza nul, atunci cnd aceasta este adevrat.

    d) Calculul valorii statisticii test, folosind datele observate lanivelul eantionului.

  • 6.1. Aspecte generale ale testrii statisticee) Regiunea de respingere/acceptare a ipotezei nule

    Regiunea de respingere intervalul dintr-o distribuie deprobabilitate n care se respinge ipoteza nul, acest intervaleste acoperit de probabilitateaRegiunea de acceptare (interval de ncredere) intervalul n

    Regiunea de acceptare (interval de ncredere) intervalul ncare nu se respinge ipoteza nul i este acoperit deprobabilitatea 1-

    f) Regula de decizie

  • Erori de testare

    Decizia testului se ia cu o anumit eroare, care poate fi: eroare de tip I (eroare de prim spe, notat ) eroare de tip II (eroare de a doua spe, notat )

  • 6.1. Aspecte generale ale testrii statistice

    1 msoar nivelul de siguran al testului (siguranastatistic)

    1 msoar puterea testului

    1 msoar puterea testului

  • 6.1.3 Teste parametrice i teste neparametrice

    Teste parametrice: presupun ipoteza de normalitate a distribuiei populaiei; variabila analizat este msurat pe o scal interval sau

    raport;raport; mrimea eantionului trebuie s fie suficient de mare (ex.

    n>30).Teste neparametrice: puine ipoteze restrictive privind legea de distribuie a

    populaiei; se folosesc pentru variabile calitative.

  • 6.2. Testarea ipotezelor asupra unui eantion6.2.1. Testarea ipotezelor asupra mediei unei populaiia) Formularea ipotezelor

    b) Alegerea testului statistic- dac se cunoate se folosete statistica Z, ),(N~Z 10

    0100

    :H:H

    =

    2- dac se cunoate se folosete statistica Z,

    - dac nu se cunoate , se folosete statistica t,

    ),(N~Z 10

    )n(t~t 12n/

    Z 0

    =

    n/'

    t 0

    =

    2

  • 6.2.1. Testarea ipotezelor asupra mediei unei populaii

    c). Alegerea pragului de semnificaie i citirea din tabel avalorii critice a statisticii test.

    d). Calculul valorii statisticii test pe baza datelor eantionuluid). Calculul valorii statisticii test pe baza datelor eantionului

    n/x

    zcalculat

    =

    0n/'s

    xt 0calculat

    =

  • 6.2.1. Testarea ipotezelor asupra mediei unei populaii

    e). Regula de decizie- dac , se respinge ipoteza nul,pentru un risc

    2/calculat tt >

    tt - dac , nu se respinge ipoteza nul.

    f). Compararea valorii calculate a statisticii testului cuvaloarea critic (teoretic)

    Exemplu

    2/calculat tt

  • Exemplu n urma prelucrrii datelor privind veniturile familiilor dintr-o

    regiune nregistrate la nivelul unui eantion de volum n=625,s-au obinut urmtoarele rezultate:

    , s2= 4. S se testeze dac exist diferenelei.mil12x =semnificative ntre veniturile medii ale familiilor la nivelulpopulaiei din care a fost extras eantionul i venitul mediu pear, , considernd un risc de 5%.lei.mil130 =

  • 6.2.2 Testarea ipotezelor asupra proporiei

    Demersul testrii:a) Formularea ipotezelor statistice

    00 :H pipi = 00

    01 :H pipi

  • 6.2.2 Testarea ipotezelor asupra proporiei

    b) Alegerea pragului de semnificaie

    c) Testul statistic

    pt 0

    =

    pi

    d) Regula de decizie

    n/)p1(pp

    t 0calculat

    =

    pi

  • 6.3. Testarea ipotezelor privind doueantioane (cazul eantioanelor independente) n cazul eantioanelor independente, statistica test folosit n

    testarea ipotezelor statistice este statistica Z sau t. Ipoteze statistice

    Aplicarea testului presupune testarea egalitii varianelorpopulaiilor din care au fost extrase eantioanele (testulLevene).

    0:H 210 =

    0:H 211

  • 6.3. Testarea ipotezelor privind doueantioane atunci cnd , statistica test este:2221

    22

    21

    21calculat

    n

    's

    n

    's

    xxt

    +

    =

    atunci cnd , statistica test este:

    21 nn

    22

    21 =

    21p

    21calculat

    n

    1n

    1's

    xxt

    +

    =

  • 6.3. Testarea ipotezelor privind doueantioane unde:

    2nn)1n('s)1n('s

    's21

    2221

    21

    p+

    +=

    Exemplu Pentru dou eantioane extrase aleator simplu de volum

    n1=n2=625 persoane s-a nregistrat vrsta i s-au obinuturmtoarele rezultate:

    ;ani32x,ani35x 21 ==ani4's,ani2's 21 ==

  • 6.3. Testarea ipotezelor privind doueantioane S se testeze ipoteza potrivit creia ntre vrstele medii ale

    celor dou populaii din care au fost extrase eantioaneleobservate exist diferene semnificative. Se consider un riscde 0,05.

  • 6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)a) Obiectiv- procedeu de analiz a variaiei n funcie de sursa acesteia;- permite compararea mediilor a 3 sau mai multe grupe sau

    populaii cu scopul de a verifica dac exist diferenepopulaii cu scopul de a verifica dac exist diferenesemnificative ntre acestea.

    b) Condiii de aplicare- Condiia de independen- Condiia de normalitate- Condiia de homoscedasticitate

  • 6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente

    Se bazeaz pe descompunerea variaiei totale pe componente:- variaia explicat sau intergrupe (variaia sub influena

    factorilor eseniali);- variaia rezidual sau intragrupe (variaia sub influena- variaia rezidual sau intragrupe (variaia sub influena

    factorilor ntmpltori).

    - La nivelul unui eantion: TSS=ESS+RSS.

    RET VVV +=

  • 6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA) Variaia total

    Variaia explicat

    Variaia rezidual

    =n

    ii xxTSS

    2)(

    ==

    n

    ij xxESS

    1

    2)(

    =jn k 2 Variaia rezidual

    c). Ipoteze statistice:

    kH === K210 :

    diferitesuntpopulatiidouaputincelamediileH :1

    == =

    jn

    1i

    k

    1j2

    jij )xx(RSS

  • 6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)d. Statistica test Fisher

    knVkV

    FR

    E

    =

    /1/

    unde: k numrul grupelor.

  • 6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)e. Se alege pragul de semnificaie i se citete valoarea

    critic a testul F din tabelul repartiiei Fisher, pentru risculadmis, i grade de libertate,

    .

    knvkv == 21 ,1

    v,v,F

    21 v,v,F

  • 6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)f. Calculul statisticii F:

    1kkn

    RSSESS

    kn/RSS1k/ESSFcalculat

    =

    =

  • 6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)g. Regula de decizie: se respinge ipoteza nul

    pentru riscul admis SigsauFF 21 v,v,calculat 0H

    nu se respinge ipoteza nul SigsauFF 21 v,v,calculat 0H

  • 6.4 Testarea ipotezelor privind 3 i mai multeeantioane independente (ANOVA)

    ANOVA

    venitSum of

    149.400 2 74.700 19.597 .00064.800 17 3.812

    214.200 19

    Between GroupsWithin GroupsTotal

    Sum ofSquares df Mean Square F Sig.