STATcom - Curs 4-5

Embed Size (px)

Citation preview

  • 7/30/2019 STATcom - Curs 4-5

    1/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Statistic n comer, turism, servicii

    Curs 4 - 5

    Msuri statistice descriptive pentru date

    univariate (II)B. Msurarea variabilitii

    Regula de compunere a variabilitii

  • 7/30/2019 STATcom - Curs 4-5

    2/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Msurarea variabilitii

    Pentru analiza variabilitiiunei serii de date numericese utilizeaz:

    o indicator i s im pl i(msoar mprtierea valorilor individuale aleseriei, una fa de alta, ori fa de o valoare tipic)

    o indicator i sintet ic i(utilizati pentru sintetizarea, ntr-o singurexpresie, amprtierii tuturor valorilor din seria statistic analizat).

    Dou serii statistice pot s difere prin tendina central, prin mprtierea datelorsau prin amndou.

  • 7/30/2019 STATcom - Curs 4-5

    3/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Ind icator i i s impl iai variabilitii

    1. Amplitudinea variaiei

    mplitudinea absolut a variaiei(Ax):Ax= xmax xmin.

    Axare unitatea de msur a variabilei

    Axdescrie ecartul maxim al valorilor pe scal.

    Axse folosete n construirea intervalelor de variaie i al graficelor.

    Axeste foarte sensibil la valorile extreme

    Axnu ine cont de distribuia celorlalte valori din serie.

    mplitudinea relativ a variaiei( %xA ): 100m inm ax%

    x

    xxAx .

  • 7/30/2019 STATcom - Curs 4-5

    4/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Ind icator i i s impl iai variabilitii

    2. Abaterea intercuartilic- se determin ca diferen ntre cuartila superioar i cea inferioar

    13QQIQR

    - arat intervalul de valori n care se ncadreaz 50% din unitile situate n

    mijlocul seriei

    - elimin dezavantajele cauzate de luarea n consideraie a valorilor extreme

    - are unitatea de msur a variabilei studiate

    - reprezint lungimea dreptunghiului din diagrama Box-Plot.

  • 7/30/2019 STATcom - Curs 4-5

    5/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Ind icator i i s impl iai variabilitii

    3. Abaterea individual

    - msoar mprtierea fiecrei valori fa de nivelul mediu:

    xxd ii

    - au unitatea de msur a variabilei studiate;

    - sunt pozitive sau negative

    - abaterile mari indic o mprtiere ridicat, iar abaterile mici arat c valorile

    variabilei sunt concentrate n jurul mediei;

    - se compenseaz reciproc pe ansamblul colectivitii studiate, suma lor fiind

    nul

    0

    1

    n

    i

    i xx .

  • 7/30/2019 STATcom - Curs 4-5

    6/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Indicatorii sintetici ai variabilitii

    1. Abaterea medie liniar

    - se determin ca medie aritmetic a abaterilor individuale, considerate n valoare

    absolut:

    n

    xx

    d

    n

    i

    i

    x

    1

    - se exprim n unitatea de msur a caracteristicii

    - prezint dezavantajul c acord aceeai importan att abaterilor mici ct i

    abaterilor mari ale valorilor de la media lor (variabilitatea datelor este afectat, mai

    ales, de abaterile mari)

  • 7/30/2019 STATcom - Curs 4-5

    7/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Indicatorii sintetici ai variabilitii

    2. Dispersia(variance, n engl.)- se determin ca medie aritmetic a ptratelor abaterilor individuale ale valorilor de

    la tendina central, uzual de la medie deoarece cea mai mic sum a ptratelor

    abaterilor individuale fat de o constant se obtine pentru constanta :

    pentru un eantion (sample variance, n engl.) - estimator

    pentru populaia statistic parametru

    1

    1

    2

    2

    n

    xx

    s

    n

    i

    i

    N

    x

    N

    i

    i

    1

    2

    2

    x

    n

    i

    ia

    n

    i

    i axxx1

    2

    1

    2min

    R

  • 7/30/2019 STATcom - Curs 4-5

    8/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Indicatorii sintetici ai variabilitii- Dispersia

    Pentru o serie de distribuie de frecvene

    O formul mai simpl pentru determinarea dispersiei este:

    1

    1

    2

    2

    n

    nxx

    s

    r

    i

    ii

    r

    i

    inn

    1

    .

    11

    2

    1

    2

    2

    2

    1

    1

    2

    2

    n

    xnx

    ssaun

    n

    x

    x

    s

    n

    i

    i

    n

    i

    in

    i

    i

  • 7/30/2019 STATcom - Curs 4-5

    9/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Indicatorii sintetici ai variabilitii- Dispersia

    n practic, dispersia n eantion se calculeaz cu formula

    1

    1

    2

    2

    n

    xx

    s

    n

    i

    i

    pentru eantioane de volum redus ( 30n ),

    respectiv cu formula

    n

    xx

    s

    n

    i

    i

    1

    2

    2pentru eantioane de volum mare

    ( 30n ),

    deoarece se consider c, pentru un volum al eantionului suficient demare nn 1 .

  • 7/30/2019 STATcom - Curs 4-5

    10/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Proprietati ale mediei si dispersiei

    1.Dac fiecare valoare nixi ,1, se modific cu constanta c

    (crete cnd c>0 sau descrete cnd c

  • 7/30/2019 STATcom - Curs 4-5

    11/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Indicatorii sintetici ai variabilitii

    3. Abaterea standard(standard deviation, n engl.)- se determin ca medie ptratic din abaterile individuale

    pentru un eantion (sample standard deviation, n engl.) - estimator

    pentru populaia statistic parametru

    - reprezint rdcina ptrat a dispersiei

    - are unitatea de msur a variabilei studiate

    1

    1

    2

    2

    n

    xxss

    n

    i

    i

    N

    x

    N

    ii

    1

    2

    2

  • 7/30/2019 STATcom - Curs 4-5

    12/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Indicatorii sintetici ai variabilitii

    4. Coeficientul de variaie

    - reprezint expresia relativ a variabilitii, fiind calculat ca raport ntre abaterea

    standard i medie:

    - cu ct valoarea coeficientului de variaie este mai mic, cu att datele sunt mai omogene

    - seriile pentru care v30-35% sunt omogene, cu medii reprezentative ce caracterizeaz corect

    tendina central din colectivitate

    - dac dou serii statistice au coeficieni de variaie diferii, seria care are coeficientul de variaie maimic este mai omogen

    - dac coeficientul de variaie este mare atunci seria statistic se mparte n subserii omogene, dup

    un criteriu considerat cu influen semnificativ asupra variaiei

    100 x

    sv

  • 7/30/2019 STATcom - Curs 4-5

    13/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    ExempluPentru adecvarea promoiilor la cadourile de srbtori, un magazinrealizeaz un studiu referitor la veniturile clienilor, nivelul sumelor pealocate pentru cadouri, categoria socio-profesional.Datele referitoare la cheltuielile pentru cadouri, nregistrate pentru 14clieni, sunt:

    6,5 2,5 3 3,2 2,2 2,3 3 5 4 5,5 6,5 8 2 7

    media 4,34dispersia 4,17

    abaterea standard 2,04Coeficientul de variatie 47%

  • 7/30/2019 STATcom - Curs 4-5

    14/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Deoarece seria are un grad redus de omogenitate, clienii au fostmprii n 2 grupe, n funcie de categoria socio-profesional astfel:

    Cheltuieli pentru cadouri (sute lei)Pensionari (gr.1) Salariati (gr. 2 )

    2 32,5 53 4

    3,2 5,52,2 6,52,3 8

    6,57

    Pensionari (gr.1) Salariati (gr. 2 )medie 2,5 5,69dispersie 0,22 2,71abatere standard 0,47 1,65coeficient de variatie 19% 29%

  • 7/30/2019 STATcom - Curs 4-5

    15/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Regula de compunere a variabilitii

    Dac o serie statistica este alctuit din mai multe grupe

    componente, variaia totalse poate calcula dupa o schem

    cunoscut sub numele de regula de compunere a variabilitii

    totale.

    Abaterea fiecrei valori de la media total a seriei este explicat

    prin influena factorului de gruparei a altor factori ce acioneaz

    la nivelul fiecrei grupe.

    Putem cuantifica, astfel, ct din variaia caracteristicii studiate

    este explicat de factorul de grupare ales

  • 7/30/2019 STATcom - Curs 4-5

    16/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Regula de compunere a variabilitii

    Dac o serie statistic de volum n este alcatuita din m grupe, pentru fiecare grup de

    volum mini ,1, (

    m

    i

    inn1

    ) se pot determina mediile ( ix ) i dispersiile (2

    is ) astfel:

    Volumul grupei Media grupei Dispersia grupei

    Grupa 1111211

    ,,, nxxx 1

    n

    1

    11

    11

    1 n

    jjxnx

    1

    1

    2

    11

    1

    2

    1 1

    1 n

    jj

    xxn

    s

    Grupa 2222221

    ,,, nxxx 2

    n

    2

    1

    2

    2

    2

    1 n

    j

    jxn

    x

    2

    1

    2

    22

    2

    2

    21

    1 n

    j

    j xxn

    s

    Grupa iiinii

    xxx ,,, 21 in

    in

    j

    ij

    i

    i xn

    x1

    1

    in

    j

    iij

    i

    i xxn

    s1

    22

    1

    1

    Grupa m

    mmnmmxxx ,,, 21 mn

    mn

    j

    mj

    m

    m xn

    x1

    1

    mn

    j

    mmj

    m

    m xxn

    s1

    22

    1

    1

  • 7/30/2019 STATcom - Curs 4-5

    17/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Regula de compunere a variabilitii

    Abaterea individual de la media total poate fi descompus astfel:

    xxxxxx iiijij unde:

    m

    i

    ii

    m

    i

    n

    j

    ij nxn

    xn

    xi

    11 1

    11

    este media total a seriei.

    Prin ridicarea la ptrat i nsumarea fiecrui termen i folosind proprietile

    mediei se obine:

    grupedintrevariatia

    1

    2

    grupelorinterioruldinvariatia

    1 1

    2

    totalavariatia

    1 1

    2

    m

    i

    ii

    m

    i

    n

    j

    iij

    m

    i

    n

    j

    ij nxxxxxxii

  • 7/30/2019 STATcom - Curs 4-5

    18/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Regula de compunere a variabilitii

    Se noteaz:

    SST=

    m

    i

    n

    j

    ij

    i

    xx1 1

    2

    variatia totala sau variabilitatea totala, adica

    suma patratelor abaterilor individuale de la media totala a seriei(sum oftotal squares).

    SSW= m

    i

    n

    j

    iij

    i

    xx1 1

    2

    variatia din interiorul grupelor , adica

    suma patratelor abaterilor individuale de la mediile de grup (sum ofsquares within groups).

    SSB=

    m

    i

    ii nxx1

    2

    variatia dintre grupe , adica suma patratelorabaterilor mediilor de grup de la media total (sum of squaresbetween groups).

  • 7/30/2019 STATcom - Curs 4-5

    19/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Regula de compunere a variabilitii

    Relaia SST = SSW + SSB

    - se numete REGULA DE COMPUNERE A VARIABILITII TOTALE

    - permite determinarea dispersiei seriei cu formula

    1

    2

    n

    SSTs

    - permite determinarea msurii n care factorul de grupare influeneaz

    variaia caracteristicii studiate prin calculul coeficientului dedeterminaie:

    SST

    SSBR

    2

    sau, n expresie procentual, gradul de determinaie:

    100*2

    SST

    SSBR

  • 7/30/2019 STATcom - Curs 4-5

    20/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Regula de compunere a variabilitii

    Dac variatia dintre grupeSSBare o pondere mai mare n variatia

    total SSTatunci nseamn c factorul de grupare explic mai mult

    variaia caracteristicii studiate.

    Dac variatia din interiorul grupelorSSWare o pondere mai maren variatia total SSTatunci nseamn c variaia caracteristicii

    studiate este influenat de ali factori

    Se poate calcula coeficientul/gradul de nedeterminaie:

    22 1 RSSTSSWK 2

    %

    2

    % 100100 RSST

    SSWK

  • 7/30/2019 STATcom - Curs 4-5

    21/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Regula de compunere a variabilitii

    Dac se lucreaz cu eantioane de volum mare ( 30in ) atunci prin mprirea la n a relaiei:

    grupedintrevariatia

    1

    2

    grupelorinterioruldinvariatia

    1 1

    2

    totalavariatia

    1 1

    2

    m

    i

    ii

    m

    i

    n

    j

    iij

    m

    i

    n

    j

    ij nxxxxxxii

    SST = SSW + SSB

    Se obine relaia:

    n

    SSB

    n

    SSW

    n

    SST

  • 7/30/2019 STATcom - Curs 4-5

    22/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    REGULA DE ADUNARE A DISPERSIILOR

    1 1

    2

    n

    xx

    n

    SST

    m

    i

    n

    j

    ij

    i

    se noteaz cu2

    s i reprezint dispersia total

    n

    ns

    n

    xx

    n

    SSW

    m

    i

    ii

    m

    i

    n

    j

    iij

    i

    12

    1 1

    2

    se noteaz cu2

    s i reprezint media dispersiilor pariale

    n

    nxx

    n

    SSB

    m

    i

    ii

    1

    2

    se noteaz cu 2 i reprezint dispersia dintre grupe

    Relaia

    222 ss

    este cunoscut n literatura de specialitate ca REGULA DE ADUNARE A DISPERSIILOR

  • 7/30/2019 STATcom - Curs 4-5

    23/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Exemplu

    Pentru a analiza n ce proporie categoria socio-profesional influeneaz

    variaia cheltuielilor pentru cadouri se determin:

    SSW= 08.2097.1811.18

    1

    2

    22

    6

    1

    2

    11

    2

    1 1

    2

    jj

    jj

    i

    n

    j

    iij xxxxxxi

    i

    SSB= 11.348)34.469.5(6)34.45.2( 22

    2

    1

    2

    iii nxx

    SST=54,19

    %631002 SST

    SSBR

  • 7/30/2019 STATcom - Curs 4-5

    24/24

    Statistic n comer, turism, servicii

    asist. univ. dr. Vasile Alecsandru Strat

    Departamentul de Statistic i Econometrie

    Exemplu

    Pensionari Salariati

    jx1 2

    11xx j jx2

    2

    22xx j

    2 0,28 3 7,22

    2,5 0,00 5 0,47

    3 0,22 4 2,85

    3,2 0,44 5,5 0,04

    2,2 0,11 6,5 0,66

    2,3 0,05 8 5,35

    6,5 0,66

    7 1,72

    Total 11,16

    1

    211

    j

    jxx 97,18

    8

    1

    222

    j

    j xx