24
Analiza datelor de marketing utilizand S.P.S.S. - curs introductiv - Mihai Orzan [email protected] joi, 19:30, sala 1406

Analiza primară a datelor

Embed Size (px)

Citation preview

Page 1: Analiza primară a datelor

Analiza datelor de marketing utilizand S.P.S.S.

- curs introductiv -

Mihai Orzan– [email protected]– joi, 19:30, sala 1406

Page 2: Analiza primară a datelor

Chestiuni organizatorice• Nota:

– Examen final (1 iunie): 40%– Test seminar: 60%

• http://orzanm.ase.ro/spss• Suport curs:

• Cătoiu I. (coord.), Bălan C., Dăneţiu T., Orzan Gh., Popescu I., Vegheş C., Vrânceanu D. - "Cercetări de marketing", Ed. Uranus, 2002

• Popa, D., “Analiza datelor in psihologie. Teorie si practica cu SPSS”, Ed. Polirom, 2008.

• Suport semiar (recomandat):• Howitt, D. si Cramer, D., “Introducere in SPSS pentru

psihologie”, Ed. Polirom, 2006.

Page 3: Analiza primară a datelor

Ce reprezinta analiza datelor?

Analiza datelor reprezinta un procescomplex si sistematic de aplicare a tehnicilor statistico-matematice, in scopulextragerii din colectia de date constituita a informatiilor necesare procesuluidecizional

Page 4: Analiza primară a datelor

Surse de date

• Surse de date:– Cercetari cantitative:

• Sondaje;• Observari;

– Surse secundare de date:• interne;• externe;

– Cercetari calitative:• focus grupuri;• clientul misterios;• interviuri in profunzime;• teste de utilitate;

Page 5: Analiza primară a datelor

Clasificare tipurilor de analiza

• Numarul esantioanelor cercetateUn singur esantion;Doua esantioane;Mai mult de doua esantioane;

• Natura relatiei dintre esantioaneEsantioane independente; Esantioane dependente;

Page 6: Analiza primară a datelor

Clasificare tipurilor de analiza

• Numarul variabilelor utilizate:O singura variabila (analiza univariata);Doua variabile (analiza bivariata);Mai mult de doua variabile (analiza

multivariata);• Natura relatiei dintre variabile

Variabile independente; Variabile dependente;

Page 7: Analiza primară a datelor

Obiectivele analizei

Determinarea tendintei centrale;Caracterizarea variatiei si dispersiei;Masurarea gradului de asociere;Realizarea de estimari si previziuni;Evaluarea semnificatiei diferentelor dintre

variabile si grupuri de variabile;Evidentierea legaturilor cauzale;

Page 8: Analiza primară a datelor

Obiectivele analizei

• Analiza primara a datelor• Masurarea tendintei centrale• Analiza variatiei• Stabilirea normalitatii distributiei

• Analiza diferentiala• Identificarea existentei unor diferente statistice

intre esantioane (grupuri) de respondenti• Analiza asociativa

• Identificarea existentei unor asemanari (asocieri) semnificative statistic variabile demografice sipsiho-comportamentale

Page 9: Analiza primară a datelor

Obiectivele analizei

Analiza inferentiala• Identificarea gradului in care valorile identificate la

nivel de esantion sunt reprezentative la nivelulpopulatiilor investigate

• Analiza predictiva• Identificarea evolutiei ulterioare a fenomenelor

investigate

• Analiza complexa a datelor• Analiza canonica, analiza discriminantului, analiza

structurilor latente• Modelare

Page 10: Analiza primară a datelor

Masurarea tendintei centrale

Indicatori ai tendintei centraleTipuri de scale

Modulul Mediana Media aritmetica

Media geometrica

Nominala X - - -

Ordinala X X - -Interval X X X X

Proportionala X X X X

Page 11: Analiza primară a datelor

Masurarea tendintei centrale

Grupul modal (modulul)Grupul care cuprinde cele mai multe componente comparativcu celelalte grupuri

MedianaValoarea care imparte numarul de observatii in doua grupuriegale

Media aritmetica

Media geometrican

xx

n

ii∑

== 1

nn

1iiG xx ∏

=

=∑=

∑== n

1i ip

n

1i ixip

px

Page 12: Analiza primară a datelor

Analiza variatiei

Distributia frecventelor (absolute si relative)Amplitudinea variatiei (Xmax-Xmin)Varianta

Abaterea medie patratica (standard)Coeficientul de variatie (variatia relativa)

∑= −

−=

n

1i

2i2

1n

︶x︵xσ

xσCV =

Page 13: Analiza primară a datelor

Distributia frecventelorPerceptia gustului pentru berea Redd’s

Eticheta Codificare Frecventa Frecventa(%)

Procent valid Frecventecumulate

Cel mai neplacut 1 0 0,0 0,0 0,0

Cel mai placut 7 4 13,3 13,8 100,0

Foarte neplacut 2 2 6,7 6,9 6,9Neplacut 3 6 20,0 20,7 27,6Nici/Nici 4 6 20,0 20,7 48,3Placut 5 3 10,0 10,3 58,6Foarte placut 6 8 26,7 27,6 86,2

Valori lipsa 9 1 3,3Total 30 100 100

Page 14: Analiza primară a datelor

Analiza variatiei

Tipuri de scaleIndicatori aidispersiei Nominale Ordinale Interval Proportionale

Frecvente X X X X

Amplitudine - X X X

Coeficient de variatie - - X X

Varianta - - X XAbatereastandard - - X X

Page 15: Analiza primară a datelor

Distributia normalaEste constituita dintr-o familie de distributii care au reprezentari grafice asemanatoare unui clopot;

Page 16: Analiza primară a datelor

Distributia normalaEste importanta pentru ca majoritatea instrumentelorstatistice utilizate in analiza primara au ca premisaexistenta unei distributii normale (ex.: testul Student, Mann-Whitney, ANOVA, Pearson, regresia, nivelareaexponentiala Brown, etc.).Ipoteza distributiei normale:

Pentru δ ales, δ procente dintre valorile inregistrate ale variabileise vor afla in intervalul:

︶σtx;σtx︵ δδ +−

Page 17: Analiza primară a datelor

Distributia normalaAplatizarea: reprezinta o masura a inaltimii relative a “clopotului” definit de distributia frecventelor variabilei.

Asimetria: tendinta variatiilor valorilor observate fata de medie de a fi mai mari catre unul dintre capetele intervaluluide valori.

23n

1i

2i

n

1i

3i

︶︶x︵x︵

︶x︵xn

2n1 ︶n ︵nG

=

=

−×

−−

=

3

︶︶x︵x︵

︶x︵xnK

2n

1i

2i

n

1i

4i

−−

−=

=

=

Page 18: Analiza primară a datelor

Distributia normalaInaltimea curbei este data de formula:

Testarea normalitatii distributiei:variabile parametrice: testul Kolmogorov-Smirnovvariabile ordinale: testul Shapiro-Wilkvariabile nominale: testul χ2

2

n

1ii

︶x︵x︵

2e

2π1h

==

−−

σ

Page 19: Analiza primară a datelor

Testul Kolmogorov-Smirnov

Utilizat pentru estimarea normalitatii distributiei acolounde se poate (are sens) calcula media si abatereamedie patratica.De fapt, determina care dintre ipoteze va fi adoptata:

H0: NU exista diferente semnificative statistic intredistributia variabilei investigate si distributia normala.H1: Exista diferente semnificative statistic intre distributiavariabilei investigate si distributia normala.

Page 20: Analiza primară a datelor

Testul Kolmogorov-Smirnov

Se calculeaza utilizand:

∑=

<=n

1i

︶x︵xn iI

n1

︵x ︶F

︶F ︵xni;

n1-i

︶F ︵x︵K ii

n

1iS max −−=

=

Page 21: Analiza primară a datelor

Testul Kolmogorov-Smirnov

H0 este acceptata daca:

unde:

αcnnKs ≤++ )11,012,0(

α 0,85 0,9 0,95 0,975 0,99

cα 1,138 1,224 1,358 1,480 1,628

Page 22: Analiza primară a datelor

Testul Shapiro-Wilk

Utilizabil atat pentru variabile non-parametrice, cat sipentru variabile parametrice (aici insa testulKolmogorov-Smirnov este mai puternic).Determina daca va fi adoptata ipoteza nula sau ipoteza alternativa:

H0: NU exista diferente semnificative statistic intredistributia variabilei investigate si distributia normala.H1: Exista diferente semnificative statistic intre distributiavariabilei investigate si distributia normala.

Page 23: Analiza primară a datelor

Testul Shapiro-Wilk

Se calculeaza utilizand:

ai reprezina parametrii dati, obtinuti din tabele statisticepe baza medianei, numarului de valori (categorii) distincte si dimensiunii esantionului investigat.p(W) > 0,05 => H0 este acceptata

altfel => H1 este acceptata

=

=

−= n

1i

2i

2n

1iii

μ ︶︵x

︶xa︵

W

Page 24: Analiza primară a datelor