55
Helyfüggő adatok statisztikai elemzése Berke Dávid

Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Helyfüggő adatok statisztikai elemzése Berke Dávid

Page 2: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Tartalom

•  Adatkezelési alapok

•  Egyváltozós elemzések

•  Többváltozós elemzések

•  Összefoglalás

2

Page 3: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

SPSS, avagy mit nem tud az Excel

•  Statisztikai funkciók

o  Ismeretlen ok-okozati összefüggések mérése

o  Attribútumok egymásra hatása

o  Automatikus paramétercsoportosítás

o  Nem releváns / hibás adatok detektálása

•  Adatbázis-kezelés

o  Data / Variable nézetek

o  Elemzési lépések mentése (futtatható Output)

3

Page 4: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Adatkezelési alapok

Page 5: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Tartalom •  Adatkezelési alapok

o  Statisztikai mutatók

o  Skálatípusok

o  Mintavételezés

o  Saját adathalmaz

•  Egyváltozós elemzések

•  Többváltozós elemzések

•  Összefoglalás

5

Page 6: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Statisztikai mutatók

•  Helyzetmutatók o  MEAN (számtani középérték)

o  MEDIAN (medián)

o  MODE (modusz)

•  Szóródási mutatók o  RANGE (terjedelem)

o  STANDARD DEVIATION (szórás)

o  VARIANCE (variancia)

6

•  Eloszlási alakmutatók o  KURTOSIS (csúcsosság)

o  SKEWNESS (ferdeség)

•  Egyéb mutatók o  SUM (összeg)

o  NUMBER OF CASES (esetszám)

o  MINIMUM

o  MAXIMUM

Page 7: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Metrikus, nem metrikus változók

•  Metrikus változó

o  Számérték alapú információ

o  Az adat a számérték eltárolt változata

o  Pl. idő, páratartalom, születési év

•  Nem metrikus változó

o  Az információ valamely tulajdonság megléte / hiánya

o  A tárolt adatok önkényesen számszerűsíteni kell

o  Pl. nem, teljesítmény (osztályzat), irányítószám

7

Page 8: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Skálatípusok

8

Skálatípus Tulajdonság Gyakorlati példa

Metrikus

Intervallum skála

Nincs természetes 0 pont páratartalom hőmérséklet idő

Arányskála Természetes 0 pont tömeg születési év, megszerzett kredit

Nem metrikus

Névleges skála Kategorizálás nem körzetszám IPv4 alhálózat

Sorrendi skála Sorrendi kategorizálás komfortzónák (pulzus) iskolai osztályozat QoS osztályok

Page 9: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Mintavételezés

1.  Sokaság meghatározása

•  Teljes / rész sokaság (elemzés típusa)

2.  Mintanagyság meghatározása

•  Megfelelő nagyságrend

3.  Mintavételi keret meghatározása

•  Mintavételi egységek (attribútum) választása

4.  Mintavételi technika kiválasztása

•  Véletlen / nem véletlen mintavétel

9

Page 10: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Saját adathalmaz

10

Page 11: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Egyváltozós elemzések

Page 12: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Tartalom

•  Adatkezelési alapok

•  Egyváltozós elemzések

o  Kiugró értékek vizsgálata

o  Eloszlás jellemzése

o  Paraméter kategorizálás

•  Többváltozós elemzések

•  Összefoglalás

12

Page 13: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Kiugró értékek vizsgálata

•  Cél: hibás, hiányzó, irreleváns elemek detektálása

•  Detektálási módok

o  Kézzel (Excel)

o  Grafikusan

•  Scatter graph (pontfelhő diagram)

•  Boxplot (dobozdiagram)

•  Kezelési módok

o  Elvetés / interpoláció

13

Page 14: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Scatter graph

14

Page 15: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Boxplot diagram

15

Page 16: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Eloszlás jellemzése

•  Szöveg (text) alapú vizsgálat

o  Stem-and-leaf (szár-levél) diagram

•  Vizuális normalitás vizsgálat

o  Q-Q Plot

16

Page 17: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Stem-and-leaf diagram

17

Page 18: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Q-Q görbe

18

Page 19: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Paraméter kategorizálás

19

Page 20: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Kategorizált paraméterek eloszlása

•  Histogram

20

Page 21: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Többváltozós elemzések

Page 22: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Tartalom •  Adatkezelési alapok

•  Egyváltozós elemzések

•  Többváltozós elemzések

o  Kereszttábla-elemzés

o  Variancia-elemzés

o  Korreláció és regresszió számítás

o  Klaszterelemzés

o  Diszkriminancia-elemzés

•  Összefoglalás

22

Page 23: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Gondolkodtató kérdések

•  Függ-e az egyetemi eredményességünk születésünk helyétől?

•  Hogyan osztanánk fel csoportokra egy (CPU, RAM, márka)

attribútum hármassal rendelkező, 500 elemszámú adathalmazt?

•  Egy fenti 3 paraméter külön-külön hány százalékban

magyarázza egy 4. (ár) változót?

•  Milyen módszerrel csökkentenéd egy 20 attribútumból álló

adathalmaz változóinak a számát?

23

Page 24: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Függő és független változók

•  Független változó (Independent)

o  Értéke nem függ más változók értékétől

•  Függő változó (Dependent)

o  Értékét más változók értékei alapján kapja

•  Függő-független kapcsolat

o  A függő változó értékét a független változók alapján kapja

o  { I } à D

24

Page 25: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Függőség alapú elemzési technikák

25

Független (Independent) változó

Függő (Dependent) változó

Nem metrikus Metrikus

Nem metrikus

Kereszttábla-elemzés Diszkriminancia-

elemzés

Metrikus Variancia-elemzés Korreláció és

regresszió elemzés

Page 26: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Kereszttábla-elemzés

•  Funkció

o  Két vagy több paraméter közti összefüggést (befolyásoltságot) vizsgál

•  Nem metrikus változókat (D, I) vizsgál.

•  Kapcsolat erősségét vizsgálja, irányát (ok-okozati viszonyt)

nem.

•  Mintanagyság maximális száma: 1000 rekord (SPSS)

26

Független (Independent) változó

Függő (Dependent) változó

Nem metrikus Metrikus

Nem metrikus

Kereszttábla-elemzés Diszkriminancia-

elemzés

Metrikus Variancia-elemzés Korreláció és

regresszió elemzés

Page 27: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Kereszttábla elemzés (példa)

•  Két kategorizált változó összehasonlítása

o  Átlagos helyezés (4 váltótag)

o  Átlagos beérkezési idő (váltó)

•  Mit is jellemez ez a változó?

27

Page 28: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Variancia-elemzés

•  Funkció

o  Két vagy több paraméter közti összefüggést, ok-okozati viszony ismeretében vizsgál

•  Metrikus (D), nem metrikus (I) változók jellemzik.

•  (D)-nek normális eloszlásúnak kell lennie.

28

Független (Independent) változó

Függő (Dependent) változó

Nem metrikus Metrikus

Nem metrikus

Kereszttábla-elemzés Diszkriminancia-

elemzés

Metrikus Variancia-elemzés Korreláció és

regresszió elemzés

Page 29: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Variancia-elemzés (példa)

•  Függ-e a helyezés a rajtszámról?

o  Független változó (I): rajtszám

o  Függő változó (D): helyezés (váltó)

29

Page 30: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Variancia-elemzés (példa folyt.)

30

Page 31: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Korreláció és regresszió elemzés

•  Korreláció-elemzés

o  Változók közti lineáris kapcsolat szorosságát és irányát méri

o  Függőséget az elemzés állapít meg

o  Értéke: [-1; +1] o Előjel: irány

o Nagyság: kapcsolat ereje

•  Regresszió-elemzés

o Változók közti lineáris összefüggést méri

o  Függőséget nekünk kell megadnunk (D, I)

31

Független (Independent) változó

Függő (Dependent) változó

Nem metrikus Metrikus

Nem metrikus

Kereszttábla-elemzés Diszkriminancia-

elemzés

Metrikus Variancia-elemzés Korreláció és

regresszió elemzés

Page 32: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Korreláció-elemzés (példa)

•  Elemzési lépések 1.  Metrikus változók kiválasztása

2.  Kiugró adatok ellenőrzése (Boxplot)

3.  Vizuális megjelenítés (Scatter plot)

4.  Korreláció kiszámítása

5.  Eredmények kiértékelése

•  Feladat o  Új adatbázis

o  Paraméterek: átlagtempó, célba érkezettek száma

32

Page 33: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Korreláció-elemzés (példa folyt.)

33

Page 34: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Regresszió-elemzés (példa)

34

•  Elemzési lépések

1.  Pontdiagram vizsgálata

2.  Regressziós egyenes felírása

3.  Paraméterbecslés (legkisebb négyzetek módszere)

4.  Lineáris kapcsolat kimutatása

5.  Kapcsolat erősségének vizsgálata

•  Feladat o  Paraméterek

•  átlagtempó

•  átlagéletkor

Page 35: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Regresszió-elemzés (példa folyt.)

35

Page 36: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterelemzés

•  Funkció

o  Teljes adathalmaz, kezelhető számú, homogén csoportba történő szétosztása

•  Folyamata

1. Változók kiválasztása

2. Klaszter feltételvizsgálat

3. Klaszterezési mód választása

4. Klaszterek számának meghatározása

5. Klaszterek jellemzése, értékelése

36

Page 37: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterelemzés 2. •  Folyamata (részletes)

1.  Változók kiválasztása

2.  Klaszter feltételvizsgálat o  Kiugró adatok vizsgálata

o  Skálakezelés: paraméter standardizálás

o  Korreláció kezelése

3.  Klaszterezési mód választása o  Hierarchikus (összevonó, felosztó)

o  Nem hierarchikus

4.  Klaszterek számának meghatározása o  Dendogram, koefficiens vizsgálat

5.  Klaszterek jellemzése, értékelése o  Elemszám vizsgálat

o  Klaszterek opcionális elnevezése 37

Page 38: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterelemzés (példa - feladatleírás)

•  Feladat

o  Három paraméter szerinti klaszterizálás

o  Új adatbázis

•  Bp. Félmaraton 2013

•  Egyéni versenyzők

o  Klaszterizálandó paraméterek:

•  Életkor (Year_STD)

•  Nem (Sex_num)

•  Beérkezési idő (Time_STD)

38

Page 39: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterelemzés (példa – klaszterszám)

39

Page 40: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterelemzés (példa - konfiguráció)

40

Page 41: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterezés (vizuális eredmények 1/6)

41

Page 42: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterezés (vizuális eredmények 2/6)

42

Page 43: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterezés (vizuális eredmények 3/6)

43

Page 44: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterezés (vizuális eredmények 4/6)

44

Page 45: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterezés (vizuális eredmények 5/6)

45

Page 46: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Klaszterezés (vizuális eredmények 6/6)

46

Page 47: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Diszkriminancia-elemzés

•  Funkció

o  Kategorizált változó (D) kategóriába tartozás helyességének vizsgálata (pl. klaszterizálás ellenőrzése)

o  (I) változók, a (D) változóra gyakorolt hatásának kimutatása, százalékos formában

o  változóredukció

•  Speciális elemzési feltételek

o  Megfelelő csoportnagyság (csoport számosság)

o  Megfelelő mintanagyság (független v. száma szerint)

47

Független (Independent) változó

Függő (Dependent) változó

Nem metrikus Metrikus

Nem metrikus

Kereszttábla-elemzés Diszkriminancia-

elemzés

Metrikus Variancia-elemzés Korreláció és

regresszió elemzés

Page 48: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Diszkriminancia-elemzés (példa - feladat) •  Feladat

o  A korábbi feladat klasztereinek

vizsgálata, a klaszterezési

paraméterek függvényében

o  Függő változó

•  K-K klaszterek (QCL_1)

o  Független változók

•  Életkor (Year)

•  Nem (Sex_num)

•  Beérkezési idő (FinTime) 48

Page 49: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Diszkriminancia-elemzés (diszkriminancia függvények [DF])

49

•  Fogalma o  Független változók lineáris kombinációjaként előálló látens (nem

valós) változó

•  Formulája

o   a: standardizációs konstans

o   Wi  : diszkriminancia-együttható (súly)

o   Xi  : független változó értéke

o   Z: diszkriminancia-érték

Page 50: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Diszkriminancia-elemzés (DF: sajátérték, variancia, korreláció)

50

•  Sajátérték (Eigenvalue) o  Adott DF relatív fontossága

•  Variancia (Variance)

o   DF-ek százalékos eloszlása

•  Kanonikus korreláció (Canonical Correlation)

o   Függő változó csoportjai közti variancia aránya a teljes varianciához

Page 51: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Diszkriminancia-elemzés (hatékonyság elemzés)

51

Page 52: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Diszkriminancia-elemzés (centroid ábrázolás DF diagramon)

52 DF1 (Year)

DF2 (FinTime)

Page 53: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Összefoglalás

Page 54: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Gondolkodtató kérdések •  Függ-e az egyetemi eredményességünk születésünk helyétől?

o  Kereszttábla-elemzés

•  Hogyan osztanánk fel csoportokra egy (CPU, RAM, márka) attribútum hármassal rendelkező, 500 elemszámú adathalmazt? o  Hierarchikus & nem hierarchikus klaszterelemzés

•  Egy fenti 3 paraméter külön-külön hány százalékban magyarázza egy 4. (ár) változót? o  Diszkriminancia-elemzés

•  Milyen módszerrel csökkentenéd egy 20 attribútumból álló adathalmaz változóinak a számát? o  Klaszterelemzés

o  Diszkriminancia-elemzés

54

Page 55: Helyfüggő adatok statisztikai elemzéseeit.bme.hu › sites › default › files › Oktatas › 2014-2015 › Berke... · 2018-02-20 · SPSS, avagy mit nem tud az Excel • Statisztikai

Köszönöm a figyelmet! e-mail: [email protected]