67
Statisztikai alapok_Eloszlások_Becslések 1 STATISZTIKAI ALAPOK

Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 1

STATISZTIKAI ALAPOK

Page 2: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 2

Pulzus példa

Egyetemista fiatalokból álló csoport minden tagjának (92 fő) megmérték a

pulzusát (PULSE1), majd kisorsolták ki fusson és ki nem (RAN). Futás után

újból mérték a pulzust (PULSE2).

A résztvevők néhány jellemzőjét (dohányzás, nem, magasság, testsúly stb.)

a pulzus adatokkal együtt táblázatos formában rögzítették. A táblázatban

egy sor egyazon személy adatait tartalmazza.

Page 3: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 3

MÉRÉSI SKÁLÁK, VÁLTOZÓK TÍPUSAI

• névleges (nominal, categorical)

• sorrendi (ordered categorical)

Minőségi változók (attributes)

• intervallum (interval)

• arányos (proportional)

Mennyiségi változók (variables)

Minden változótípust a megfelelő statisztikai módszerrel kell elemezni!

Page 4: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 4

LEÍRÓ STATISZTIKÁK

(számtani) átlag: az értékek számtani közepe

medián: sorba rendezve a „középső” érték

módusz: a leggyakoribb érték

Milyen mutatókkal jellemezhetjük az adatokat?

1. Helyzeti mutatók

N

i

ixN

x

1

1

Page 5: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 5

terjedelem: a max. és a min. érték közti különbség

kvartilis, interkvartilis terjedelem (IQR) – ld. később

szórásnégyzet és szórás (SD):

2. Szóródási mutatók

RSD%: relatív szórás

átlagtól való átlagos négyzetes eltérés

𝑅𝑆𝐷% =𝑠

ҧ𝑥∗ 100

N

i

i xxN

s

1

22

1

1

LEÍRÓ STATISZTIKÁK

Page 6: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 6

AZ ADATOK ÁBRÁZOLÁSA

Yogi Berra: " You can observe a lot by watching "

Page 7: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 7

Mérési adatok ábrázolása: Pont ábrázolás (Dotplot)

Sok adatra a dotplot nem elég informatív

Page 8: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 8

kvartilis

IQR

Mérési adatok ábrázolása: Dobozos ábra (Box-plot)

Page 9: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 9

Mérési adatok ábrázolása: hisztogram

Gyakorisági hisztogram

Page 10: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 10

Mérési adatok ábrázolása: hisztogram

Kumulált gyakorisági hisztogram

Page 11: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 11

rel. g y ak .

30

35

40

45

50

55

60

65

70

0% 5% 10% 15% 20% 25% 30%30

35

40

45

50

55

60

65

70

Max = 63 M in = 37

75% = 54.625% = 44.8

Median = 50.1

Dobozos ábra és hisztogram

szimmetrikus eloszlásból vett mintára

Page 12: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 12

frequency

0

2

4

6

8

10

12

14

16

18

20

0% 5% 10% 15% 20% 25%

0

2

4

6

8

10

12

14

16

18

20

M a x = 1 5 M in = 0 .

7 5 % = 7 . 62 5 % = 2 . 0

M e d ia n = 4 . 4

out l i e r

Dobozos ábra és hisztogram

aszimmetrikus eloszlásból vett mintára

Page 13: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 13

Két változó együttes ábrázolása

1. Hasonlítsuk össze a futás előtti és utáni

pulzus értékeket!

2. Hasonlítsuk össze nemek szerint a

testmagasságokat!

Page 14: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 14

3. Van-e összefüggés/kapcsolat a testmagasság

és a testsúly értékek között?

Két változó együttes ábrázolása

3/b. Készíthetünk informatívabb ábrát is?

Page 15: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 15

Milyen típusú kérdéseket tehetünk fel az adatsor láttán?

Milyen érték körül ingadoznak a mért nyugalmi pulzus-értékek

(átlag, medián)?

Mekkora a mért nyugalmi pulzus-értékek ingadozása (szórás)?

Nőtt a vizsgált személyek pulzusa a futás után?

MINTA (92 hallgató)

Csak ez érdekel minket?

Page 16: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 16

Milyen típusú kérdésekre keresünk majd választ a félév során?

Az egyetemista fiatalok (sokaságának) nyugalmi pulzus-értéke

milyen tartományban található adott (pl. 90%-os) valószínűséggel?

Az egyetemista fiatalok (sokaságának) nyugalmi pulzus-értéke

milyen határérték alatt található adott (pl. 95%-os)

valószínűséggel?

Milyen ingadozásra számíthatunk a pulzus értékekben, ha további

hallgatókat vonunk be a vizsgálatba?

Befolyásolja-e a futás a pulzus értékét? Várhatóan növekszik-e a

pulzus-érték a futás hatására?

Különbözik az egyetemisták testmagasságának várható értéke

nemek szerint?

SOKASÁG (lehetséges értékek)

Page 17: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 17

• Sokaság és minta

• Véletlen jelenség

• Valószínűségi változó

diszkrét vagy folytonos

• Sűrűség- és eloszlásfüggvény

• Statisztika és paraméter

• Véletlen és rendszeres hiba

ALAPFOGALMAK (Vázlat)

Page 18: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 18

Sokaság (population) és minta (sample)

• egyetemista fiatalok nyugalmi pulzus-értéke

• a szennyezett vízminta nitrát-koncentrációja

• egy alkatrészről lekerülő csavarok átmérője

• a futószalagon gyártott konzervek töltőtömege

• a lehetséges mérési eredmények

• a lehetséges gyártott darabok sokasága

a sokaság érdekel,

de a minta van a kezünkben!

Példák a sokaságra, mi lehet a minta az egyes esetekben?

Sokaság

(population)

Minta

(sample)Véletlen

mintavétel!

Page 19: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 19

Az ingadozás, bizonytalanság elkerülhetetlen:

• ha újra megmérjük ugyanannak a személynek a pulzusát, nem lesz

ugyanannyi

→ azaz az ismételt mérési eredmények nem lesznek azonosak

• ha másik napon / másik készüléken / másik személy mér, nem

kapunk ugyanolyan értéket

→ reprodukálhatósági ingadozás

• ha másik mintát veszünk a szennyezett vízből, nem lesz teljesen

azonos

• a gyártott termékpéldányok különböznek

• ha egy tételből többször veszünk mintát, a talált selejtarány változik

→ mintán belüli inhomogenitás

→ A mérési eredmények valószínűségi (véletlen) változók!

Page 20: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 20

Azok a mennyiségek, amelyeknek az értéke nem állandó,

hanem esetről esetre más és más, azonban meghatározható,

hogy mekkora valószínűséggel esnek megadott határok közé.

Valószínűségi változó fogalma

Page 21: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 21

Példák:

• pénzérme: fej/írás

• dobókocka dobás

x

p(x

)

0.00

0.08

0.16

0.24

0 1 2 3 4 5 6 7 8 9 10

Diszkrét valószínűségi változó

Kísérlet: dobjuk föl a pénzérmét 10-szer, az eredmény (kimenetel) : k-szor fej

kxPkp

x

F(x

)0.0

0.2

0.4

0.6

0.8

1.0

0 1 2 3 4 5 6 7 8 9 10

kx

i

i

xpkxPkF

Page 22: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 22

a b x

b

a

dxxfbxaP

Sűrűségfüggvény

(density function)

Folytonos valószínűségi változó

Példák:

• testmagasság, pulzus

• vízminta koncentrációja

Page 23: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 23

xi x

F(x)

F(xi)

ix

ii dxxfxxPxF

Eloszlásfüggvény

(distribution function)

Folytonos valószínűségi változó

Page 24: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 24

Statisztika (jellemző)

• várható érték (expected value)• számtani átlag (sample mean)

• medián

dxxxfxE )(

N

i

ixN

x

1

1

dxxfxExxVar x22

N

i

i xxN

s

1

22

1

1

- a sokaságot jellemzik

- konstansok

• tapasztalati medián

• szórásnégyzet (mean square) • variancia (variance)

és paraméter

- a mintát jellemzik

- valószínűségi változók

(korrigált)

Page 25: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 25

Várható értékre és a varianciára vonatkozó azonosságok /1

XcEcxE xVarccxVar 2

Példa

Egy lombikba töltött folyadék térfogatának várható értéke 10,05 cm3,

a térfogat varianciája 4*10-4 (cm3)2.

Mekkora a várható érték és a variancia mm3-ben?

Jelölje x a térfogatot cm3-ben.

05,10*10*1010 333 xExE

46233 104*10*1010 xVarxVar

A várható érték tehát 10050 mm3, a variancia pedig 400 (mm3)2.

Page 26: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 26

Várható értékre és a varianciára vonatkozó azonosságok / 2

Példa azonos eloszlású független változókra: ismételt mérések

→ Független mérés (ismétlés) fogalma

321321 xExExExxxE

321321 xVarxVarxVarxxxVar

Ha mindegyik xi azonos eloszlású és független:

xnExxxE n ...21 xnVarxxxVar n ...21

csak független val. váltózókra!

Page 27: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 27

Hiba: a mért érték és a valódi érték különbsége

Véletlen és rendszeres hiba

Véletlen hiba Rendszeres (és véletlen) hiba

mért értékek (x)

valódi érték (μ0)

A mérés

várható értéke [E(x)]

hol található

a két ábrán?

Torzítatlan mérés: Ha a mérés várható értéke megegyezik a valódi értékkel.

Page 28: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 28

2

2

1exp

2

1

xxf

Két paramétere van: és 2

xx

f(x)

különböző különböző

NORMÁLIS ELOSZLÁS

xE 2xVar

f(x)

Rövid jelölése: 2,N

Page 29: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 29

1,0~ Nz

A normális eloszlás eloszlásfüggvényét (F(x)) numerikus integrálással

számíthatjuk, azonban ehhez háromdimenziós táblázatra lenne szükség.

Célszerű tehát transzformációt keresnünk.

Normalizált (standardizált) normális eloszlás

xz 0zE 1zVar

2exp

2

1 2zzf

Page 30: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 30

Normalizált (standardizált) normális eloszlás

xz

0zE 1zVar

2exp

2

1 2zzf

z-táblázat használata

→ Nem szerepel benne egyetlen

paraméter sem

Page 31: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 31

Mire jó nekünk a z-táblázat?

azaahol

azzPaxP

Page 32: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 32

1. példa

Tegyük fel, hogy ismerjük az egyetemista fiatalok nyugalmi pulzus-

értékének eloszlását.

Kérdés: A fiatalok 90%-ának pulzusa milyen érték alatt található?

(Vagy egy véletlenszerűen kiválasztott fiatal pulzusa 90%-os

valószínűsége milyen érték alatt lesz?)

2. példa

Határozzuk meg azt a szimmetrikus intervallumot, melyben egy 10 g

tömegű súly (egyszeri) lemérésekor kapott érték 95%-os valószínűséggel

lesz, ha a mérés torzítatlan és varianciája 0,25 g2!

Példák a normális eloszlás alkalmazására

Page 33: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 33

0,05 0,01

1- 0,95 0,99

1-/2 0,975 0,995

z 1,96 2,58

xalsó xfölsõ

0z

z-z

/2/2

Mi változik a számításban,

ha 99%-os valószínűségi

intervallumot kérdezünk?

12/2/ zxzP

1fa xxxP

1fa zzzP

1fa zxzP

xz

α jelölést bevezetve:

Page 34: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 34

(Pl. azt kérdezzük, hogy milyen valószínűséggel esik a 10±0,5 intervallumba,

ha =10, =0,5)

3. példa

Határozzuk meg annak valószínűségét, hogy az x normális eloszlású

valószínűségi változó a (-σ , +σ ) intervallumba eső értéket vesz fel!

FFxP

alsóx felsőx

Page 35: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 35

x

0-1 1

P(x )

P(x)

z

xz

Page 36: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 36

1

alsóz 1

fölsőz

Intervallum

szélessége

±𝜎 ±2𝜎 ±3𝜎

z

P

Page 37: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 37

4. példa

Egy próbatest átmérőjére vonatkozó specifikáció: 9,6 cm±0,5 cm.

Sok (száz) darabot megvizsgálva azt találták, hogy az átlagos átmérő 9,5 cm,

a méret-ingadozás szórásnégyzete pedig 0,05cm2.

A próbatestek mekkora hányada nem felel meg a specifikációnak, azaz

mekkora lesz a selejtarány?

5. példa (2. példa módosítva)

A 10 g-os súlyt most ötször mérjük le. Milyen szimmetrikus intervallumban

lesz a mintaelemek átlaga 95%-os valószínűséggel? (A mérés torzítatlan és

varianciája 0,25 g2.)

Page 38: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 38

n

i

in xn

x...xxn

x11

21

xExEnn

xExExEn

xn

ExE n

n

i

i *1

...1

]1

[ 21

nn

xVarxVarn

nxVar

nx

nVarxVar x

n

i

i

n

i

ix

2

22

2 **111

A számtani középérték (átlag)

Page 39: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 39

Bármilyen eloszlású sokaságból vett minták számtani

középértéke közelítőleg normális eloszlást követ az eredeti

eloszlás várható értéke körül, varianciájuk pedig 2/n; tehát

N(, 2/n) eloszlású.

Centrális határeloszlási tétel

Page 40: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 40

x

f(x)

0.0

0.4

0.8

1.2

1.6

2.0

8 9 10 11 12

egyedi (x)xalsó xfölsõ

x

f(x)

0.0

0.4

0.8

1.2

1.6

2.0

8 9 10 11 12

átlag

átlagalsó átlag

fölsõ

95,055,096,11055,096,110 xP

95,05,096,1105,096,110 xP

12/2/ nzxnzP

xz

n

xz

12/2/ zxzP

Szűkebb intervallum!

2. példa 5. példa

Page 41: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 41

x

f(x)

0.0

0.4

0.8

1.2

1.6

2.0

8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0

átlag

egyedi

xalsó xfölsõ

átlagalsó átlagfö lsõ

Page 42: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

0.00

0.05

0.10

0.15

0.20

0 5 10 15 20 25

2

f(2

) =4

=7

=10

Statisztikai alapok_Eloszlások_Becslések 42

n

i

iz1

22

2E

2- (khi-négyzet-) eloszlás

22 Var

Egy paramétere van: ν

ami négyzetösszeg szabadsági foka

Page 43: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 43

f(2

)

2

2

2- táblázat használata

Page 44: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 44

A normális eloszlású sokaságból vett minta

tapasztalati szórásnégyzetének eloszlása

n

i

i xxn

s1

22

1

1

22

1

2

n

i

i xx

s2

2 2

(Részletes levezetése a Fisher-Cochran tétel felhasználásával az

előadáson.)

Bizonyítható, hogy:

Ezt felhasználva:

1 neloszlású szab. fokkal

eloszlású 1 n szab. fokkal

Page 45: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 45

6.a példa (5. példa szövege, de új kérdéssel)

Egy 10 g tömegű súlyt (etalont) ötször mérünk le.

Milyen szimmetrikus intervallumban lesz a minta szórásnégyzete 95%-os

valószínűséggel? (Az adatok normális eloszlásúak, varianciájuk 0,25 g2.)

2

f(2)

2

alsó 2

fölsõ

0.025

0.025

95,0222 fölsőalsó

sssP

4

4844,02975,0

2 alsó

143,112025,0

2 fölső

95,0222 fölsőalsóP

Page 46: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 46

95,0222 fölsőalsó

sssP

95,04

25,0143,11

4

25,04844,0 2

222

22222

sP

sPPfölsőalsó

fölsőalsó

95,022 fölső

ssP

6.b példa

Határozzuk meg azt az értéket, amelyet s2 95%-os valószínűséggel nem

halad meg!

488,9205,0

2 fölső

egyoldali!

95,0

222

fölső

sP

Page 47: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 47

7. példa

Egy oldat koncentrációját háromszor megmérve az alábbi adatokat kapták:

8,2; 8,3 és 8,5 mg/cm3.

a) Jellemezzük a mintát!

- statisztikák számítása (átlag, szórásnégyzet)

- valószínűségi/ingadozási tartomány számítása az átlagra és a

szórásnégyzetre (ha ismerjük a várható értéket és a varianciát)

Csak a minta érdekel minket?

Page 48: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 48

Paraméterbecslés

Konfidencia-intervallum

Becslésnél a sokaság tulajdonságaira (paramétereire)

következtetünk a minta adatai (jellemzői/statisztikái) alapján.

A becslés kivitelezése:

• Pontbecslés (egyetlen értéket ad meg)

• Intervallumbecslés: konfidencia-intervallum, amely bizonyos

valószínűséggel magában foglalja a paraméter igazi értékét

– kétoldali megbízhatósági intervallum

– egyoldali megbízhatósági intervallum

(alsó vagy felső határérték)

Page 49: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

STATISZTIKAI ALAPOK 49

1ULP

1LP

1UP

Pl. a várható értékre:

• egy L és U határolta (kétoldali) intervallum:

• A 100(1-α)%-os alsó L határ:

• A 100(1-α)%-os fölső U határ:

Page 50: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 50

b) Adjunk becslést a minta mögött álló sokaság varianciájára!

- pontbecslés

- intervallumbecslés (pl. 90%-os valószínűséggel)

1222fölsőalsó

P

22ˆ s

12

22

2

2

felsőalsó

ssP

7. példa folytatása

12

2

22

felsőalsó

sP

Page 51: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 51

c) Adjunk becslést a sokaság várható értékére!

- pontbecslés

- intervallumbecslés, ha a variancia előzetesen ismert

x

1felsőalsóP

Akkor számolhatunk z-eloszlással,

ha a varianciára van előzetes becslésünk!

És ha nincs? → t-eloszlással számolunk

7. példa folytatása

12/2/

nzx

nzxP

Page 52: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 52

Sokszor elvégezve a mintavételt a

számított konfidencia-intervallumok

adott %-ra lesz igaz, hogy tartalmazzák

a valódi paraméterértéket.

Tehát a konfidencia-intervallum határai

lesznek valószínűségi változók.

Konfidencia-intervallum szemlélete

Page 53: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 53

t

f(t)

0.0

0.1

0.2

0.3

0.4

-3 -2 -1 0 1 2 3

s

Ezt

2

E t 0

ns

xt=

pl.

t-eloszlás (Student-eloszlás)

Egy paramétere van: ν

ami a nevezőben szereplő

szórás szabadsági foka (n-1)

Page 54: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 54

t-táblázat használata

/2 /2

-t/2 t

/20

f(t)fejlécben:

α a kétoldali kritikus értékhez

láblécben:

α az egyoldali kritikus értékhez

Page 55: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 55

c) Adjunk becslést a sokaság várható értékére!

- pontbecslés ✓

- intervallumbecslés, ha a variancia előzetesen ismert ✓

- intervallumbecslés, ha a variancia előzetesen nem ismert

7. példa folytatása

122 tttP

122 nstxnstxP

1felsőalsóP

ns

xt=

Page 56: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 56

8. (gyakorló) példa

10 ismételt mérés eredménye a következő:

24,46; 23,93; 25,79; 25,17; 23,82; 25,39; 26,54; 23,85; 24,19; 25,50.

- Adjunk 95%-os konfidencia-intervallumot a várható értékre!

- Adjuk meg a várható érték alsó 95%-os konfidencia-intervallumát!

Konfidencia-intervallum_1

Variable

Mean Std.Dv. N Confidence

-95,000%

Confidence

+95,000%

x 24,8640 0,94571 10 24,1875 25,5405

Konfidencia-intervallum_2

Variable

Mean Std.Dv. N Confidence

-95,0%

x 24,8640 0,94571 10 24,3158

Page 57: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 57

9. (gyakorló) példa

Egy nyolc elemű mintából számolt szórásnégyzet értéke 0,023.

- Adjunk 90%-os konfidencia-intervallumot a varianciára!

- Milyen határérték felett van a sokaság varianciája 90%-os valószínűséggel!

90,0222 fölsőalsó

P

90,00743,00114,0 2 P

167,2)7(2

95,0

)7(2 alsó

067,14)7(2

05,0

)7(2 felső

90,022 alsó

P

90,02

22

2

2

felsőalsó

ssP

90,0

2

22

felső

sP

017,12)7(2

1,0

)7(2 felső

90,00134,0 2 P

Page 58: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 58

Legyen és két, egymástól független, 2-eloszlású valószínűségi változó

1, ill. 2 szabadsági fokkal.

Az alábbi kifejezés F-eloszlású, ahol a számláló szabadsági fokainak száma

1 , a nevezőé 2 :

1

2 2

2

22

22

21

21

/

/

s

sF

, akkor 1

2

2

2ha22

21

s

sF

F-eloszlás

F

1

2

1

2

2

2

Page 59: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 59

F-táblázat használata

f(F)

F F

121

21,

1,

F

F

21,

1205,0

2195,0,

1,

FF pl.

Page 60: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 60

Minthogy azonos módszerről van szó, a variancia változatlan:2

2

2

1

9. példa

2 analitikus azonos analitikai módszerrel egy-egy méréssorozatot végez,

amelyek 4 ill. 7 mérésből állnak. Milyen intervallumban lesz 90 %

valószínűséggel a két minta szórásnégyzetének aránya?

0,90=22

21

fölsőalsó F

s

sFP

76,46,305,0 FF felső

112,094,8

1

3,6

16,3

05,095,0

FFFalsó

Page 61: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 61

Paraméterbecslés (folytatás)

a

b

c

f

paraméterbecslés

A becslés valószínűségi változó!

- a jobb becslés mint b,

mert kisebb a várható

érték körüli ingadozása

- c becslésnél a várható

érték nem a paraméter

- a és b becslés torzítatlan

Page 62: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 62

Torzítatlan becslés: nE ˆ

torzítás: nE ˆ

korrekció: nE ˆ

Aszimptotikusan torzítatlan becslés:

nn

E ˆlim

A becslések tulajdonságai

Page 63: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 63

Torzítatlan becslés nE ˆ

Példák:

4xE

n

x

x i

i

i

i

i

i

i xExEnn

xEn

xE11

4ˆ x

- A számtani átlag torzítatlan becslése a várható értéknek

- Az n-edik mért érték torzítatlan becslése a várható értéknek

Page 64: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 64

A becslés hatásosságának mértéke a varianciája.

Minél kisebb a variancia, annál hatásosabb (efficiensebb) a becslés.

x n

xVar2

4ˆ x 2

4 xVar

hatásosabb

kevésbé hatásos

A becslés hatásossága:

Példák:

Page 65: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 65

Konzisztens becslés: 0ˆlim

nn

P

A minta elemszámának növelésével a becslés a paraméter igazi

értékéhez tart, pontosabban n növelésével egyre csökken annak

valószínűsége, hogy -tól jelentősen eltérjen.

nn

x

4ˆ x

konzisztens

nem konzisztens

Példák:

Page 66: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 66

Közepes négyzetes hiba (Mean square error)

22ˆˆˆˆ EEEEMSE

22

ˆˆˆ EEE

2ˆ biasVar

A becslések általánosabb minősítése

bias = torzítás

Page 67: Statisztikai alapokkkft.bme.hu/attachments/article/46/Diasor_StatAlapok_Eloszlasok_Becslesek_20190908.pdfStatisztikai alapok_Eloszlások_Becslések 37 4. példa Egy próbatest átmérőjére

Statisztikai alapok_Eloszlások_Becslések 67

• legkisebb négyzetek módszere:

a mért adatok és a becslés közötti eltérések négyzetösszegét

minimalizálja,

pl.

• maximum-likelihood módszer:

azt a sűrűségfüggvényt, illetve paramétereit fogadjuk el becslésként,

amelyből a legnagyobb valószínűséggel kapnánk a ténylegesen

kapott mérési adatokat.

xii

n

min2

1

Becslési módszerek