Upload
jozsa-eva
View
18
Download
0
Embed Size (px)
DESCRIPTION
számvitel előadás anyaga
Citation preview
STATISZTIKA II.
Becslőfüggvények értékeléseAz átlag és értékösszeg becslése rétegzett mintából
3. előadás
Becslési kritériumok
� Torzítatlanság
� Hatásosság
� Konzisztencia
Becslési kritériumok
Torzítatlanság (becslőfüggvény várható értéke megegyezik a becsülni kívánt sokasági jellemzővel):
Torzítás mértéke:
θθ )ˆ( =E
θθθ −= )ˆ()ˆ( EBs
Becslési kritériumok
Becslés varianciája, pontossága
� Torzítatlan becslőfüggvény esetén:
� Torzított becslőfüggvény esetén (átlagos négyzetes hiba):
)ˆ()ˆ()ˆ( 2 θθθ BsVarMSE +=
)ˆ(θVar
Becslési kritériumok
Minimális variancia kritérium� Két torzítatlan becslőfüggvény közül azt tekintjük jobbnak,
melynek összes lehetséges mintán értelmezett varianciája kisebb.
� Torzított becslőfüggvények, illetve torzított és torzítatlan becslőfüggvények összehasonlítására az átlagos négyzetes hibát használjuk:
)ˆ()ˆ()ˆ( 2 θθθ BsVarMSE +=
)ˆ()ˆ( 21 θθ VarVar ⟨
Nagymintás kritériumok � Aszimptotikusan torzítatlan:
� KonzisztenciaHa torzítatlan, vagy legalább aszimptotikusan torzítatlan és
( ) θθ =nE ˆ lim
( ) 0ˆlim =nVar θ
)( ∞→n
)( ∞→n
FAE és EV minta összehasonlítása
� Várható érték
� Variancia
µ=)( FAEyE µ=)( EVyE
nyVar FAE
2
)(σ=
−≅N
n
nyVar EV 1)(
2σ≥( )( ) 1
1
1 ≥−
≈
N
nyVar
yVar
EV
FAE
A FAE becslés hibája nagyobb (legfeljebb ugyanakkora)mint az EVbecslésé.
FAE és EV minta összehasonlítása
Valamely nagyvárosban a háztartások megtakarítási hajlandóságának becslésére (N=8500) 400 elemű FAE mintát vettek. Mekkora mintára lenne szükség ugyanakkora pontosság és megbízhatóság mellett EV-kiválasztás esetén?
∆=⋅FAE
pn
zFAEσ
:
N
n
nnEV
EVFAE
−⋅= 111
∆=−⋅⋅N
n
nzEV EV
EV
p 1:σ
N
nn
nFAE
FAEEV
+=
1
→ 382≈EVn
8500400
1
400
+=EVn
→
Rétegzett mintavétel
Véges, heterogén (inhomogén) sokaság esetén használjuk. Először a sokaságot többé-kevésbé homogén rétegekbe soroljuk, majd a rétegekből egymástól függetlenül EV (ritkábban FAE) mintát veszünk.
Rétegzett mintavétel
� Cél: a mintavételi hiba csökkentése.
� Heterogén sokaságok esetén (ha jól választjuk meg a rétegképző ismérvet) azonos mintanagyság mellett kisebb mintavételi hibát eredményez, mint az EV kiválasztás. (Rétegenbelüli homogenitás előnyös tulajdonság.)
� További előny: az egyes rétegekre külön-külön is lehet becsléseket készíteni.
Jelölések
M a rétegek száma
N a sokaság számossága
a j-edik réteg nagysága
n a minta nagysága
a minta nagysága a j-edik rétegben
jN
jn
Minta elosztása a rétegek között
1. Egyenletes elosztás
M
nn j =
2. Arányos elosztás (önsúlyozó minta)
N
Nn
N
Nnn j
M
j j
jj ⋅=⋅=
∑ =1
N
N
n
n jj =
Minta elosztása a rétegek között
3. Neymann-féle optimális elosztás
∑ =
⋅=M
j jj
jjj
N
Nnn
1σ
σ
4. Költségoptimáliselosztás
j
M
j j
M
j jjj
jjjj
nC
ahol
N
Nnn
∑
∑
=
=−
−
=
⋅=
1
1
2/1
2/1
π
πσπσ
Minta elosztása (példa)
Évfolyam I. II. III.
Hallgatók %-os megoszlása 38 32 30
Tanulási idő szórása (óra) 2,3 2,0 1,5
Tegyük fel, hogy valamely főiskola 4200 nappali tagozatos hallgatója közül 300 fős, évfolyam szerint rétegezett mintát veszünk és a napi átlagos egyéni tanulási időt becsüljük egy előre kijelölt hétköznapi napra vonatkozóan.Ismeretes a hallgatók évfolyam szerinti megoszlása, továbbá szakértői becslésből a tanulási idő szórása évfolyamonként.
Minta elosztása (példa)
133445,03005,13,00,232,03,238,0
3,238,0300 ≅⋅=
⋅+⋅+⋅⋅⋅=In
98326,03005,13,00,232,03,238,0
0,232,0300 ≅⋅=
⋅+⋅+⋅⋅⋅=IIn
69229,03005,13,00,232,03,238,0
5,13,0300 ≅⋅=
⋅+⋅+⋅⋅⋅=IIIn
ÉvfolyamA rétegek aránya a sokaságon belül
(%)
Egyenletes elosztás
Arányos elosztás
Optimális elosztás
I. 38 100 114 133II. 32 100 96 98III. 30 100 90 69Összesen 100 300 300 300
M
nn j =
N
Nnn j
j ⋅=∑ =
⋅= M
j jj
jjj
N
Nnn
1σ
σ
Sokasági átlag becslése rétegzett mintából
� Becslés tárgya:
� Becslőfüggvény:
jMj
jjMj
N
YNY
1
1
=
=
∑
∑=
jjMj
M
jjj
M
jj
jj
M
jRR yW
N
yN
N
yNyY 1
1
1
1ˆ=
=
=
= ∑=∑
=∑
∑==
N
NW j
j =ahol:
� A főátlag varianciája:
Sokasági átlag becslése rétegzett mintából
−⋅∑≅
∑=
== j
j
j
jM
jj
M
jjjR N
n
nWyWVarYVar 1)ˆ(
2
1
2
1
σ
ahol: )(12
jj
j
j
j yVarN
n
n≅
−
σ
� Az átlagbecslés becsült standard hibája:
� Intervallumbecslés:
Sokasági átlag becslése rétegzett mintából
RyRR szyYInt ⋅+= −− 2/11 )( αα
Nagy minták esetén feltételezzük az átlagbecslés közelítőleg normális eloszlását.
−⋅∑==
= j
j
j
jM
jjyY N
n
n
sWss
RR
12
1
2ˆ
Sokasági átlag becslése rétegzett mintából (példa)
Egy gazdaságnak 6000 termő almafája van, melyből 4350 golden(G), 1650 idared (I) fajta. Közvetlen szüret előtt rétegzett mintavétellel becslik a várható össztermést. A felvétel eredményeit az alábbi táblázat tartalmazza:
Feladat:
Becsülje a várható össztermés határait 95%-os megbízhatósággal!
Fajtája elemszáma (fa)
átlag (kg/fa)
szórás (kg/fa)
Golden 240 104 28
Idared 160 92 20
GOLDEN
IDARED
Átlag becslése az egyes rétegekre
086,34350
2401
240
28)(
2
=
−≅GyVar
258,21650
1601
160
20)(
2
=
−≅IyVar
757,1086,3)( ==Gys
( ) 503,1258,2 ==Iys
44,37,100757,196,1104 ±→⋅±
95,292503,196,192 ±→⋅±
Sokasági átlag becslése rétegzett mintából (példa)
7,10092275,0104725,06000
9216501044350 =⋅+⋅=⋅+⋅=Ry
=
−⋅+
−⋅=1650
1601
160
20275,0
4350
2401
240
28725,0)ˆ(
22
22
RYVar
793,1258,2275,0086,3725,0)ˆ( 22 =⋅+⋅=RYVar
)( GyVar )( IyVar
Intervallumbecslés (átlag):
Intervallumbecslés (értékösszeg):
Sokasági átlag becslése rétegzett mintából
→±→⋅± 32,103;08,9862,27,100339,196,17,100
339,1793,1 ==Rys
tonna
=
⋅ 92,619;48,58832,103;08,986000
Arányos rétegzés:
� A sokasági átlag becslése:
� Az átlagbecslés varianciája:
jjj W
n
n
N
N==
∑∑
==∑
==
== M
j
M
jjj
jj
M
jjj
AR n
yn
yWN
yN
Y1
11ˆ
−⋅∑
=
N
n
nn
nYVar
j
jjAR 1)ˆ(
22 σ
∑⋅
−=n
n
N
n
nYVar
jjAR
2
11
)ˆ(σ
−=
−=N
n
nN
n
nB
B 111 2
2 σσ
Arányos rétegzés
∑⋅
−=n
n
N
n
nYVar
jjAR
2
11
)ˆ(σ
1
)( 212
−−∑
= =
j
jijni
j n
yys
j
−=N
n
nB 12σ
Szórások becslése a mintából:
∑= −
−=
M
j
jjB n
sns
1
22
1
)1(
Az átlagbecslés varianciáinak összehasonlítása
� FAE minta:
� EV minta:
� Arányos rétegzés:
−+=
−≅N
n
nN
n
nyVar KB
EV 11)(222 σσσ
nyVar FAE
2
)(σ=
−=N
n
nyVar B
AR 1(2
)σ
Nagyságrendi viszony adott n mellett:
)()()( AREVFAE yVaryVaryVar ≥≥
Varianciák összehasonlítása
( )( ) 1
1
1
22
2
2
2
2
2
≤+
==
−
−
=KB
BB
B
EV
AR
Nn
n
Nn
nyVar
yVar
σσσ
σσ
σ
σ
21 H−ahol:
a belső (rétegeken belüli) szórás
a külső (rétegek közötti) szórás
Bσ
Kσ
PÉLDA: Közvéleménykutatást végzünk egy politikus népszerűségéről EV minta alapján. Keressük a sokasági átlag 95,5%-os megbízhatósági szintű konfidencia-intervallumát.
Adatok:
n=1000
50
25
4,5% 2
Konfidencia intervallum:
A kiválasztási arány alacsony, a korrekciós faktor elhagyható.
=y=σ=α =z
58,1501000
25250)(5,95 ±=⋅±=EVYInt
AR minta alapján végzett közvéleménykutatásRétegezés pártszimpátia alapján
Számítás:
32,0501000
5250)(
2562560025
5,24600)5020(4,0)5070(6,0
5252,64,046,0
5,95
222
222
222
±=⋅±=
=σ⇒=+=σ+σ=σ
≅σ⇒=−⋅+−⋅=σ
=σ⇒≅⋅+⋅=σ
AR
KB
KK
BB
YInt
Rétegezés a nem ismérve alapján
58,1501000
25250)(
256250625
00)5050(5,0)5050(5,0
2525255,0255,0
5,95
222
222
2222
±=⋅±=
=σ⇒=+=σ+σ=σ
=σ⇒=−⋅+−⋅=σ
=σ⇒≅⋅+⋅=σ
AR
KB
KK
BB
YInt
Számítás: