Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
ENM 317 MÜHENDİSLİK İSTATİSTİĞİ
İYİ UYUM TESTİ
Prof.Dr. Nihal ERGİNEL
ANADOLU ÜNİVERSİTESİ
İYİ UYUM TESTİ
Rassal değişkenin olasılık yoğunluk
fonksiyonunun ve parametresinin
bilinmediği, ancak belirli bir parametre
ile ilgili dağılımın test edildiği yöntemdir.
Ki- Kare Testi
Bir değişkenin kendi sınıflandırmasına göre, gözlenen
frekanslarının teorik(beklenen) frekanslar ile
uygunluk gösterip göstermediğinin ortaya konmasıdır.
Bir paranın 1000 kez atılması, bir zarın 600 kez
atılması, günlük gazete satışlarının dağılımı gibi.
X rassal değişkeninden n birimlik rastgele örnekler alınmış olsun. Bu
örneklerin ’ k ‘adet sınıfta histogramı çizilsin.
𝑂𝑖 : i. Sınıftaki gözlenen frekans (birim sayısı)
𝐸𝑖 : i. sınıftaki beklenen frekans olmak üzere,
(Bu oranın dağılımı serbestlik derecesi k-p-1 olan yaklaşık 𝜒2 ‘dağılımıdır.
k: sınıf sayısı
p: örnekten tahmin edilen parametre sayısı
𝜒2 yaklaşımı n büyüdükçe gelişir. )
Test istatistiği : 𝜒02 = 𝑖=1
𝑘 (𝑂𝑖−𝐸𝑖)2
𝐸𝑖
Ki- Kare Testi
Hipotezler :
𝐻0 : Gözlenen ve beklenen frekanslar arasında fark yoktur , eşittir.
𝐻𝑎 : Gözlenen ve beklenen frekanslar arasında fark vardır.
𝐻0 : Örnek ortalaması …., standart sapması … olan Normal dağılımdır.
𝐻𝑎 : Örnek ortalaması …., standart sapması … olan Normal dağılım
değildir.
NOT: Eğer gözlenen frekans çok
küçük ise, 𝜒2 dağılımı beklenen ile
gözlenen frekansların farkların
dağılımını temsil etmez. Eğer
gözlenen frekans 3,4,5 gibi küçük
sayılar ise bunları uygun sınıflar ile
birleştirmek gerekiyor.
Karar kuralı:
𝜒02 > 𝜒𝛼,𝑘−𝑝−1
2……………………….. 𝐻0 red
edilir.
Ki- Kare Testi
Test istatistiği : 𝜒02 = 𝑖=1
𝑘 (𝑂𝑖−𝐸𝑖)2
𝐸𝑖
ÖRNEK-1:
Bir bilgisayar programını test etmek için 0-9 arasında 1000 adet
rassal tamsayı türetilmiştir. Aşağıdaki tabloda her bir değerden
türetilen sayıların adetleri verilmiştir. Buna göre rassal sayı türetimi
doğru çalışmakta mıdır? (α =0,05)
0 1 2 3 4 5 6 7 8 9
Gözlenen
frekans (𝑂𝑖)
94 93 112 101 104 95 100 99 108 94
Beklenen
frekans (𝐸𝑖)
100 100 100 100 100 100 100 100 100 100
Ki- Kare Testi
ÇÖZÜM-1: Hipotezler:
𝐻0 : Rassal sayılar düzgün dağılmıştır.
𝐻𝑎 : Rassal sayılar düzgün dağılmamıştır.
Test istatistiği
χ02 =
𝑂𝑖−𝐸𝑖2
𝐸𝑖
Karar Kuralı
χ02 > χ2α,k−p−1 ……………………… 𝐻0 red
Ki- Kare Testi
İşlemler
χ02 =
94−100 2
100+ ……………….+
94−100 2
100
χ02 = 3,72
Sonuç:
i-) χ02 = 3,72 < χ20.05,9= 16,92 ……………..𝐻0 red
edilemez.
ii-) %95 güven seviyesinde rassal sayılar düzgün
dağılmıştır.
ÇÖZÜM-1:
Ki- Kare Testi
ÖRNEK-2:
Bir mağazada bir yıllık televizyon satışları incelenmiş ve
aylara göre sayıları aşağıdaki gibi bulunmuştur. Buna göre;
mağazanın aylık televizyon satışları arasında fark olup
olmadığını bulunuz. α=0,05
Ki- Kare Testi
ÇÖZÜM-2: Hipotezler:
𝐻0 : Aylara göre satılan TV sayıları arasında fark yoktur.
𝐻𝑎 : Aylara göre satılan TV sayıları arasında fark vardır.
Test istatistiği
χ02 =
𝑂𝑖−𝐸𝑖2
𝐸𝑖
Karar Kuralı
χ02 >χ2α,k−p−1……………………… 𝐻0 red
Ki- Kare Testi
ÇÖZÜM-2: İşlemler:
Beklenen TV satış sayısı= 276
12= 23 adet
TV satışları 𝐸1= 𝐸2=……..= 𝐸12 = 23
χ02 =
18−23 2
23+ 19−23 2
23+ …….+
21−23 2
23
= 15,3
Sonuç:
i-) χ02 = 15,3 < χ20,05;10 = 18,3 ……………..𝐻0 red edilemez.
ii-) %95 güven seviyesinde aylara göre TV satışı arasında fark yoktur.
Ki- Kare Testi
Paket ağırlıklarına ilişkin yapılan bir çalışma
için 1000 adet örnek alınmış ve ortalaması
99gr, standart sapması 1,63 gr olarak
örnekten bulunmuştur. Paket ağırlıkları
sınıflandırılmış ve aşağıda verilmiştir. Buna
göre paket ağırlıklarının verilen ortalama ve
standart sapma ile normal dağılıp
dağılmadığını %99,5 güven seviyesinde test
ediniz.
ÖRNEK-3:
Ki- Kare Testi
Sınıflar (paket ağırlıkları gr) Frekans
94 ≤ X < 96 100
96 ≤ X < 98 200
98 ≤ X < 100 500
100 ≤ X < 102 150
102 ≤ X < 104 40
104 ≤ X < 106 10
ÇÖZÜM-3: Hipotezler:
𝐻0 : Paket ağırlıkları (99;2,66) ile Normal dağılmaktadır.
𝐻𝑎 : Paket ağırlıkları (99;2,66) ile Normal dağılmamaktadır.
Test istatistiği
χ02 =
𝑂𝑖−𝐸𝑖2
𝐸𝑖
Karar Kuralı
χ02 > χ2α,k−p−1……………………… 𝐻0 red
Ki- Kare Testi
ÇÖZÜM-3:
𝑃1= P(94<X<96)= P(94−99
1,63<z<
96−99
1,63) = P(-3,067<z<-1,84)
= 0,4989-0,4671 = 0,0318
𝑃2= P(96<X98) = P(-1,84<z<-0,61) = 0,4671-0,2291= 0,238
Ki- Kare Testi
Sonuç:
i-) 𝜒02 = 195,94 > χ20,005; 2=10,6 ……………….𝐻0 red
ii-) %99,5 güven seviyesinde paket ağırlıkları
(99;2,66) ile normal dağılmamaktadır.
ÇÖZÜM-3:
Kolmogorov –Smirnov Testi
Gözlenen frekanslar ile beklenen
frekansların birbirlerine ne düzeyde
benzeştiğine dayanır. Ancak burada her
gözlenen ve beklenen frekans yerine,
birikimli frekansların dağılımının birbirine
benzeşimi araştırılır.
F(x)= P(X ≤ x) x rassal değişken değerinin χ değerine eşit ya da ondan küçük olması olasılığı )
𝐻𝑜 hipotezi ile her sınıfa düşen birikimli frekansların gözlenen-beklenen büyüklüklerinin birbirine eşit olduğu, aralarındaki farkın (D değerleri) tesadüfen ortaya çıkabilecek derecede küçük, önemsiz farklar olduğu biçimindedir.
D değerlerine ilişkin olasılıklar tablolaştırılmıştır.
𝐷0 = max 𝐹0 𝑥 − 𝑆𝑛(𝑥)
𝐹0 𝑥 =Beklenen birikimli frekans oranı
𝑆𝑛(𝑥) = Gözlenen birikimli frekans oranı
Kolmogorov –Smirnov Testi
Hipotezler :
𝐻0 : Gözlenen ve beklenen frekanslar arasında fark yoktur, eşittir.
𝐻𝑎 : Gözlenen ve beklenen frekanslar arasında fark vardır.
Test istatistiği:
𝐷0 = max 𝐹0 𝑥 − 𝑆𝑛(𝑥)
Karar kuralı:
𝐷0 > 𝐷𝛼;𝑛 …………………..𝐻0 red
Kolmogorov –Smirnov Testi
Satış teknikleri ile ilgili bir çalışmada,
ürün tercihlerine rafların etkisinin olup
olmadığı araştırılmaktadır. Aynı ürün 5
rafa yerleştirilmiş ve alınan ürün
miktarları gözlemlenmiştir. Buna göre
rafların konumunun ürün tercihinde
farklılık yaratıp yaratmadığını α= 0,05
anlam düzeyinde test ediniz.
ÖRNEK-1:
Raflar Ürün miktarı
1 0
2 2
3 0
4 10
5 8
Kolmogorov –Smirnov Testi
Hipotezler :
𝐻0 : Beş raftaki alıcı sayıları arasında fark yoktur, eşittir.
𝐻𝑎 : Beş raftaki alıcı sayıları arasında fark vardır.
Test istatistiği:
𝐷0 = max 𝐹0 𝑥 − 𝑆𝑛(𝑥)
Karar kuralı:
𝐷0 > 𝐷𝛼;𝑛 …………………..𝐻0 red
ÇÖZÜM-1:
Kolmogorov –Smirnov Testi
ÇÖZÜM-1:
Raf no 𝑂İ 𝐸İ 𝑆20(𝑥) 𝐹0(𝑥) D
1 0 4 0/20=0 4/20=0,2 0,2
2 2 4 2/20=0,1 8/20=0,4 0,3
3 0 4 2/20=0,1 12/20=0,6 0,5
4 10 4 12/20=0,6 16/20=0,8 0,2
5 8 4 20/20=1 20/20=1 0
𝐷0 = max 𝐹0 𝑥 − 𝑆𝑛(𝑥) = O,5
Kolmogorov –Smirnov Testi
20
ÇÖZÜM-1:
Sonuç:
i-) 𝐷0 = 0,5 >𝐷0,05;20 =0,294……………….𝐻0 red edilir.
ii-) % 95 güven seviyesinde raf konumları arasındaki
farkların ürün tercihlerine etkisi vardır.
Kolmogorov –Smirnov Testi
Bağımsızlık Testi
𝝌𝟐 Testi:
İki değişken arasında bir ilişki söz konusu ise, bu
ilişkinin varlığını ortaya koymak üzere Bağımsızlık testi
adı altında χ2 testi kullanılır.
Bir ana kütleden alınan n birimlik örnek iki farklı kritere
göre sınıflandırılmış olabilir. Bu test iki kriterin birbirleri
ile istatistiksel olarak bağımsızlığının olup olmadığını
ortaya koyar.
Örnek olarak, futbol maçı izleme ile cinsiyetin
ilişkisinin olup olmadığı (bağımlılık bulunup
bulunmadığı) ; televizyonda tercih edilen
program türü ile öğrenim düzeyi arasında bir
bağlantı olup olmadığı; çocuk sayısı ile annenin
çalışma durumu, trafik cezaları ile bayan/erkek
sürücü arasında bağlantı olup olmadığı gibi.
Kriterler 1 2 ………….. C
1 𝑂11/E11 𝑂12/E12 𝑂1𝑐
2 𝑂21/E21
.
.
.
.
r 𝑂𝑟𝑛 𝑂𝑟𝑐/Erc
Bağımsızlık Testi- 𝝌𝟐 Testi
Hipotezler:
𝐻0 : 1. Kriter ile 2. Kriter birbirinden bağımsızdır.
𝐻𝑎: 1. Kriter ile 2. Kriter birbirinden bağımlıdır.
Test istatistiği:
χo2 = 𝑖=1
𝑟 𝑗=1𝑐 (𝑂𝑖𝑗− 𝐸𝑖𝑗)
2
𝐸𝑖𝑗
Karar kuralı:
χo2 > χ2 α;(r−1)(c−1) ……………………… 𝐻0 red
Bağımsızlık Testi- 𝝌𝟐 Testi
ÖRNEK-1:
Bir firmada 3 farklı emekli planı
bulunmaktadır. Bu emekli planları
tercihleri ile kişilerin saat ücretli ve
maaşlı çalışması arasında ilişki olup
olmadığını, yani iki kriterin
birbirinden bağımsız olup
olmadığını α=0,05 anlam düzeyinde
test ediniz.
Bağımsızlık Testi- 𝝌𝟐 Testi
EM1 EM2 EM3 Toplam
Maaşlı 160 140 40 340
Saat ücretli 40 60 60 160
Toplam 200 200 100 500
Hipotezler:
𝐻0 : Çalışma şekli ile tercih edilen emekli planı birbirinden bağımsızdır.
𝐻𝑎: Çalışma şekli ile tercih edilen emekli planı birbirine bağımlıdır.
Test istatistiği:
χo2 = 𝑖=1
𝑟 𝑗=1𝑐 (𝑂𝑖𝑗− 𝐸𝑖𝑗)
2
𝐸𝑖𝑗
Karar kuralı:
χo2 > χ2 α;r−1;c−1 ……………………… 𝐻0 red
ÇÖZÜM-1: Bağımsızlık Testi- 𝝌𝟐 Testi
ÇÖZÜM-1:
İşlemler:
Beklenen değer= 500340
500*
200
500* = 136
χo2 =
(160− 136)2
136+ (140− 136)2
136+………………+
(60− 32)2
32= 49,63
Sonuç:
i-) χo2 =49,63 > χ20,05;2 = 5,99 ……………………… 𝐻0 red
ii-) Çalışma şekli ile tercih edilen emekli planı birbirine
bağımlıdır.
Bağımsızlık Testi- 𝝌𝟐 Testi
EM1 EM2 EM3 Toplam
Maaşlı 160/136 140/136 40/68 340
Saat ücretli 40/64 60/64 60/32 160
Toplam 200 200 100 500
Homojenlik Testi
Bağımsızlık testinde aynı ana kütleden
çekilmiş örnekler söz konusu iken, homojenlik
testinde 𝑛1 , 𝑛2 ,….. büyüklüğündeki
örneklerin farklı ana kütleden çekilmiş olması
söz konusudur.
Hipotezler:
𝐻0 : Sayılar kriterlere homojen dağılmışlardır.
𝐻𝑎: Sayılar kriterlere homojen dağılmamışlardır.
Test istatistiği:
χo2 = 𝑖=1
𝑟 𝑗=1𝑐 (𝑂𝑖𝑗− 𝐸𝑖𝑗)
2
𝐸𝑖𝑗
Karar kuralı:
χo2 > χ2 α;r−1;c−1 ……………………… 𝐻0 red
Homojenlik Testi
Farklı fakültelerde okuyan öğrencilerin,
tiyatroya gidiş sıklıklarının aynı olup olmadığı
incelemek istenmiştir. Bu amaçla Fen
fakültesinden 40 öğrenci, İİBF’den 42 öğrenci,
İletişim fakültesinden 38 öğrenciye tiyatroya
gidiş sıklığı sorulmuştur. Tablodaki verilere
göre öğrencilerin, tiyatroya gidiş sıklıklarının
homojen dağılıp dağılmadığını analiz ediniz.
(α=0,05)
ÖRNEK-1:
Homojenlik Testi
Fen İİBF İletişim Toplam
Sık 6 16 36
Seyrek 25 22 17 64
Hiç 9 6 5 20
Toplam 40 42 38 120
Hipotezler:
𝐻0 :Öğrencilerin tiyatroya gidiş sıklıkları fakültelere homojen dağılmıştır.
𝐻𝑎: Öğrencilerin tiyatroya gidiş sıklıkları fakültelere homojen dağılmamıştır.
Test istatistiği:
χo2 = 𝑖=1
𝑟 𝑗=1𝑐 (𝑂𝑖𝑗− 𝐸𝑖𝑗)
2
𝐸𝑖𝑗
Sonuç:
i-) χo2 =7,4 < χ0,05;4
2 = 9,49 ……………………… 𝐻0 red edilemez
ii-) %5 anlam seviyesinde farklı fakülte öğrencilerin tiyatroya gidiş sıklığı aynıdır.
ÇÖZÜM-1: Homojenlik Testi
Fen İİBF İletişim Toplam
Sık 6/12 16/11,4 36
Seyrek 25/21,3 22/22,4 17/20,3 64
Hiç 9/6,7 6/7 5/6,3 20
Toplam 40 42 38 120