17
Sayısal veriler için elde edilecek en kolay sınıflandırma, basit frekans dağılımlarının elde edilmesidir. Bunun için: veriler küçükten büyüğe (ya da büyükten küçüğe) doğru sıralanarak her bir gözlemden kaçar tane olduğu gözlemlerin karşısına yazılır. Sayısal Verilerin Sınıfl

BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER

  • Upload
    nerina

  • View
    142

  • Download
    0

Embed Size (px)

DESCRIPTION

BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER. Doç.Dr.İ.Safa GÜRCAN. DAĞILIMI TANIMLAYICI ÖLÇÜLER. ORTALAMALAR. UYGULAMA. SINIFLANDIRILMIŞ VERİLERDE ARİTMETİK ORTALAMANIN HESAPLANMASI. A.O: Aritmetik ortalama - PowerPoint PPT Presentation

Citation preview

Sayısal veriler için elde edilecek en kolay sınıflandırma, basit frekans dağılımlarının elde

edilmesidir.

Bunun için:veriler küçükten büyüğe (ya da büyükten

küçüğe) doğru sıralanarak her bir gözlemden kaçar tane olduğu gözlemlerin karşısına yazılır.

Sayısal Verilerin Sınıflandırılması

Canlı ağırlık Sayı %21,3

21,4

21,8

21,8

23,0

24,1

24,2

24,6

26,8

27,3

28,2

30,3

32,0

32,0

32,4

3,0

1,0

4,0

2,0

1,0

1,0

4,0

1,0

1,0

2,0

1,0

1,0

1,0

1,0

1,0

12,0

4,0

16,0

8,0

4,0

4,0

16,0

4,0

4,0

8,0

4,0

4,0

4,0

4,0

4,0

Toplam 25 100

Ancak dağılım aralığı (en büyük değerle en küçük değer

arasındaki fark) büyüdükçe basit frekans dağılımları kullanışsızlaşır.

Bu durum gözlem sayısının arttığı durumlarda daha da belirginleşir. Bu nedenle veriler

sınıflandırılır.

Sınıflandırma işlemlerinin belli adımları vardır.Sınıflandırmada kullanılan tanımlar:

1. Sınıf Sayısı: Oluşturulacak sınıf sayısıdır.Örnek:

50-5455-5960-6465-6970-74

Burada sınıf sayısı 5’tir

2. Sınıf Sınırı: Oluşturulacak her sınıfın bir alt ve bir üst sınırı vardır. Bu sınırlara sınıf sınırları denir. Örneğin 50-54 sınıfının alt sınırı 50 üst sınırı 54’tür.

3. Sınıf Aralığı (c): Ard arda gelen iki sınıfın üst sınırları ya da alt sınırları arasındaki farka sınıf aralığı denir. Yukarıdaki örnek için sınıf değeri= 2. Sınıfın alt sınır değeri ile 1. Sınıfın alt sınır değeri arasındaki fark 55-50=5’tir.

4. Sınıf Değeri: Her sınıfın alt ve üst sınır değerlerinin toplamının yarısıdır.Örneğin herhangi bir sınıfın alt sınırı 50 üst sınırı 54 ise Sınıf Değeri=(50+54)/2=52

5. Dağılım Aralığı: Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur.

Sınıflandırma İşleminde Dikkat Edilecek Noktalar

Sınıflandırma sonucunda, dağılımdaki bütün değerler sınıflara dağıtılabilmeli ve hiçbir değer sınıflama

dışında kalmamalıdır. Örneğin canlı ağırlık verileri 20-2526-3031-35

biçiminde olsaydı sınıflandırma işlemi yanlış olurdu. Çünkü 25-26 ve 30-31 arasında değerler varsa bu

gözlemlerin hangi sınıfta yer alacağı belli değildir ve sınıflama yapıldığında bu değerler dışarıda kalır.

Eğer virgülden sonra basamak varsa sınıflama işlemi yapılırken virgülden sonraki haneler

dikkate alınmalıdır. Örneğin bu sınıflandırma aşağıdaki gibi yapılabilir.

20,0-24,925,0-29,930,0-34,9

Sınıflama yaparken sınıflar birbirinin içine girmemelidir. Örneğin sınıfları

50-5454-5959-64

biçiminde oluşturmak hatalıdır. Çünkü 54 ve 59 değerleri iki ayrı sınıfta yer almaktadır.

Doğru olanı 50-5455-5960-64

olmalıdır.

Sınıf aralıklarının birbirine eşit şekilde düzenlenmesi, istatistiksel çözümlemede

kolaylık sağlar. Ancak gerektiğinde sınıf aralıkları eşit olmayabilir.

Dağılım hakkında yeterli bilgiye sahip olabilmek için oluşturulacak sınıf sayısının 8-15 arasında olması önerilmektedir. Sınıf sayısının az olması dağılım hakkında ayrıntılı bilgi elde etmemize

engel olur.

Örnek : Canlı ağırlık için 25 koyuna ilişkin verileri sınıflandıralım

Canlı ağırlık verilerinde En Küçük Değer (EKD)=21.3

En Büyük Değer (EBD)=32.4 ‘türDağılım Aralığı (DA) bulunur.

Bu örnek için DA = EBD-EKD = 11.1’dir.

Dağılım aralığı değeri belirlediğimiz sınıf sayısına bölünerek sınıf aralığı (C) bulunur. Örneğin

veriyi 4 sınıfta toplamak istersek

C=11,1/4=2,75 3

olur.(Sonuç tamsayı olacağı için yuvarlama yapılır).

Buna Göre sınıflar, dağılımdaki en küçük değerden başlamak üzere aşağıdaki gibi

oluşturulur.

EKD EBD21,3 24,224,3 27,227,3 30,230,3 33,2

Daha sonra her sınıfa düşen frekanslar 1 no’lu hayvandan başlamak üzere

çeteleme yapılır ve sayısı yazılır.

Canlı ağırlık

Çetele Sayı

21,3 24,2

24,3 27,2

27,3 30,2

30,3 33,2

////////////////

//

///

////

16

2

3

4

Canlı ağırlık

Frekans

(Sayı) %

Yığılımlı

Frekans

Yığılımlı

%

21,3 24,2

24,3 27,2

27,3 30,2

30,3 33,2

16

2

3

4

 64.0

8.0

12.0

16.0 

16

18

21

25

64.0

72.0

84.0

100.0

Toplam 25 100.0

Sınıflandırma Örneği sy 9

115 94 110 103 92 104 114 106 100 102

113 98 101 99 103 93 107 96 113 110

90 100 103 114 111 105 99 102 98 97

114 108 103 100 98 101 104 110 114 113

105 103 111 109 112 104 104 102 107 106

94 96 101 101 106 107 105 113 112 99

100 95 97 108 102 104 93 91 99 109

108 106 109 105 96

75 çocuğun boy uzunlukları ölçülmüş, veriler doğrultusunda sınıflandırma örneği

Max=115Min=90

DA=115-90=25

25/15<c<25/81,7<c<3,1

Çocukların Boy Uzunluğuna İlişkin Frekans Tablosu

Sınıflar Çetele Frekans

90-92 /// 3

93-95 ///// 5

96-98 ///// /// 8

99-101 ///// ///// // 12

102-104 ///// ///// //// 14

105-107 ///// ///// / 11

108-110 ///// //// 9

111-113 ///// /// 8

114-116 ///// 5

Toplam 75