29
2.SUNUM

İSTATİSTİKSEL VERİLERİN TOPLANMASI VE DÜZENLENMESİ · halini gösteren çizgi grafiği 25 Frekans 0 Puan 2 4 6 8 10 12 14 16 36-44 45-53 54-62 63-71 72-80 81-89 90-98 9/27/2018

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

2.SUNUM

Belirli bir amaç için toplanmış verileri anlamlı haline getirmenin farklı yolları vardır.

Verileri sözel ifadelerle açıklama

Verileri tablolar halinde düzenleme

Verileri grafiklerle gösterme

Veriler üzerinde hesaplamalar yaparak istatistiksel ölçüler (ortalama gibi) elde etme

9/27/2018 2Yrd. Doç. Dr. Sedat Şen

Veriler üzerinde her zaman ilk yapılacak işlem veri değerlerini sıraya dizmektir. Bu sıralama işlemi büyükten küçüğe olabileceği gibi küçükten büyüğe olacak şekilde de yapılabilir.

Üzerinde herhangi bir işlem yapılmamış veriye ham veri denir.

9/27/2018 3Yrd. Doç. Dr. Sedat Şen

ÖĞRENCİ PUAN ÖĞRENCİ PUAN ÖĞRENCİ PUAN

AHMET 42 FATMA 97 NURCAN 98

AHMET 81 GÜLLÜ 86 ÖMER 88

AYBERK 61 HACER 98 RAHİME 93

AYŞE 93 HASAN 75 SAİT 36

AYŞEGÜL 84 HAZARE 79 SALİH 69

BEDİA 80 İMRAN 88 SEDAT 71

BETÜL 84 KEMAL 79 SONGÜL 86

BÜŞRA 93 KÜBRA 93 TUBA 93

CUMA 81 MEDİNE 79 TUBA 95

ELİF 87 MEHMET 52 ÜMRAN 87

ESMA 86 MEHMET 69 YASEMİN 73

FATMA 91 MEHMET 84 ZEYNEP 77

FATMA 93 MERVE 85 ZEYNEP 86

Yrd. Doç. Dr. Sedat Şen 4

Hiçbir şekilde işlenmemiş üzerinde herhangi bir işlem yapılmamış puanlardan oluşan veriye ham veri denir.

9/27/2018

İlgilenilen değişkenin almış olduğu değerlerin küçükten büyüğe veya büyükten küçüğe sıralanmasıyla oluşan seriye “basit seri” denir.

Ancak, gözlem sayısının çok fazla olduğu basit seri ile hangi değer çevresinde

yığılma olduğunu görmek zordur. Bu nedenle, basit serinin frekans veya gruplandırılmış seriye dönüştürülmesi daha yararlı olabilir.

9/27/2018 5Yrd. Doç. Dr. Sedat Şen

Verilerin düzenlenmesi,puanların büyükten küçüğe ya da küçüktenbüyüğe doğru

sıralanmasıyoluyla yapılır. Puanlar sıralandıktan

sonra puan dizisinin üst ve alt sınırları rahatça belirlenir.

Puanlar 36 ile 98 arasında değişiklik göstermekte ve bazı puanlar birden fazla

gözlenmektedir.

Yrd. Doç. Dr. Sedat Şen

ÖĞRENCİ PUAN ÖĞRENCİ PUAN ÖĞRENCİ PUAN

SAİT 36 BEDİA 80 ÖMER 88

AHMET 42 AHMET 81 İMRAN 88

MEHMET 52 CUMA 81 FATMA 91

AYBERK 61 MEHMET 84 KÜBRA 93

MEHMET 69 BETÜL 84 TUBA 93

SALİH 69 AYŞEGÜL 84 AYŞE 93

SEDAT 71 MERVE 85 RAHİME 93

YASEMİN 73 ESMA 86 FATMA 93

HASAN 75 GÜLLÜ 86 BÜŞRA 93

ZEYNEP 77 ZEYNEP 86 TUBA 95

KEMAL 79 SONGÜL 86 FATMA 97

HAZARE 79 ELİF 87 HACER 98

MEDİNE 79 ÜMRAN 87 NURCAN 98

69/27/2018

Puanlar Frekans Yüzde

36 1 2.56

42 1 2.56

52 1 2.56

61 1 2.56

69 2 5.13

71 1 2.56

73 1 2.56

75 1 2.56

77 1 2.56

79 3 7.69

80 1 2.56

81 2 5.13

84 3 7.69

85 1 2.56

86 4 10.26

87 2 5.13

88 2 5.13

91 1 2.56

93 6 15.38

95 1 2.56

97 1 2.56

98 2 5.13

Yrd. Doç. Dr. Sedat Şen 79/27/2018

İlgilenilen değişkenin almış olduğu farklı değerlerin küçükten büyüğe sıralanması ve bu değerlerin karşıısına kaç kez tekrar ettiğinin (frekansı) yazılmasıyla oluşturulan istatistik serisine “frekans serisi” denir.

9/27/2018 8Yrd. Doç. Dr. Sedat Şen

Öğrenci Yaş

Ahmet 20

Ayşe 20

Fatma 22

Mehmet 23

Derya 22

Gökhan 21

Hakan 22

Zeynep 23

Yunus 23

Zehra 23

9/27/2018 9Yrd. Doç. Dr. Sedat Şen

Yaş Frekans

20 2

21 1

22 3

23 4

9/27/2018 10Yrd. Doç. Dr. Sedat Şen

İlgilenilen değişken değerlerinin, belirlenen sınıflara (aralıklara) ayrılması ve bu sınıflara giren gözlem sayısının ayrı bir sütuna yerleştirilmesiyle oluşan seriye “gruplandırılmış seri” denir.

Frekans serisini, gruplandırılmış seri haline dönüştürürken sınıf aralığı büyüklüğü SturgesKuralı ya da araştırmacının görüşüne bağlı olarak belirlenir.

Sınıf aralığının keyfî olarak belirlenmesinde göz önüne alınması gereken kriter birbirine yakın gözlem değerlerinin bir araya getirilmesidir. Genellikle, en az 5 en fazla 20 sınıf sayısı önerilir.

9/27/2018 11Yrd. Doç. Dr. Sedat Şen

Elde edilen frekans tablosu uzunsa, bundan anlam çıkarmayı ve ilgili istatistiksel işlemleri kolaylaştırmak için, gözlenen ölçümleri teker teker sıralama yerine gruplama adı verilen bir işlem uygulanır. Gruplamanın amacı ardışık ölçümleri bir grup ya da kategoride toplamaktır. Bu sayede hem tabloyu kısaltabiliriz hem de istatistiksel hesaplamaları kolaylaştırabiliriz. Verileri gruplamaya karar verdikten sonra yapılacak ilk iş grup sayısına ve grup aralığına karar vermektir.

9/27/2018 12Yrd. Doç. Dr. Sedat Şen

Frekans tablosunda hem puanlar sıralanır, hem de puandan kaç tane olduğu sayılarak frekanslar bulunur. Ancak hem puan dağılımının hem genel durumu daha iyi görebilmek hem de hesaplamaları kolaylaştırmak için verilerin gruplandırılması gerekmektedir.

Verileri gruplandırırken öncelikle grup sayısı saptanır. Grup sayısının puan dağılımının gerçek özelliklerinin kaybolmaması için küçük seçilmemesine ve hesaplama işlemlerinin kolaylığı için büyük seçilmemesine dikkat edilmelidir. Ayrıca grup sayısının tek olması, puan dağılımında simetri sağladığı için, puanların 7,9,11 ve 13 gibi tek sayıda gruba ayrılması tavsiye edilir.

Yrd. Doç. Dr. Sedat Şen 139/27/2018

Veriyi gruplandırma yaparken:

Frekans tablosunun yaklaşık olarak kaç grup ya da kategoriden oluşması istendiği saptanır

Gözlenen en büyük ölçümden en küçük ölçüm çıkarılır.

En büyük ölçümle en küçük ölçüm arasındaki fark grup sayısına bölünür.

9/27/2018 14Yrd. Doç. Dr. Sedat Şen

Seçilecek olan aralık katsayısının durumu istatistiksel işlemleri etkiler. Aralık katsayısının çarpma ve bölme gibi işlemleri kullanacaksak kolaylık sağlaması açısından tam sayı olması daha iyidir.

9/27/2018 15Yrd. Doç. Dr. Sedat Şen

Puan Aralığı

Çetele Frekans Toplamlı Frekans

36-44 // 2 2

45-53 / 1 3

54-62 / 1 4

63-71 /// 3 7

72-80 /////// 7 14

81-89 ////////////// 14 28

90-98 //////////// 11 39

Yrd. Doç. Dr. Sedat Şen

(98-36)/7=8.9 aralık genişliği olarak hesaplanır. Bu katsayının 9 alınması uygun olur.

16

Puan Dağılımını7 gruba ayırmak istiyoruz

9/27/2018

Çalışmalarda, bazen istatistik serilerinde belli bir “değerden az” veya “değerden çok” gözlem sayılarına kolayca ulaşılmak istenebilir. Bu durumda, “birikimli seriler” söz konusudur. Gruplandırılmış seride her sınıfın frekansına, izleyen sınıfların frekansları eklenerek (veya toplam frekanstan eksiltilerek) oluşturulan seriye birikimli seri; birikimli seride her sınıfa karşı gelen frekansa da birikimli frekans ya da toplamlı frekans denir.

Birikimli seriler “-den az” ve “-den çok” olmak üzere iki şekilde oluşturulur.

Eğer, seride frekanslar eklenerek küçükten büyüğe doğru oluşturuluyorsa “-den az” serisi; büyükten küçüğe doğru eksiltilerek oluşturuluyorsa “-den çok” serisi söz konusudur.

9/27/2018 17Yrd. Doç. Dr. Sedat Şen

Aylık harcama Frekans Birikimli frekans

100-107’den az 3 3

108-114’den az 10 13

115-121’den az 12 25

122-128’den az 18 43

9/27/2018 18Yrd. Doç. Dr. Sedat Şen

Puanlar Frekans Toplamlı Frekans

36 1 1

42 1 2

52 1 3

61 1 4

69 2 6

71 1 7

73 1 8

75 1 9

77 1 10

79 3 13

80 1 14

81 2 16

84 3 19

85 1 20

86 4 24

87 2 26

88 2 28

91 1 29

93 6 35

95 1 36

97 1 37

98 2 39Yrd. Doç. Dr. Sedat Şen 199/27/2018

Toplamlı frekansın en altındaki değer sınıf mevcudunu verir. Bu veriye göre sınıf mevcudu 39’dur.

Yaş Frekans Birikimli Frekans

20 2 2

21 1 3

22 3 6

23 4 10

Tabloya göre 21 ve 21 yaş altındaki öğrenci sayısı 3’tür.Tabloya göre 21 yaş altındaki öğrenci sayısı 2’dir.

9/27/2018 20Yrd. Doç. Dr. Sedat Şen

iki veya daha fazla değişkene göre aldığı değerleri birlikte gösteren serilere “bileşik seri” denir. Değişken sayısı birden fazla olduğu için bu durumda değişkenlerden herhangi birine göre gözlem değerleri küçükten büyüğe doğru sıralanır ve diğer değişken değerleri de yeni sıralamaya göre düzenlenir. Bileşik seriler de basit, frekans ve gruplandırılmış seri olarak gösterilebilir.

9/27/2018 21Yrd. Doç. Dr. Sedat Şen

Boy (cm) Kilo (kg)

160 45

162 49

164 48

165 52

168 75

170 65

171 75

175 80

Bu tablo boy uzunluğuna göre sıralanmıştır.

9/27/2018 22Yrd. Doç. Dr. Sedat Şen

Günlük hayatta olsun, bilimsel çalışmalarda olsun, ilgilenilen olaya ilişkin sayılar

veya serilerin grafikle gösterimi daha yaygın olarak kullanılmaktadır. Çünkü, sayılara veya serilere bakıldığında görülemeyen birçok artış, azalış, eğilim gibi davranışlar grafik gösterimle kolayca görülebilir.

Pasta grafiği Çubuk grafiği Histogram Çizgi grafiği Serpilme grafiği

9/27/2018 23Yrd. Doç. Dr. Sedat Şen

21

1

3

7

14

11

Frekans

36-44

45-53

54-62

63-71

72-80

81-89

90-98

9/27/2018 24Yrd. Doç. Dr. Sedat Şen

Yrd. Doç. Dr. Sedat Şen

39 öğrencinin ölçme ara sınavından aldığı puanların gruplandırılmış halini gösteren çizgi grafiği

25

Frekans

Puan0

2

4

6

8

10

12

14

16

36-44 45-53 54-62 63-71 72-80 81-89 90-98

9/27/2018

Altın fiyatlarını gösteren 6 aylık grafik

9/27/2018 26Yrd. Doç. Dr. Sedat Şen

Yrd. Doç. Dr. Sedat Şen

39 öğrencinin ölçme ara sınavından aldığı puanların gruplandırılmış halini gösteren bar grafiği

27

Puan

Frekans

0

2

4

6

8

10

12

14

16

36-44 45-53 54-62 63-71 72-80 81-89 90-98

9/27/2018

Bu da aynı verinin histogram grafiği ile gösterilmesi.

Yrd. Doç. Dr. Sedat Şen 289/27/2018

0

2

4

6

8

10

12

14

16

36-44 45-53 54-62 63-71 72-80 81-89 90-98

F

r

e

k

a

n

s

Puan Grubu

Histogram

Frekans

Bileşik serilerde değişkenler arasındaki ilişkiyi gösteren grafiğe serpilme grafiği (diyagram›) denir. Serpilme grafiğinde yatay eksende değişkenlerden biri, düşey eksende bir diğeri olmak üzere, istatistik birimine ilişkin iki değişken için sayı çifti işaretlenir. İşaretlenen bu noktaların dağılması (serpilmesi) değişkenler arasındaki ilişki hakkında görsel olarak bilgi verir.

4549 48

52

75

65

7580

0

10

20

30

40

50

60

70

80

90

155 160 165 170 175 180

K

i

l

o

Boy

Boy-Kilo Grafiği

Kilo

Linear (Kilo)

9/27/2018 29Yrd. Doç. Dr. Sedat Şen