26
Örnekleme ve Örneklem Dağılımları Yrd. Doç. Dr Hamit ACEMOĞLU

Örnekleme ve Örneklem Dağılımları

  • Upload
    harry

  • View
    105

  • Download
    7

Embed Size (px)

DESCRIPTION

Örnekleme ve Örneklem Dağılımları. Yrd. Doç. Dr Hamit ACEMOĞLU. Amaç. Bu dersin amacı:Öğrencilerin b u konu sonunda örnekleme ve örneklem dağılımları hakkında bilgi sahibi olması amaçlanmıştır. 1. sınıf Biyoistatistik 2009-2010. 2. Öğrenim Hedefleri. - PowerPoint PPT Presentation

Citation preview

Page 1: Örnekleme ve Örneklem Dağılımları

Örnekleme ve Örneklem Dağılımları

Yrd. Doç. Dr Hamit ACEMOĞLU

Page 2: Örnekleme ve Örneklem Dağılımları

Amaç

• Bu dersin amacı:Öğrencilerin bu konu sonunda örnekleme ve örneklem dağılımları hakkında bilgi sahibi olması amaçlanmıştır.

21. sınıf Biyoistatistik 2009-2010

Page 3: Örnekleme ve Örneklem Dağılımları

Öğrenim Hedefleri

• Hedefler: Bu konu sonunda öğrencilerin aşağıdaki hedeflere ulaşması beklenmektedir:

• Neden örnekleme yaptığımızı açıklayabilmek• Örneklem hacmini etkileyen faktörleri sayabilmek • Örnekleme çeşitlerini açıklayabilmek• SEM ve SEP formüllerini yazabilmek• SD ve SEM kullanım alanlarını açıklayabilmek

31. sınıf Biyoistatistik 2009-2010

Page 4: Örnekleme ve Örneklem Dağılımları

• İstatistik yaparken genelde bir toplumun tamamı hakkında bilgi toplamak ve yorum yapmak isteriz.

• Ancak, toplumun tamamından veri elde etmek gerek zaman, gerekse ekonomik açıdan genelde mümkün olmaz.

• Bu nedenle toplumu temsil edecek bir örneklemden veri toplar ve o verileri kullanarak toplum hakkında çıkarımlar yaparız.

41. sınıf Biyoistatistik 2009-2010

Page 5: Örnekleme ve Örneklem Dağılımları

• Toplumdan bir örneklem aldığımızda örneklemimizin toplumu tamamen temsil edemeyeceğini tahmin edebiliriz.

• Toplumun sadece bir kısmını inceleyerek bir örnekleme hatası oluşturmuş oluyoruz.

• Bu derste teorik dağılımları kullanarak bu hatayı hesaplamayı öğreneceğiz.

51. sınıf Biyoistatistik 2009-2010

Page 6: Örnekleme ve Örneklem Dağılımları

Örneklem Hacmini Etkileyen Faktörler

• Veri tipi– Kategorik : Yüzde ya da oran– Sayısal : Ortalama

• Yaygınlık• Alfa (α) önemlilik düzeyi• Testin gücü (1-β)• Etki Genişliği (Δ)

– Hipotez testi sonucunda doğru olarak saptayabilmek istediğimiz en küçük değişiklik miktarıdır. Diğer bir deyişle, yokluk hipotezinde ve alternatif hipotezde belirtilen değerler arasındaki farktır.

• Kitlenin büyüklüğü (N)

Page 7: Örnekleme ve Örneklem Dağılımları

Kitle oranını kestirmek için örneklem büyüklüğü

n: örnekleme alınacak birey sayısıp: incelenen olayın görülüş sıklığıt: belirli serbestlik derecesinde ve saptanan yanılma düzeyinde t tablo değerid: olayın görülüş sıklığına göre yapılmak istenen sapma

2

21dzpp

n )(

Kitle büyüklüğü N bilinmediğinde

2)(

2

2)(

z)P1(Pd)1N()P1(PNz

n

Kitle büyüklüğü N bilindiğinde

Page 8: Örnekleme ve Örneklem Dağılımları

ÖRNEK: Malnütrisyon oranının p=0.15 olduğu daha önce yapılan

bir çalışmada saptanmış olsun.

Bir araştırıcı yapacağı araştırmada bu değerin 0.05 “d” sınırları içinde yani, bulacağı değerin 0.10 – 0.20 arasında olmasını,

Bu sınırlar arasına =0.05 yanılma düzeyinde başka bir ifadeyle %95 güvenirlikle bulunmasını istemektedir.

Araştırıcı çalışmayı kaç kişi üzerinde yürütmelidir?

Page 9: Örnekleme ve Örneklem Dağılımları

19605.0

96.1)85.0x15.0(n2

2

Sonuç: Toplumda 0.15 oranında görülen bir olayın % 95 olasılıkla 0.10-0.20 sınırları arasında incelemesi isteniyorsa en az “196” birey üzerinde çalışılmalıdır.

Page 10: Örnekleme ve Örneklem Dağılımları

2

22

dz

n

: kitle standart sapması

d: ortalamaya göre yapılmak istenen sapma

Kitle ortalamasını kestirmek için örneklem büyüklüğü

222

22

1

zNdNz

n

)(

Kitle büyüklüğü N bilinmediğinde

Kitle büyüklüğü N bilindiğinde

Page 11: Örnekleme ve Örneklem Dağılımları

Uygun Örnekleme Yöntemi

• Örneklemede Rasgelelik

• Örneklemede Rasgelelik, kitledeki her deneğe örnekleme seçilme yönünden eşit şans verilmesidir.

• Bu şansın eşitlenememesi durumunda; örneklemeden elde edilecek sonuçlardaki hatalar rasgele olmayacağı için sonuçlar yanlı olur.

• Örneklemede yansız sonuçlar elde edebilmek için rasgelelik koşullarına uyulmalıdır.

111. sınıf Biyoistatistik 2009-2010

Page 12: Örnekleme ve Örneklem Dağılımları

Örnekleme Yöntemleri

Olasılıksız Örnekleme Olasılıklı Örnekeleme

Kota Örneklemesi

Kartopu Örneklemesi

B. Rasgele Örnekleme

Tabakalı Örnekleme

Küme Örneklemesi

Page 13: Örnekleme ve Örneklem Dağılımları

Olasılıklı Örnekleme Yöntemleri

• Olasılıklı örnekleme yöntemlerinde örnekleme seçilecek örnek birimlerine eşit şans verilir.

• Örnek birimlerine eşit şans verilerek kitledeki değişkenliğin örneklemde korunması sağlanır. Böylece örneklemin kitleyi temsil yeteneği artırılmış olur.

• Kitledeki her örnek birimine örnekleme seçilme yönünden eşit şans verebilmek için kitledeki birimler arasından rasgele seçim yapılır.

• Rasgeleliği sağlayabilmek için rasgele sayılar tablosu yada rasgele sayı üreten bilgisayar yazılımlarından yararlanılır.

131. sınıf Biyoistatistik 2009-2010

Page 14: Örnekleme ve Örneklem Dağılımları

Basit Rasgele Örnekleme

• Basit Rasgele Örnekleme, elde edilmesi istenen bilgide farklılık yaratacak herhangi faktörün olmadığı, kitledeki deneklere ulaşmanın olanaklı olduğu durumlarda basit rasgele seçim yöntemine göre örneklem oluşturulmasına denir.

• Bu yöntemde uygun örneklem büyüklüğü belirlendikten sonra, basit rasgele örnek seçim yöntemi ile örnekler seçilir. Seçim sonrası oluşan örneklem istatistikleri hesaplanarak kitle parametreleri için kestirimler yapılır.

141. sınıf Biyoistatistik 2009-2010

Page 15: Örnekleme ve Örneklem Dağılımları

Tabakalı örnekleme

• Bu örnekleme, toplanmak istenen bilginin doğruluğunu etkliyecek faktörler olduğunda, kitleyi bu faktör gruplarına göre tabakalara ayırarak her tabakadan ayrı ayrı örneklem seçerek yapılır.

• Her tabakan ayrı örneklem seçerek, tabakaların(faktör gruplarının) kitledeki değişkenliği örneklemde de korunarak örneklemin kitleyi temsil yeteneği artırılmış olur.

• Tabakalı örneklemeden iyi sonuç alabilmek için– Tabakalar, kendi içinde homojen– Tabakalar, kendi aralarında heterojen olmalıdır.

151. sınıf Biyoistatistik 2009-2010

Page 16: Örnekleme ve Örneklem Dağılımları

Küme Örneklemesi

• Kitledeki deneklerin listelenemediği bu nedenle tek tek deneklere ulaşmanın olanaksız olduğu durumlarda kullanılan örnekleme yöntemidir.

• Bu yöntemde, kitle birbirine benzer deneklerden oluşan kümelere (denek grupları) ayrılır.

• Bu yöntemde, denek seçme yerine küme seçilerek örneklem oluşturulur.

161. sınıf Biyoistatistik 2009-2010

Page 17: Örnekleme ve Örneklem Dağılımları

Örneklem varyasyonu

• Aynı toplumdan aynı büyüklükte örneklemler alsak bile µ ve σ gibi parametrelerde farklılıklar olacaktır.

• Halbuki bir toplumla ilgili tahminlerimizin gerçek değere yakın olmasını isteriz.

• Eğer bu farklılıkları rakama dökebilirsek, tahminimizin hasssasiyeti konusunda bilgi olabiliriz ve böylece örnekleme hatamızın düzeyi hakkında fikrimiz olur.

• Gerçekte tolumdan tek bir örneklem almamıza rağmen yine de teorik dağılımlarla ilgili bilgilerimizi kullanarak toplum geneli hakkında çıkarımlar yaparız.

171. sınıf Biyoistatistik 2009-2010

Page 18: Örnekleme ve Örneklem Dağılımları

Ortalamanın örneklem dağılımı

• Toplum ortlamasını ölçmeye çalışıyoruz.

• Toplumdan n sayıda örneklemler alıp bunların ortalamasını hesaplayabiliriz.

• Bu ortalamaların bir histogram grafiğini çıkarsak ortalamaların dağılımını görebiliriz.

• Buna ortalamanın örneklem dağılımı denir.

181. sınıf Biyoistatistik 2009-2010

Page 19: Örnekleme ve Örneklem Dağılımları

191. sınıf Biyoistatistik 2009-2010

Page 20: Örnekleme ve Örneklem Dağılımları

• Bu dağılıma bakarak şunları söyleyebiliriz:• Örneklem sayısı yeterince büyük olursa, asıl verinin nasıl

dağıldığına bakılmaksızın ortalamaların dağılımı normal dağılıma yakın olur (Central Limit Theorem).

• Örneklem sayısı küçükse, asıl verinin normal dağılması halinde ortalamalar normal dağılıma yakın olur.

• Bu ortalamaların ortalaması gerçek (unbiased) toplum ortalamasını verir.

• Bu dağılımın variabilitesi alınan ortalamaların standart sapmasıyla hesaplanır.

• Buna ortalamanın standart hatası (SEM) denir. Toplumun standart sapmasını (σ) bilmemiz halinde ortalamanın standart hatası SEM = σ / √n formülüyle hesaplanır.

201. sınıf Biyoistatistik 2009-2010

Page 21: Örnekleme ve Örneklem Dağılımları

• Genelde olduğu gibi, toplumdan tek bir örneklem almışsak, toplum ortalamasının en iyi tahmini örneklemimizin ortalaması olacaktır. Bu durumda toplumun standart sapmasını da bilmediğimizden ortalamanın standart hatasını

• SEM = s / √n formülüyle hesaplarız. • SEM, tahminimizin hassasiyeti konusunda bilgi verir.

Tahminimizin ne kadar hassas olduğunu gösterir.• Büyük bir standart hata, tahminimizin hassas olmadığını

gösterir.• Stadart hatanın küçük olması ise tahminimizin hassas

olduğunu gösterir.• Örneklem sayısının artırılması veya verilerin variabilitesinin

daha az az olması halinde standart hatayı küçültmek, yani daha hassas bir tahmin yapmak mümkündür.

211. sınıf Biyoistatistik 2009-2010

Page 22: Örnekleme ve Örneklem Dağılımları

Standart sapma mı standart hata mı?

• Bu iki parametre birbirine benzer görünse de farklı amaçlarla kullanılırlar.

• Standart sapma verilerdeki varyasyonu (ortalamadan sapmayı) gösterir ve bu bilgiyi göstermek istediğimizde kullanılmalıdır.

• Buna karşın standart hata, örneklem ortalamasının hassasiyetini gösterir ve ölçümümüzün hassasiyetini vurgulamak istediğimizde kullanılmalıdır.

221. sınıf Biyoistatistik 2009-2010

Page 23: Örnekleme ve Örneklem Dağılımları

Orantının örneklem dağılımı

• Araştırmamızda toplumdaki bir ortantıyı incelediğimizi düşünelim. Topmumdan n sayıda örneklem almamız ve orantımızın p olması halinde toplum ortalaması π için en iyi tahmin

• p = r / n• şeklinde hesaplanabilir (r, toplumda araştırdğımız özelliğe sahip

kişilerin sayısı). Eğer toplumdan tekrarlayan n sayıda örneklemler alsak ve ortantılarımızın histogram grafiklerini çizsek, sonuçta ortaya çıkan orantının örneklem dağılımının ortalaması π olup normal dağılıma yakın olacaktır. Bu orantıların standart sapmasına orantının standart hatası [SE(p)] denir.

231. sınıf Biyoistatistik 2009-2010

Page 24: Örnekleme ve Örneklem Dağılımları

• Tek bir örneklem aldığımızda şöyle hesaplanır:

• Bu, tahmin ettiğimiz π değerinin hassasiyetini gösterir. • Küçük bir standart hata daha hassas bir ölçüme işaret

eder.

Page 25: Örnekleme ve Örneklem Dağılımları

Alıştırmalar

• Bir araştırmada 250 kişiden alınan kan örneklerinin biyokimyasal analizine göre ortalama açlık kan şekeri 85,7 mg/dl standart sapması 25,4 mg/dl bulunmuştur. Aynı araştırmada kişilerin %15’inde şeker hastalığı saptanmıştır. Ankete katılanların % 20’si şeker hastalığı hakkında bilgisini “iyi” olarak belirtirken % 15’i “hiç bilgisinin olmadığını” belirtmiştir.

1. Paragrafta geçen veri tiplerini tartışın2. Açlık kan şekerinin SEM’ni hesaplayarak yorumlayın3. Şeker hastası olanların SEP’ini hesaplayarak

yorumlayın4. Kan şekeri ortalaması ile birlikte SM mi yoksa SEM mi

verelim? Neden?

251. sınıf Biyoistatistik 2009-2010

Page 26: Örnekleme ve Örneklem Dağılımları

• CevaplarVeri tipleri

1. Açlık kan şekeri ortalaması=nümerik2. Şeker hastası olan kişi sayısı=Nominal3. Ankete katılanların şeker hastalığı hakkındaki

bilgileri=Ordinal

• Sadece açlık kan şekeri ortalaması verilmiş ve örneklemde gruplar arası bir karşılaştırma yapılmadığından bu örnekte SEM verilmesi gerekir