49
SAMPLING & DISTRIBUSI SAMPLING

DISTRIBUSI SAMPLING - Spada UNS

Embed Size (px)

Citation preview

SAMPLING & DISTRIBUSI SAMPLING

Sampel Vs Populasi

populasi parameter

sampel statistik

Populasi dan Sampel

Populasi : totalitas dari semua objek/ individu yg memiliki karakteristik tertentu, jelas dan lengkap yang akan diteliti

Sampel : bagian dari populasi yang diambil melalui cara-cara tertentu yg juga memiliki karakteristik tertentu, jelas dan lengkap yg dianggap bisa mewakili populasi

Parameter vs statistik

Parameter : peubah acak yang menjelaskan ciri populasi

Statistik : peubah acak yang menjelaskan ciri sampel

Ukuran pemusatan : rataan/mean, median, modus

Ukuran keragaman : variansi, rentangan

Ukuran pemusatan

Mean

Median

Modus

contoh

Ukuran keragaman

Sample variance

Standard deviation

Range

Contoh

Distribusi Sampling-Statistika 2 10

Ukuran/Ciri Parameter

Populasi

Statistik Sampel

Rata-Rata µ x

Selisih 2 Rata-rata : nilai mutlak : nilai mutlak

Standar Deviasi =

Simpangan Baku

σ S

Varians = Ragam σ ² s²

Proporsi ρ : phi atau p

Selisih 2 proporsi : nilai mutlak : nilai mutlak

Beda antara Statistik Sampel Vs Parameter Populasi

1 2 x x1 2

1 2 p p1 2

p p atau

1 2

Distribusi Sampling merupakan distribusi teoritis (distribusi kemungkinan) dari semua hasil sampel yang mungkin, dengan ukuran sampel yang tetap n, pada statistik (karakteristik sampel) yang digeneralisasikan ke populasi.

Merupakan jembatan, karena melalui distribusi sampling dapat diketahui karakteristik populasi

DISTRIBUSI SAMPLING

Ukuran populasi

Ukuran sampel

cara penarikan sampel

Distribusi sampling suatu statistik bergantung pada :

Penarikan Sampel Acak dapat dilakukan dengan 2 cara, yaitu :

Penarikan sampel tanpa pemulihan/tanpa pengembalian : setelah didata, anggota sampel tidak dikembalikan ke dalam ruang sampel.

Penarikan sampel dengan pemulihan : bila setelah didata, anggota sampel dikembalikan ke dalam ruang sampel.

Berdasarkan Ukurannya, maka sampel dibedakan menjadi

Sampel Besar jika ukuran sampel (n) ≥ 30

Sampel Kecil jika ukuran sampel (n) < 30

Distribusi Penarikan Sampel = Distribusi Sampling

Jumlah Sampel Acak yang dapat ditarik dari suatu populasi adalah sangat banyak.

Nilai setiap Statistik Sampel akan bervariasi/beragam antar sampel.

Suatu statistik dapat dianggap sebagai peubah acak yang besarnya sangat tergantung dari sampel yang kita ambil.

Karena statistik sampel adalah peubah acak maka ia mempunyai distribusi yang kita sebut sebagai : Distribusi peluang statistik sampel = Distribusi Sampling = Distribusi Penarikan Sampel

DISTRIBUSI SAMPLING

Distribusi dari besaran-besaran statistik seperti rata-rata, simpangan baku, proporsi yg mungkin muncul dr sampel-sampel

Jenis-jenis Distribusi Sampling

1. Distribusi Sampling Rata-rata

2. Distribusi Sampling Proporsi

3. Distribusi Sampling yang Lain

DISTRIBUSI SAMPLING BAGI MEAN

Populasi : 0, 1, 2, 3

Keempat obsv. tsb menyusun populasi nilai-nilai sebuah var. Random x yang memiliki dist. Peluang

F(x) = ¼ ; x = 0, 1, 2, 3

= E(x) =

=(0).(1/4) +...+ (3)(1/4) = 3/2

2 = E[ (X) - ]2

=

= 5/4

3

0

)(x

xfx

3

0

22222

4

)2/33()2/32()2/31()2/30()()(

x

xfx

Ambil sampel berukuran 2 (dengan pemulihan )

No Sampel x No Sampel x

1 0,0 0 9 2,0 1.0

2 0,1 0.5 10 2,1 1.5

3 0,2 1.0 11 2,2 2.0

4 0,3 1.5 12 2,3 2.5

5 1,0 0.5 13 3,0 1.5

6 1,1 1.0 14 3,1 2.0

7 1,2 1.5 15 3,2 2.5

8 1,3 2.0 16 3,3 3.0

Distribusi sampling bagi x dgn pemulihan

x f F(x)

0 1 1/16

0.5 2 2/16

1.0 3 3/16

1.5 4 4/16

2.0 3 3/16

2.5 2 2/16

3.0 1 1/16

0

0.05

0.1

0.15

0.2

0.25

0 0.5 1 1.5 2 2.5 3

f(x)

x = E(x) =

= (0).(1/16) + (0.5)(2/16)+ …. + (3)(1/16)

= 3/2

x =

x2 = E[X - ]2 =

=(0-3/2)2(1/16)+(0.5-3/2)2(2/16)+..+(3-3/2)2(1/16)

=5/8

x2 =2/ n

3

0

)(x

xfx

3

0

2 )()(x

xfx

Teorema 1 : populasi tak terhingga

Bila semua kemungkinan random sampel berukuran n dengan pemulihan dari suatu populasi terhingga berukuran N yang mempunyai mean dan simpangan baku , maka untuk n yang cukup besar,

Distribusi sampling bagi mean x akan menghampiri normal dengan mean x= dan simpangan baku x

=/n . Sehingga :

Merupakan suatu nilai bagi variabel random normal baku

z.

n

xz

/

Misalkan sampel berukuran 2 diambil tanpa pemulihan

No Sample x No. Sampel x

1 0,1 0.5 7 1,0 0.5

2 0,2 1.0 8 2,0 1.0

3 0,3 1.5 9 3,0 1.5

4 1,2 1.5 10 2,1 1.5

5 1,3 2.0 11 3,1 2.0

6 2,3 2.5 12 3,2 2.5

Distribusi sampling bagi x tanpa pemulihan

x f F(x)

0.5 2 1/6

1.0 2 1/6

1.5 4 1/3

2.0 2 1/6

2.5 2 1/6

x = E(x) =

= (0.5).(1/6) + .+ (2.5)(1/6) = 3/2

x =

2x = E[ (X) - ]2

=(0.5-3/2)2(1/6) +..+ (2.5 - 3/2)2(1/6) = 5/12

2x

x

xfx )(

14

24

2

4/5

1

2

N

nN

n

Teorema- 2 : populasi terhingga

Bila semua kemungkinan sampel random berukuran n diambil tanpa pemulihan dari suatu populasi terhingga berukuran N yang mempunyai mean dan simpangan baku maka distribusi sampling bagi x akan menghampiri normal dengan mean dan simpangan baku :

x =

2x

1

2

N

nN

n

Distribusi Sampling-Statistika 2 26

disebut sebagai FAKTOR KOREKSI populasi terhingga.

Faktor Koreksi (FK) akan menjadi penting jika sampel berukuran n diambil dari populasi berukuran N yang terhingga/ terbatas besarnya.

Jika sampel berukuran n diambil dari populasi berukuran N yang sangat besar maka FK akan mendekati 1 hal ini mengantar kita pada dalil ke-3 yaitu Dalil limit pusat.

N n

N

1

Dalil Limit Pusat berlaku untuk :

- penarikan sampel dari populasi yang sangat besar,

- distribusi populasi tidak dipersoalkan

Beberapa buku mencatat hal berikut : Populasi dianggap BESAR jika ukuran sampel KURANG DARI 5 % ukuran populasi atau n

N 5%

Teorema 3. DALIL LIMIT PUSAT

Bila sampel random berukuran n ditarik dari suatu populasi yang besar atau tak hingga dengan mean dan ragam 2 maka mean sampel x akan menyebar menghampiri distribusi normal dengan mean x = dan simpangan baku 2

x =2/n . Sehingga :

n

xz

/

DISTRIBUSI SAMPLING BAGI BEDA DUA MEAN

Populasi 1 : 3, 5, 7

Populasi 2 : 0,3

1 = 2 = 53

753

3

8

3

)57()55()53( 2222

1

4

9

2

)2/33()2/30( 222

2

2

3

2

30

Sampel diambil dari populasi 1 n1 =2Sampel diambil dari populasi 2 n2 =3

Dari Populasi 1 Dari Populasi 2

No. Sampel X1 No. Sampel X2

1 3,3 3 1 0,0,0 0

2 3,5 4 2 0,0,3 1

3 3,7 5 3 0,3,0 1

4 5,3 4 4 3,0,0 1

5 5,5 5 5 0,3,3 2

6 5,7 6 6 3,0,3 2

7 7,3 5 7 3,3,0, 2

8 7,5 6 8 3,3,3 3

9 7,7 7

x1–x2 = x1 - x2 = 1 - 2

2x1- x2 = 2

x1 + 2x2 = 1

2/n + 22/n

Selisih Dua Nilai mean

X1 X2

3 4 5 4 5 6 5 6 7

0 3 4 5 4 5 6 5 6 7

1 2 3 4 3 4 5 4 5 6

1 2 3 4 3 4 5 4 5 6

1 2 3 4 3 4 5 4 5 6

2 1 2 3 2 3 4 3 4 5

2 1 2 3 2 3 4 3 4 5

2 1 2 3 2 3 4 3 4 5

3 0 1 2 1 2 3 2 3 4

Distribusi sampling bagi x1-x2 dengan pemulihan

x1-x2 f F(x1-x2)

0 1 1/72

1 5 5/72

2 12 12/72

3 18 18/72

4 18 18/72

5 12 12/72

6 5 5/72

7 1 1/72

x1 – x2 = (x1-x2) f(x1-x2) = (1).(1/72)+……+ (7)(1/72) = 3.5

2x1- x2 = [(x1-x2)- 3.5]2 f(x) hitung !!!

x1 – x2 = x1 - x2 = 1 - 2 = 5 – 3/2 = 3.5

2x1- x2 =2

x1+2x2=2

2/n1+12/n2= 8/3 + 9/4 = 25/12

2 3

Teorema 5

Bila sampel independen berukuran n1 dan n2 diambil

dari dua populasi yang besar atau tak hingga, masing-

masing dengan mean 1 dan 2 dan ragam 12 dan

22, maka kedua mean sampel x1-x2 akan menyebar

menghampiri distribusi normal dengan mean dan

simpangan baku :

x1 – x2 = 1 - 2 dan 2x1- x2 =

Dengan demikian : 2

2

2

1

2

1

nn

)/()/(

)()21(

2

2

21

2

1

21

nn

xxz

Contoh 4 :

Sebuah sampel berukuran n1 = 5 diambil secara random dari sebuah populasi yang menyebar normal dengan mean 1 = 50 dan ragam 1

2 = 9 dan diperoleh mean sampel x1. Sebuah sampel random yang kedua yang berukuran n2 = 4 diambil independen dari sampel pertama, dari populasi lain yang juga menyebar normal tetapi dengan mean 2 = 40 dan ragam 2

2

= 4 dan diperoleh mean sampelnya x2. Berapa P(x1-x2 < 8.2) ?

Jawab :

x1 – x2 = 1 - 2 = 50 – 40 = 10

2x1- x2 = 2

2/n + 12/n =9/5 + 4/4 = 2.8

x1 –x2 = 8.2

P(x1-x2 < 8.2) = P(z<-1.08) = 0.1401

08.1)8.2(

)102.8(

z

Distribusi Sampling-Statistika 2 37

Dalam pengerjaan soal DISTRIBUSI SAMPLING RATA-RATA perhatikan asumsi-asumsi dalam soal sehingga anda dapat dengan mudah dan tepat menggunakan dalil-dalil tersebut!

Contoh 1:

PT AKUA sebuah perusahaan air mineral rata-rata setiap hari memproduksi 100 juta gelas air mineral. Perusahaan ini menyatakan bahwa rata-rata isi segelas AKUA adalah 250 ml dengan standar deviasi = 15 ml. Rata-rata populasi dianggap menyebar normal.

1. Jika setiap hari diambil 100 gelas AKUA sebagai sampel acak DENGAN

PEMULIHAN, hitunglah :

a. standard error atau galat baku sampel tersebut?

b. peluang rata-rata sampel akan berisi kurang dari 253 ml?

2. Jika sampel diperkecil menjadi 25 gelas, hitunglah :

a. standard error atau galat baku sampel tersebut?

b. peluang rata-rata sampel akan berisi lebih dari 255 ml?

Distribusi Sampling-Statistika 2 38

JAWAB :

SOAL 1

Diselesaikan dengan DALIL 1 karena PEMULIHAN

Diselesaikan dengan DALIL 3 karena POPULASI SANGAT BESAR

Diketahui:

N = 100 000 000 = 250 = 15 n = 100

P( < 253) = P(z < ?)

GALAT BAKU =

Jadi P( < 253) = P(z < 2.0) = 0.5 + 0.4772 = 0.9772

xn

15

100

15

1015.

z

253 250

15

3

152 0

. ..

Distribusi Sampling-Statistika 2 39

Soal 2

Diselesaikan dengan DALIL 3 karena POPULASI SANGAT BESAR

Diketahui:

N = 100 000 000 = 250 = 15 n = 25

P( > 255) = P(z > ?)

GALAT BAKU =

Jadi P( > 255 ) = P(z > 1.67) = 0.5 - 0.4525 = 0.0475

xn

15

25

15

530.

z

255 250

30

5

30167

. ..

Teorema-4.(Bila ukuran sampel kecil (n < 30)

Bila x dan s2 masing-masing adalah mean dan ragam suatu sampel random berukuran n yang diambil dari suatu populasi normal dengan mean dan ragam 2maka

merupakan sebuah nilai variabel random X yang mempunyai distribusi T dengan v = n – 1 derajat bebas.

ns

xt

/

Sampel Kecil: Student’s t Distribution

Pada banyak kasus sering dijumpai tidak tersedia informasi

tentang variansi populasi, sehingga dipergunakan variansi yg

berasal dari sampel sebagai pengganti S. Bilamana sampel

berukuran besar (n≥30) maka penggantian σ dengan S cukup

baik dan kita bisa mempergunakan variabel normal Z spt biasa

dalam perhitungan:

Jikalau sampel kecil (n<30) maka S2 akan berfluktuasi cukup

besar dari sampel ke sampel sehingga perlu statistik yg lebih baik.

Jika sampel kecil akan tetapi berasal dari distribusi normal, maka

statistik T berikut ini:

nS

XZ

/

nS

XT

/

Sampel Kecil: Student’s t Distribution

Variabel T tsb akan mengikuti distribusi probabilitas yg disebut

Distribusi Student T (Student adalah nama samaran dari penemu

distribusi ini yg bernama Gosset), dengan derajat kebebasan v=n-

1. Distribusi ini bentuknya serupa sekali dengan distribusi normal:

rata-rata=0 dan bentuknya simetrik. Akan tetapi untuk sampel

kecil maka ekor distribusinya lebih tinggi dibandingkan distribusi

normal, jadi bentuknya ditentukan oleh derajat kebebasan.

t0

ν=∞

ν=2

Tabel Student’s t Distribution

Tabel distribusi student diberikan untuk nilai kritis t yg terkait

dengan luas ekor kanan dari distribusi t, untuk berbagai nilai

derajat kebebasan yg berbeda.

Distribusi Sampling Variansi S2

Bilamana ingin dipelajari variasi dari data maka fokus studi adalah pada distribusi variansi sampel S2 untuk mendapatkan kesimpulan tentang variansi populasi σ2.

Sampel random berukuran n diambil dari populasi normal dengan rata-rata μ dan variansi σ2. Diperolah bahwa variansi sampel S2. Maka statistik :

Akan memiliki distribusi chi-squared dengan derajat kebebasan ν=n-1.

n

k

k XXSn

12

2

2

22 )()1(

Distribusi Chi-Squared

Ditabelkan nilai variabel χ2 yang terkait dengan luas (α)

ekor kanan dari distribusi chi-squared untuk berbagai derajat kebebasan.

2

22 )1(

Sn

χ2χα2

α

Tabel Distribusi Chi-Squared

Tabel nilai kritikal χ2α yang terkait dengan luas (α) ekor

kanan dari distribusi chi-squared untuk berbagai derajat kebebasan (v)

Distribusi F

Salah satu perbandingan yg dilakukan dalam statistik adalah

perbandingan variabilitas atau variansi dari dua buah sampel.

Statistik yg dipergunakan dalam membandingkan variansi 2 buah

sampel dinamakan distribusi F.

Jika S12 dan S2

2 adalah variansi dari 2 buah sampel random yg tak

saling bergantung (independen) dengan ukuran n1 dan n2 yg

diambil dari populasi normal dengan variansi σ12 dan σ2

2, maka

statistik F:

Mengikuti distribusi F dengan derajat kebebasan v1=n1-1 dan v2=n2-1.

Distribusi F bersifat asimetrik . bentuknya bergantung pada derajat

kebebasannya

2

2

2

2

2

1

2

1

/

/

S

SF

Perbandingan Variansi: Distribution F

f0

ν=(10,30)

ν=(6,10)

fα0

α

Jika fα (v1,v2) menyatakan nilai kritis f dengan luas ekor kanan α untuk

derajat kekebasan v1,v2, maka: (perhatikan urutan v1 dan v2)

),(

1),(

21

121

f

f

Tabel Distribusi F

Karena ada dua derajat kebebasan yg menentukan bentuk Distribusi F

maka, tabel distribusi lebih terbatas, hanya ditabelkan nilai kritis F

untuk beberapa nilai luas ekor kanan yg populer dipakai (misalnya

α=5%)