Click here to load reader
Upload
heru-setiawan
View
483
Download
21
Embed Size (px)
DESCRIPTION
Materi Kuliah Statistik pada Jurusan Analis Kesehatan Poltekkes Kemkes jakarta III
Citation preview
PENGOLAHAN DATA NUMERIK
Oleh
Heru Setiawan
A. Distribusi Frekuensi
B. Nilai Tengah (Central Tendency)
1. Raw data hasil pengukuran data kuantitatif tidak akan memberikan informasi apa-apa jika tidak diolah kedalam suatu distribusi frekuensi.
2. Distribusi frekuensi adalah suatu pengelompokkan data kedalam kelas atau group tertentu.
Istilah dalam Distribusi Frekuensi
a. Jumlah kelas– Biasanya antara 6 – 14 (Umumnya ± 9)– Jika ≥ 250 gunakan kaidah Sturgess– Dihitung dengan rumus Sturgess, yaitu :
k = 1 + 3.3 log n, di mana:
k = jumlah kelas &
n = jumlah pengamatan.
3. Istilah dalam Distribusi Frekuensi
b. Interval• Merupakan jarak antar kelas :
– usahakan sama– tidak ada nila yang tumpang tindih– ada istilah batas bawah (lower limit), batas atas (upper limit)
dan nilai tengah (mid point)– dihitung dengan rumus :
dimana:
I = Interval,
R= Range ( nilai max-min) &
k = jumlah kelas
k
RI
4. Cara menyusun distribusi frekuensi :
a. Carilah nilai terbesar dan terkecil
b. Tentukan jumlah kelas dengan interval yang sama
c. Hitunglah banyak nilai observasi yang masuk kedalam masing-masing kelas (disebut dengan istilah frekuensi)
Keterangan :Kelas : 50 – 54.9; 55 – 59.9; dst.Lower limit kelas: 50 ; 55 ; dst.Upper limit kelas: 54.9 ; 59.9 ; dst.Interval kelas : 5 (Selisih upper limit denganlower limit suatu
kelas)Kelas tertutup : 50 – 54.9Kelas terbuka : - 54.9 atau 70 –
Kelas frekuensi (f)50 51 54 55 55 50 - 54,9 357 58 59 60 61 55 - 59,9 561 61 61 62 62 60 - 64,9 1063 64 64 65 65 65 - 69,9 866 67 67 67 68 70 - 74,9 469 71 71 72 75 Jumlah 30
Nilai Tengah (Central Tendency)
1. Jenis-jenis nilai tengah :
– Mean/Arithmatic mean (x, y)
– Median (Md)
– Modus = Mode (Mo)
– Geometric mean (Gm)
– Harmonic mean (Hm)
– Quadratic mean (Qm)
Sering digunakan dalam bidang ekonomi
Mean = rata-rata hitung (x, y)
• Simbol untuk mean :– x atau y (x bar atau y bar) = untuk sampel (statistik) (miu) = untuk populasi (parameter).
• Merupakan nilai yang mewakili data agregate• Bersifat labil (mudah dipengaruhi oleh nilai ekstrim)• Mudah dihitung dan paling banyak digunakan• Dihitung dengan rumus :
– Data tidak berkelompok :
– Data berkelompok : x = xg + (1/n x fd)
n
xx
i
ii
f
fxx
.
atau
fdxn
xx g
1
n
mpfx
.
Contoh
No. Kelas f mp d fd1 150 - 5 152.5 -15 -752 155 - 10 157.5 -10 -1003 160 - 15 162.5 -5 -754 165 - 35 167.5 0 05 170 - 20 172.5 5 1006 175 - 10 177.5 10 1007 180 - 185 5 182.5 15 75
Jumlah 100 1172.5 0 25
• Diketahui : xg = 167.5
N = 100
fd = 25
• Ditanya mean = ….?
• Jawab : Rumus : x = xg + (1/n x Sfd) = 167.5 + (1/100 x 25) = 167.75
fdxn
xx g
1
Median (Md) = Nilai tengah
• Merupakan nilai yang terletak paling tengah, sehingga membagi data menjadi 2 kelompok yang sama jumlah pengamatannya.
• Relatif stabil (tidak dipengaruhi oleh nilai ekstrim)• Sebelum mencari posisi median, terlebih dahulu data harus diurut• Nilai median adalah nilai observasi pada posisi median• Posisi median ditentukan dengan rumus :
• Data tidak berkelompok :
• Data berkelompok :
2
1n
Md
ix
fMd
fknLlMd
2/1
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya median = ….?Jawab : Rumus :
ix
fMd
fknLlMd
2/1
93.1675
35
302/1100165
xMd
Modus/Mode (Mo) = Nilai tengah
• Merupakan nilai yang paling sering muncul dalam pengamatan.
• Pada data yang tidak berkelompok, modus adalah frekuensi pengamatan yang paling besar/banyak.
• Ditentukan dengan rumus :• Data tidak berkelompok :
Mo =
– di mana n = jumlah pengamatan– Contoh :
Data = 11 ; 12 ; 12 ; 13 ; 14 ; 15 ; 15 ; 16 ; 17 ; 18– Modus = 12 dan 15
Modus/Mode (Mo) = Nilai tengah
• Data berkelompok : a. Rumus Delta (Thum method) : sering dipakai untuk
distribusi skewed
– Ll = Lower limit kelas mode– i = interval kelas 1 = Selisih frekuensi kelas mode dengan frekuensi
kelas sebelum kelas mode 2 = Selisih frekuensi kelas mode dengan frekuensi
kelas setelah kelas mode
21
1.
i
LlMo
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya modus/mode = ….?Jawab : Rumus :
21
1.
i
LlMo
86.1671520
20.5165
Mo
Modus/Mode (Mo) = Nilai tengah
b. Rumus Empiris : sering dipakai untuk distribusi simetrisMo = x {3(x Md)},
dimana x = Mean dan Md = Median
Diketahui : • x = 167.75 (soal mean data berkelompok)• Md = 167.93 (soal median data berkelompok)• Ditanya modus/mode = ….?• Jawab : Rumus :
MdxxMo 3
29.16893.16775.167375.167 Mo
MdxxMo 3
Hubungan antara nilai Mean, Median dan Modus/Mode
1. Nilai Median selalu berada di antara Mean dan Modus
2. Jika x = Md = Mo (berhimpitan), maka kurvanya disebut simetris
3. Jika x < Md & Mo), maka kurvanya akan menceng ke kiri disebut skewed to the left
4. Jika x > Md & Mo), maka kurvanya akan menceng ke kanan disebut skewed to the right
UKURAN DISPERSI/VARIASI
• Pengertian :
Nilai tengah (ukuran sentral) merupakan wakil dari data yang telah tersusun. Tidak semua nilai bisa diwakili oleh nilai tengah, ada nilai-nilai yang menyimpang dari nilai tengah tersebut.
Ukuran terhadap penyimpangan ini disebut dispersi.
Kegunaan
1. Memberikan informasi deskriptif tentang derajat penyimpangan suatu kelompok data.
2. Menilai ketepatan nilai tengah dalam mewakili distribusinya. Bila nilai dispersi besar berarti nilai tengah kurang mewakili distribusinya, sebaliknya bila nilai dispersi kecil berarti nilai tengah mempunyai ketepatan yang tinggi dalam mewakili distribusinya. (Pengukuran nilai tengah tanpa mengikutsertakan ukuran dispersi akan kurang lengkap).
3. Berguna untuk perhitungan statistik lebih lanjut agar diperoleh informasi yang lebih mendalam tentang data.
Jenis-jenis Ukuran Variasi
1. Range2. Interquartile range3. Mean deviation (Simpangan rata-rata)4. Variance (Variasi)5. Standard Deviation (Simpangan Baku)6. Coefficient of variation (Koefisien variasi)7. Standard Error
• Ukuran dispersi digunakan karena nilai sentral (mean) kadang-kadang kurang berarti jika nilai variasi tidak diketahui.
Contoh
Jika melihat meannya saja Data A = Data B, padahal Data A Data B.
Mean SDData A 60 60 55 60 65 60 60 3.2Data B 90 50 30 70 40 80 60 23.7
Range (Rentang)
• Suatu nilai yang merupakan selisih antara nilai tertinggi dengan nilai terendah
• Hanya ditentukan oleh 2 nilai saja (nilai tertinggi dan nilai terendah)
• Sering dipakai untuk Quality control• Dalam pemakaiannya sering digabung dengan ukuran lain,
(misalnya mean) karena jika hanya range saja yang dipakai kadang-kadang menyesatkan.
Range (Rentang)
Mean RangeData A 3 4 5 6 8 11 15 20 9 17Data B 3 3 4 9 11 11 11 20 9 17Data C 3 4 9 9 9 9 9 20 9 17
Interquartile Range
• Hampir sama dengan range, hanya ditentukan oleh selisih (Q3) kuatil-3 dengan (Q1) kuartil-1.
• Sering digunakan untuk melihat penyebaran pendapatan.
• Dihitung dengan rumus : dQ = (Q3 Q1)/2, di mana dQ = Interquartile range
• Q3 = kuartil-3• Q1 = kuartil-1
Quartile (Kuartil)
• Kuartil adalah suatu ukuran yang membagi distribusi data menjadi 4 bagian yang sama.
• Kuartil-1 (Q1) 25% dari seluruh distribusi• Kuartil-2 (Q2) 50% dari seluruh distribusi (= Median)• Kuartil-3 (Q3) merupakan 75% dari seluruh distribusi• Dihitung dengan rumus sebagai berikut :
Posisi kuartil = (ki * n)/4, – ki = 1, 2, 3 dst. dan n = jumlah pengamatan
• Nilai kuartil = – Ll = Lower limit kelas kuartil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas kuartil– fki = frekuensi kelas kuartil– i = interval kelas
i
fk
fknk
LlkuartilNilaii
i
.4.
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya :
1. kuartil-1/k1 …?
2. Kuartil-2/k2 …?
3. Kuartil-3/k3 …?
Desil
• Suatu ukuran yang membagi kumpulan/distribusi data menjadi 10 bagian yang sama. Prinsipnya sama dengan kuartil, hanya bedanya jika dengan desil kita dapat memperoleh informasi lebih detail.
• Dihitung dengan rumus sebagai berikut :Posisi desil = (di*n)/10, – di = 1, 2, 3 dst. dan n = jumlah pengamatan
Nilai Desil =– Ll = Lower limit kelas desil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas desil– fdi = frekuensi kelas desil– i = interval kelas
i
fd
fknd
LldesilNilaii
i
.10.
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya Desil-1 …?
Persentil • Suatu ukuran yang membagi kumpulan/distribusi data menjadi 100 bagian
yang sama. Prinsipnya sama dengan kuartil/desil, hanya bedanya jika dengan desil kita dapat memperoleh informasi lebih detail lagi.
• Dihitung dengan rumus sebagai berikut :
– pi = 1, 2, 3 dst. dan n = jumlah pengamatan
– Ll = Lower limit kelas persentil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas persentil– fdi = frekuensi kelas persentil– i = interval kelas
iifp
fknip
LlpersentilNilai .10
.
n
nppersentilPosisi i .
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya persentil …?
Mean deviation (Simpangan rata-rata)
• Suatu nilai yang ditentukan oleh perbedaan semua nilai terhadap mean.
• Kadang2 (jika perlu), dapat juga perbedaan semua nilai terhadap median (median deviation)
• Dihitung dengan rumus :
n
xxxd i
n
xmpfxd
n
MdxdMd i
n
MdmpfdMd
Variance (Variasi)
• Merupakan rata-rata kuadrat dari selisih nilai dengan mean• Adalah harga mutlak sehingga sulit untuk dimanipulasi secara
matematik.• Untuk standarisasi, maka harus diakarkan sehingga disebut
sebagai standar deviasi• Dihitung dengan rumus :
1
2
n
xxV i
Standard Deviation (Simpangan Baku)
• Merupakan ukuran yang paling banyak dipakai dalam analisa statistik• Diberi simbol S (parameter) dan (populasi)• Dihitung dengan rumus :1. Untuk data tidak berkelompok :
di mana (n – 1) = Faktor koreksi “Fisher & Willes”
2. Untuk data berkelompok :
1
2
n
xxS i
1
22
nn
xxS
22 ''
n
fd
n
fdiS
1
22
nn
fxfxS
Coefficient of variation (Koefisien variasi)
• Adalah rasio standar deviasi dengan mean, yang dinyatakan dalam persen (%).
• Berfungsi untuk membandingkan antara 2 kelompok yang mempunyai unit pengukuran berbeda (misalnyaTB dan BB) atau unit pengukurannya sama tetapi derajat/gradasinya berbeda.
• Dihitung dengan rumus :
%100xx
SDCoV
Standard Error (SE)
• Merupakan ukuran variasi dari populasi (bukan ukuran variasi dari sampel).
• Muncul karena adanya pengambilan sampel dari populasi.• Suatu populasi dibagi menjadi beberapa kelompok, setiap
kelompok dicari meannya (x) kemudian mean tersebut membentuk suatu kelompok data gabungan:
– Jika kelompok data gabungan itu dicari mean-nya, maka diperoleh mean populasi ().
– Jika kelompok data gabungan itu dicari SD-nya, maka diperoleh SD populasi ()
• Dihitung dengan rumus :
n
SSE
NSE