Pengolahan Data Numerik

PENGOLAHAN DATA NUMERIK

Oleh

Heru Setiawan

A. Distribusi Frekuensi

B. Nilai Tengah (Central Tendency)

1. Raw data hasil pengukuran data kuantitatif tidak akan memberikan informasi apa-apa jika tidak diolah kedalam suatu distribusi frekuensi.

2. Distribusi frekuensi adalah suatu pengelompokkan data kedalam kelas atau group tertentu.

Istilah dalam Distribusi Frekuensi

a. Jumlah kelas– Biasanya antara 6 – 14 (Umumnya ± 9)– Jika ≥ 250 gunakan kaidah Sturgess– Dihitung dengan rumus Sturgess, yaitu :

k = 1 + 3.3 log n, di mana:

k = jumlah kelas &

n = jumlah pengamatan.

3. Istilah dalam Distribusi Frekuensi

b. Interval• Merupakan jarak antar kelas :

– usahakan sama– tidak ada nila yang tumpang tindih– ada istilah batas bawah (lower limit), batas atas (upper limit)

dan nilai tengah (mid point)– dihitung dengan rumus :

dimana:

I = Interval,

R= Range ( nilai max-min) &

k = jumlah kelas

k

RI

4. Cara menyusun distribusi frekuensi :

a. Carilah nilai terbesar dan terkecil

b. Tentukan jumlah kelas dengan interval yang sama

c. Hitunglah banyak nilai observasi yang masuk kedalam masing-masing kelas (disebut dengan istilah frekuensi)

Keterangan :Kelas : 50 – 54.9; 55 – 59.9; dst.Lower limit kelas: 50 ; 55 ; dst.Upper limit kelas: 54.9 ; 59.9 ; dst.Interval kelas : 5 (Selisih upper limit denganlower limit suatu

kelas)Kelas tertutup : 50 – 54.9Kelas terbuka : - 54.9 atau 70 –

Kelas frekuensi (f)50 51 54 55 55 50 - 54,9 357 58 59 60 61 55 - 59,9 561 61 61 62 62 60 - 64,9 1063 64 64 65 65 65 - 69,9 866 67 67 67 68 70 - 74,9 469 71 71 72 75 Jumlah 30

Nilai Tengah (Central Tendency)

1. Jenis-jenis nilai tengah :

– Mean/Arithmatic mean (x, y)

– Median (Md)

– Modus = Mode (Mo)

– Geometric mean (Gm)

– Harmonic mean (Hm)

– Quadratic mean (Qm)

Sering digunakan dalam bidang ekonomi

Mean = rata-rata hitung (x, y)

• Simbol untuk mean :– x atau y (x bar atau y bar) = untuk sampel (statistik) (miu) = untuk populasi (parameter).

• Merupakan nilai yang mewakili data agregate• Bersifat labil (mudah dipengaruhi oleh nilai ekstrim)• Mudah dihitung dan paling banyak digunakan• Dihitung dengan rumus :

– Data tidak berkelompok :

– Data berkelompok : x = xg + (1/n x fd)

n

xx

i

ii

f

fxx

.

atau

fdxn

xx g

1

n

mpfx

.

Contoh

No. Kelas f mp d fd1 150 - 5 152.5 -15 -752 155 - 10 157.5 -10 -1003 160 - 15 162.5 -5 -754 165 - 35 167.5 0 05 170 - 20 172.5 5 1006 175 - 10 177.5 10 1007 180 - 185 5 182.5 15 75

Jumlah 100 1172.5 0 25

• Diketahui : xg = 167.5

N = 100

fd = 25

• Ditanya mean = ….?

• Jawab : Rumus : x = xg + (1/n x Sfd) = 167.5 + (1/100 x 25) = 167.75

fdxn

xx g

1

Median (Md) = Nilai tengah

• Merupakan nilai yang terletak paling tengah, sehingga membagi data menjadi 2 kelompok yang sama jumlah pengamatannya.

• Relatif stabil (tidak dipengaruhi oleh nilai ekstrim)• Sebelum mencari posisi median, terlebih dahulu data harus diurut• Nilai median adalah nilai observasi pada posisi median• Posisi median ditentukan dengan rumus :

• Data tidak berkelompok :

• Data berkelompok :

2

1n

Md

ix

fMd

fknLlMd

2/1

Contoh

No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75

Jumlah 100 1172,5 0 25

Ditanya median = ….?Jawab : Rumus :

ix

fMd

fknLlMd

2/1

93.1675

35

302/1100165

xMd

Modus/Mode (Mo) = Nilai tengah

• Merupakan nilai yang paling sering muncul dalam pengamatan.

• Pada data yang tidak berkelompok, modus adalah frekuensi pengamatan yang paling besar/banyak.

• Ditentukan dengan rumus :• Data tidak berkelompok :

Mo =

– di mana n = jumlah pengamatan– Contoh :

Data = 11 ; 12 ; 12 ; 13 ; 14 ; 15 ; 15 ; 16 ; 17 ; 18– Modus = 12 dan 15


• Data berkelompok : a. Rumus Delta (Thum method) : sering dipakai untuk

distribusi skewed

– Ll = Lower limit kelas mode– i = interval kelas 1 = Selisih frekuensi kelas mode dengan frekuensi

kelas sebelum kelas mode 2 = Selisih frekuensi kelas mode dengan frekuensi

kelas setelah kelas mode

21

1.

i

LlMo

Contoh


Jumlah 100 1172,5 0 25

Ditanya modus/mode = ….?Jawab : Rumus :

21

1.

i

LlMo

86.1671520

20.5165

Mo


b. Rumus Empiris : sering dipakai untuk distribusi simetrisMo = x {3(x Md)},

dimana x = Mean dan Md = Median

Diketahui : • x = 167.75 (soal mean data berkelompok)• Md = 167.93 (soal median data berkelompok)• Ditanya modus/mode = ….?• Jawab : Rumus :

MdxxMo 3

29.16893.16775.167375.167 Mo

MdxxMo 3

Hubungan antara nilai Mean, Median dan Modus/Mode

1. Nilai Median selalu berada di antara Mean dan Modus

2. Jika x = Md = Mo (berhimpitan), maka kurvanya disebut simetris

3. Jika x < Md & Mo), maka kurvanya akan menceng ke kiri disebut skewed to the left

4. Jika x > Md & Mo), maka kurvanya akan menceng ke kanan disebut skewed to the right

UKURAN DISPERSI/VARIASI

• Pengertian :

Nilai tengah (ukuran sentral) merupakan wakil dari data yang telah tersusun. Tidak semua nilai bisa diwakili oleh nilai tengah, ada nilai-nilai yang menyimpang dari nilai tengah tersebut.

Ukuran terhadap penyimpangan ini disebut dispersi.

Kegunaan

1. Memberikan informasi deskriptif tentang derajat penyimpangan suatu kelompok data.

2. Menilai ketepatan nilai tengah dalam mewakili distribusinya. Bila nilai dispersi besar berarti nilai tengah kurang mewakili distribusinya, sebaliknya bila nilai dispersi kecil berarti nilai tengah mempunyai ketepatan yang tinggi dalam mewakili distribusinya. (Pengukuran nilai tengah tanpa mengikutsertakan ukuran dispersi akan kurang lengkap).

3. Berguna untuk perhitungan statistik lebih lanjut agar diperoleh informasi yang lebih mendalam tentang data.

Jenis-jenis Ukuran Variasi

1. Range2. Interquartile range3. Mean deviation (Simpangan rata-rata)4. Variance (Variasi)5. Standard Deviation (Simpangan Baku)6. Coefficient of variation (Koefisien variasi)7. Standard Error

• Ukuran dispersi digunakan karena nilai sentral (mean) kadang-kadang kurang berarti jika nilai variasi tidak diketahui.

Contoh

Jika melihat meannya saja Data A = Data B, padahal Data A Data B.

Mean SDData A 60 60 55 60 65 60 60 3.2Data B 90 50 30 70 40 80 60 23.7

Range (Rentang)

• Suatu nilai yang merupakan selisih antara nilai tertinggi dengan nilai terendah

• Hanya ditentukan oleh 2 nilai saja (nilai tertinggi dan nilai terendah)

• Sering dipakai untuk Quality control• Dalam pemakaiannya sering digabung dengan ukuran lain,

(misalnya mean) karena jika hanya range saja yang dipakai kadang-kadang menyesatkan.

Range (Rentang)

Mean RangeData A 3 4 5 6 8 11 15 20 9 17Data B 3 3 4 9 11 11 11 20 9 17Data C 3 4 9 9 9 9 9 20 9 17

Interquartile Range

• Hampir sama dengan range, hanya ditentukan oleh selisih (Q3) kuatil-3 dengan (Q1) kuartil-1.

• Sering digunakan untuk melihat penyebaran pendapatan.

• Dihitung dengan rumus : dQ = (Q3 Q1)/2, di mana dQ = Interquartile range

• Q3 = kuartil-3• Q1 = kuartil-1

Quartile (Kuartil)

• Kuartil adalah suatu ukuran yang membagi distribusi data menjadi 4 bagian yang sama.

• Kuartil-1 (Q1) 25% dari seluruh distribusi• Kuartil-2 (Q2) 50% dari seluruh distribusi (= Median)• Kuartil-3 (Q3) merupakan 75% dari seluruh distribusi• Dihitung dengan rumus sebagai berikut :

Posisi kuartil = (ki * n)/4, – ki = 1, 2, 3 dst. dan n = jumlah pengamatan

• Nilai kuartil = – Ll = Lower limit kelas kuartil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas kuartil– fki = frekuensi kelas kuartil– i = interval kelas

i

fk

fknk

LlkuartilNilaii

i

.4.

Contoh


Jumlah 100 1172,5 0 25

Ditanya :

1. kuartil-1/k1 …?

2. Kuartil-2/k2 …?

3. Kuartil-3/k3 …?

Desil

• Suatu ukuran yang membagi kumpulan/distribusi data menjadi 10 bagian yang sama. Prinsipnya sama dengan kuartil, hanya bedanya jika dengan desil kita dapat memperoleh informasi lebih detail.

• Dihitung dengan rumus sebagai berikut :Posisi desil = (di*n)/10, – di = 1, 2, 3 dst. dan n = jumlah pengamatan

Nilai Desil =– Ll = Lower limit kelas desil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas desil– fdi = frekuensi kelas desil– i = interval kelas

i

fd

fknd

LldesilNilaii

i

.10.

Contoh


Jumlah 100 1172,5 0 25

Ditanya Desil-1 …?

Persentil • Suatu ukuran yang membagi kumpulan/distribusi data menjadi 100 bagian

yang sama. Prinsipnya sama dengan kuartil/desil, hanya bedanya jika dengan desil kita dapat memperoleh informasi lebih detail lagi.

• Dihitung dengan rumus sebagai berikut :

– pi = 1, 2, 3 dst. dan n = jumlah pengamatan

– Ll = Lower limit kelas persentil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas persentil– fdi = frekuensi kelas persentil– i = interval kelas

iifp

fknip

LlpersentilNilai .10

.

n

nppersentilPosisi i .

Contoh


Jumlah 100 1172,5 0 25

Ditanya persentil …?

Mean deviation (Simpangan rata-rata)

• Suatu nilai yang ditentukan oleh perbedaan semua nilai terhadap mean.

• Kadang2 (jika perlu), dapat juga perbedaan semua nilai terhadap median (median deviation)

• Dihitung dengan rumus :

n

xxxd i

n

xmpfxd

n

MdxdMd i

n

MdmpfdMd

Variance (Variasi)

• Merupakan rata-rata kuadrat dari selisih nilai dengan mean• Adalah harga mutlak sehingga sulit untuk dimanipulasi secara

matematik.• Untuk standarisasi, maka harus diakarkan sehingga disebut

sebagai standar deviasi• Dihitung dengan rumus :

1

2

n

xxV i

Standard Deviation (Simpangan Baku)

• Merupakan ukuran yang paling banyak dipakai dalam analisa statistik• Diberi simbol S (parameter) dan (populasi)• Dihitung dengan rumus :1. Untuk data tidak berkelompok :

di mana (n – 1) = Faktor koreksi “Fisher & Willes”

2. Untuk data berkelompok :

1

2

n

xxS i

1

22

nn

xxS

22 ''

n

fd

n

fdiS

1

22

nn

fxfxS

Coefficient of variation (Koefisien variasi)

• Adalah rasio standar deviasi dengan mean, yang dinyatakan dalam persen (%).

• Berfungsi untuk membandingkan antara 2 kelompok yang mempunyai unit pengukuran berbeda (misalnyaTB dan BB) atau unit pengukurannya sama tetapi derajat/gradasinya berbeda.


%100xx

SDCoV

Standard Error (SE)

• Merupakan ukuran variasi dari populasi (bukan ukuran variasi dari sampel).

• Muncul karena adanya pengambilan sampel dari populasi.• Suatu populasi dibagi menjadi beberapa kelompok, setiap

kelompok dicari meannya (x) kemudian mean tersebut membentuk suatu kelompok data gabungan:

– Jika kelompok data gabungan itu dicari mean-nya, maka diperoleh mean populasi ().

– Jika kelompok data gabungan itu dicari SD-nya, maka diperoleh SD populasi ()


n

SSE

NSE

Documents

Pengolahan Data Numerik