Upload
amos-young
View
133
Download
1
Embed Size (px)
DESCRIPTION
Analisa Data Statistik. Agoes Soehianie, Ph.D. 1. Komponen Penilaian a. Ujian Tengah Semester b. Ujian Akhir Semester c. Tugas/PR d. Quiz 2. Perhitungan Nilai Akhir NA = 40% UTS + 40% UAS + 10% PR/Tugas + 10% Quiz 3. Konversi Nilai - PowerPoint PPT Presentation
Citation preview
Analisa Data Statistik
Agoes Soehianie, Ph.D
Agoes Soehianie
Rencana Perkuliahan1. Komponen Penilaian a. Ujian Tengah Semester b. Ujian Akhir Semester c. Tugas/PR d. Quiz
2. Perhitungan Nilai Akhir NA = 40% UTS + 40% UAS + 10% PR/Tugas + 10% Quiz
3. Konversi Nilai Mengikuti aturan Fisika dasar x>= 75 Index= A 68<= x < 75 Index = AB 60<= x < 68 Index = B 55<= x < 60 Index = BC 50<= x < 55 Index = C 45<= x < 50 Index = D X < 45 Index = E Tidak ikut ujian = 0
4. Syarat kehadiran 80%5. Text Book :
Walpole, R.E., Myers, R.H., Myers, S.L., Keying Ye, Probability and Statistics for Engineers and Scientiests, 8th ed., 2007, Pearson Education International Pelengkap:Lind, D.A., William G Marchal, Samuel A. Wathen, Basic Statistics for Business & Economics, McGraw Hill Int. 5th Ed.
Agoes Soehianie
Rencana Perkuliahan
6. Cakupan bahan a. Pendahuluan & Deskripsi Data b. Probabilitas c. Distribusi Probabilitas (Diskrit dan Kontinu) d. Metoda Sampling dan Distribusi Sample e. Estimasi dan Confidence Interval f. Testing Hipotesa (1 sample) :sample kecil dan besar g. Testing Hipotesa (2 sample) : sample kecil dan besar h. ANOVA i. Korelasi dn Regresi Linear j. Regresi Linear Jamak k. Time Series dan Forecasting (jika waktu memungkinkan)
Metoda Kuliah: tatap muka (slides, software & PR/ Quiz)Softwares : SPSS dan Excell
Agoes Soehianie
Chap-1
Agoes Soehianie
Chap 1: Pendahuluan dan Deskripsi Data
Arti Statistik:Ilmu pengumpulan, mengorganisasi, menganalisa, menampilkan data serta
menginterpretasikan data dalam rangka membuat keputusan yg efektif.
Arti lain Statistik:Angka-angka numerik yang menggambarkan sekumpulan data
Misal : nilai rata-rata 89.3, GNP negara X : 3000 USD, Median penghasilan negara X adalah 5000 USD.
Agoes Soehianie
Macam Statistik
Dua macam statistik:– Statistik Inferensial mengambil kesimpulan ttg populasi dari sampel– Statistik Deskriptif menggambarkan sampel saja
Statistik Inferensial:
Sampel PopulasiTeori Probabilitas danDistribusi
Populasi:
Keseluruhan object atau pengukuran tertentu yang menjadi pusat perhatian.
Sampel: sebagian object atau pengukuran dari sebuah populasi
Agoes Soehianie
Tipe Variabel
Tipe Variabel
Kualitatif Kuantitatif
•Status Perkawinan•Pekerjaan•Kebangsaan
Diskrit Kontinyu
•Jumlah anak di keluarga•Banyak orang menyukai merek X•Jumlah pemilih partai X
•Gaji dosen•Tinggi anak•Intensitas cahaya•Jarak tempuh
Agoes Soehianie
Tingkat Pengukuran
Tingkat Pengukuran
Non Metric Metric
Nominal Interval Rasio
•Jarak antar ukuran bermakna•Suhu•Ukuran sepatu•IQ
•Titik Nol bermakna•Gaji dosen•Tinggi anak•Intensitas cahaya•Jarak tempuh
Ordinal
Hanya kategori•Jenis kelamin•Tipe hari •Warna mobil
Ada urutan•Tingkat kepuasan•Tingkat resiko
Agoes Soehianie
Cara Deskripsi Data
Cara penyajian data : Tabel dan Grafik Tabel : Distribusi Frekuensi
Batas Bawah Kelas
Limit Bawah Kelas
Limit Atas Kelas
Batas Atas Kelas
Panjang Interval Kelas
Titik Tengah Kelas
Frekuensi kelas
Frekuensi Relatif
Frekuensi Kumulatif
1.5 2 6 6.5 5 4 2 6% 6%6.5 7 11 11.5 5 9 5 16% 23%11.5 12 16 16.5 5 14 7 23% 45%16.5 17 21 21.5 5 19 10 32% 77%21.5 22 26 26.5 5 24 4 13% 90%26.5 27 31 31.5 5 29 3 10% 100%
TOTAL 31 100%
Istilah penting: batas kelas, limit kelas, panjang interval, titik tengah kelas, frekuensi, frekuensi relatif dan frekuensi kumulatif
Agoes Soehianie
Tabel Distribusi Frekuensi
Dari data mentah Tabel distribusi frekuensi (apa tujuannya?) Bagaimana membuatnya? Contoh : Data mentah (Nilai ADS)
41 68 60 60 90 58 6023 72 38 73 49 71 3633 71 17 17 26 14 1850 73 100 89 85 18 1686 84 62 63 60 72 5021 74 65 84 81 73 33
Banyak data (N), sort (urutkan) Manual? (No way!) Cari Data Max, Min dan Range Max : 100 Min: 14 , Range (Jangkauan) : Max –Min = 100-14 = 86 Berapa banyak interval kelas? Berapa Lebarnya? Banyak interval kelas (contoh) pakai Aturan Sturgess :
k = 1+ 3.31log(N) ( Bukan harga mati)
Agoes Soehianie
Tabel Distribusi Frekuensi
Hal yang harus dihindari : Interval terlalu lebar Interval terlalu kecil
Cara membuat Distribusi Frequency :
Excell : fungsi Frequency
Note:Penjelasan dan demo dengan Excell
0
10
20
30
40
50
60
70
80
90
100
0-49 50-99
Nilai
Fre
kuen
si
0
10
20
30
40
50
60
0-24 25-49 50-74 75-99
Nilai
Fre
kuen
si
0
5
10
15
20
25
30
0-4
10-1
4
20-2
4
30-3
4
40-4
4
50-5
4
60-6
4
70-7
4
80-8
4
90-9
4
Nilai
Fre
kuen
si
Agoes Soehianie
Tabel Distribusi Frekuensi
Memakai Excell untuk distribusi frekuensi:
1. Fungsi Frequency menerima dua argumen : Range Data dan Bins Array
2. Range Data menunjuk pada range alamat sel yg berisi data yg akan dihitung distribusinya
3. Bins Array menunjuk pada array 1D yang menyatakan batas atas interval yang berturutan.
4. Harus dimasukkan sebagai Rumus Array (bagaimana caranya?)
5. Awas Bins array terakhir!
Agoes Soehianie
Contoh : Frequency (Excell)
Scores Bins Frekuensi79 70 185 79 278 89 485 25081958897
Scores Bins Frekuensi79 70 =FREQUENCY($I$3:$I$11,$J$3:$J$6)85 79 =FREQUENCY($I$3:$I$11,$J$3:$J$6)78 89 =FREQUENCY($I$3:$I$11,$J$3:$J$6)85 =FREQUENCY($I$3:$I$11,$J$3:$J$6)5081958897
Agoes Soehianie
Penyajian Data Dalam Grafik Macam-macam grafik:
– Histogram– Line graph– Scatter diagram– Pie Chart– Area Graph
– Stem-Leaf Plot
Agoes Soehianie
Eksplorasi Data dan Penyajiannya Ukuran Pemusatan
– Rata-rata (mean) aritmetika dan rata-rata terbobot– Median– Modus/Mode
Ukuran Penyebaran– Range– Quartile– Semi InterQuartile– Variansi– Standard Deviasi
Agoes Soehianie
Mean Mean
Weighted Mean
N
X
X
N
jj
1
k
jj
N
jjj
f
Xf
X
1
1
fj = frekuen`si
Wj : weight
k
jj
N
jjj
W
XW
X
1
1
Bisa untuk data dalamBentuk interval
Agoes Soehianie
Mean : Contoh Mean
Data : X : 3, 4, 4, 5 , 8 , 6
Mean : 56
30
6
6854431
N
X
X
N
jj
Interval Klas Titik Tengah FrekuensiXk Fk Xk* Fk
0-9 4.5 3 13.510-19 14.5 4 5820-29 24.5 6 14730-39 34.5 10 345
TOTAL 23 563.5
Rata-rata= 24.5
Mean data berbentuk tabel distribusi
Agoes Soehianie
Median : Contoh MedianData : X : 3, 4, 4, 1, 5 , 8 , 6Median : nilai tengah (yg berada di tengah) jikalau data di urut.Langkah 1: urutkan
X : 1, 3,4,4,5,6,8Langkah 2: tentukan posisi tengahBanyak data : N= 7Median : data ke (N+1)/2 = 4.
Arti : Median data X= 4 : setengah data lebih kecil dari 4, setengah lagi lebih besar dari 4.
Bagaimana Mediannya jika N genap? Diambil rata-rata data yg di tengah.Contoh : X : 3, 4, 4, 5 , 6 , 8
Median : ½ (XN/2 + XN/2-1) = ½ (4+5) 4.5
Agoes Soehianie
Modus : Contoh ModusData : X : 3, 4, 4, 1, 5 , 8 , 6Modus : data yg paling sering muncul. Frekuensinya tertinggi. Dalam
contoh di atas modus X = 4.
Untuk data-data yg bersifat nominal/kategorikal maka seringkali yg dipakai adalah modusnya.
Berdasarkan pola distribusinya, terkadang bisa dikenali bahwa modusnya lebih dari satu macam: misal bi-modal ( 2 modus)
Agoes Soehianie
Range, Variansi dan STDUkuran penyebaran yang paling sederhana adalah Range (jangkauan)
data yaitu : Data terbesar – Data terkecil.
Variansi (populasi):
Variansi (sampel): koreksi di penyebutuntuk memperbaikinilai variansi sampel sebagai penaksirvariansi populasi
Standard deviasi : populasi : σ = √ σ2
sampel : S = √ S2
N
XN
jj
1
2
2
)(
1
)(1
2
2
N
XX
S
N
jj
Agoes Soehianie
Variansi dan STD : data mentahContoh: Hitunglah variansi dan STD sampel berikut ini:
X : 3, 4, 4, 5 , 8 , 6
Hitung dulu rata-rata sampel:
Variansi (sampel):
S2= 16/5 = 3.2Standard deviasi sampel = S = √3.2= 1.79
16
)56()58()55()54()54()53(
1
)(222222
1
2
2
N
XX
S
N
jj
56
30
6
6854431
N
X
X
N
jj
Agoes Soehianie
Variansi dan STD: tabel frekuensiContoh: Hitunglah variansi dan STD sampel berikut ini:
Titik tengahFrekuensiNo Interval Xi Fi XiFi (Xi-X)^2 Fi
1 0-9 4.5 5 22.5 1517.172 10-19 14.5 8 116 440.37463 20-29 24.5 10 245 66.597294 30-39 34.5 6 207 949.63585 40-49 44.5 2 89 1019.771
TOTAL 31 679.5 3993.548rata-rata 21.92Variansi 133.12STD 11.54
1
)(1
2
2
N
XXf
S
N
jjj
Untuk data terdistribusi dalam bentuk tabel interval klas, maka yang dipergunakan adalah titik tengah intervalnya, dan perhitungannya mempergunakan frekuensi tiap interval sebagai weighting factornya
Agoes Soehianie
Quartile & PercentileUkuran penyebaran yg lain, yang merupakan pengembangan dari
Median adalah Quartile. Pada dasarnya Quartile adalah data-data yang membagi seluruh data menjadi 4 bagian yang sama banyaknya.
XData rendah Data tinggi
Jadi Q1 adalah menyatakan batas dimana 25% data adalah lebih kecil dari Q1
Jadi Q2 adalah menyatakan batas dimana 50% data adalah lebih kecil dari Q2
Jadi Q3 adalah menyatakan batas dimana 75% data adalah lebih kecil dari Q3
Q2=medianQ1=Quatile bawah
Q3=Quatile atas
Agoes Soehianie
Quartile & PercentileLebih umum dari Quartile adalah Percentile, yang menyatakan batas
dimana sebanyak P% data ada di bawah nilai percentile dimaksud.
Lokasi (atau posisi data) untuk sampel N data yang menjadi batas percentile P adalah:
100)1(P
NLP
Berarti L25 = Q1, L50 = Q2= median, L75 = Q3
Bilamana nilai Lp bukan bilangan bulat, maka dilakukan interpolasi linear dua dari dua data terdekat.
Sebagai ukuran sebaran data terkait adalah InterQuartile (IQ) yaitu IQ = Q3- Q1
Agoes Soehianie
Quartile & Percentile : ContohLebih umum dari Quartile adalah Percentile, yang menyatakan batas
dimana sebanyak P% data ada di bawah nilai percentile dimaksud.
Lokasi (atau posisi data) untuk sampel N data yang menjadi batas percentile P adalah:
100)1(P
NLP
Berarti L25 = Q1, L50 = Q2= median, L75 = Q3
Bilamana nilai Lp bukan bilangan bulat, maka dilakukan interpolasi linear dua dari dua data terdekat. Cara penaksiran median dengan metoda ini lebih baik dari cara sebelumnya yg hanya menghitung rata-rata dua data yg terdekat.
Agoes Soehianie
Quartile & Percentile : ContohContoh: N=16 data (disamping)
Hitunglah Q1, Q2 dan Q3 dan SIQ
Lokasi Q1,Q2 dan Q3 dihitung dari rumus LP
100)1(P
NLP
No Data1 22 43 44 55 76 87 88 109 10
10 1211 1312 1513 1814 2015 2516 30
P LP25 4.2550 8.575 12.75
L25 L50Data ke 4 5 Data ke 8 10Data ke 5 7 Data ke 9 10L25 5.5 L50 10
L75Data ke 12 15Data ke 13 18L75 17.25
L25: 4.25, jadi Q1 antara data ke 4 dan 5. Interpolasi:
5.5)57(*25.051 Q
Agoes Soehianie
Box Whisker PlotSalah satu kegunaan informasi Quartile adalah untuk membuat Box
Whisker Plot, dimana dengan cepat kita mengetahui karakter umum penyebaran data secara visual saja.
1.00
1.50
2.00
2.50
X
Data kandungan nikotin1.09 1.92 2.55 1.470.85 1.23 2.03 1.751.86 1.9 1.88 1.691.82 0.72 1.68 2.1
SortedNo
1 0.722 0.853 1.094 1.235 1.476 1.687 1.698 1.759 1.82
10 1.8611 1.8812 1.913 1.9214 2.0315 2.116 2.55
P LP25 4.2550 8.575 12.75
Q1 1.29Q2 1.785Q3 1.915
Q2
Q3
Q1
Extreme
Extreme
Agoes Soehianie
Macam Studi Statistik Observasi Desain Kausalitas