Upload
vokhuong
View
339
Download
14
Embed Size (px)
Citation preview
Review 1: Statistika DeskriptifReview 1: Statistika Deskriptif
MA5182 Topik dalam Statistika I: Statistika Spasial28 Agustus 201228 Agustus 2012
Utriweni Mukhaiyar
Il t iIl t iIlustrasiIlustrasi Berikut adalah data rata-rata curah hujan bulanan yang diamati dari Stasiun Padaherang pada tahun 2001 – 2004.
Sumber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”Tahun Jan Feb Mar Apr Mei Jun Jul Agust Sep Okt Nop DesTahun Jan Feb Mar Apr Mei Jun Jul Agust Sep Okt Nop Des2001 278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82
2002 299.78 245.88 266.64 185.27 122.22 133.1 76.78 32.4 26.09 169.05 461.62 415.73
2003 425.21 370.8 300.23 157.43 184.96 69.93 23.28 14.39 17.86 275.23 433.23 456.02
2004 547.8 308.2 388 93 297 128 47 5 87 105 389 371.6
Informasi apa yang ingin diperoleh dari data ini ?1. Rata-rata curah hujan setiap tahun.2. Penyebaran tingkat curah hujan setiap bulan pada tahun tertentu.3. Bulan tertentu yang memiliki tingkat curah hujan yang khusus.
2
4. Signifikansi perbedaan tingkat curah hujan antara tahun-tahun yang diamati.
IlustrasiIlustrasiIlustrasiIlustrasi Berikut adalah data produksi panas bumi di25 titik pengeboran (ton/jam):25 titik pengeboran (ton/jam):
77.71 44.24 60.00 89.54 85.6460.00 24.00 54.12 64.52 27.1487 46 42 13 43 04 45 75 111 2787.46 42.13 43.04 45.75 111.2727.79 41.49 47.70 83.00 14.3270.00 32.35 41.60 77.96 14.37
Informasi apa yang ingin diperoleh dari data ini ?1. Rata-rata produksi panas bumi di 25 lokasi tersebut.2. Penyebaran nilai produksi panas bumi di area STATISTIKA y p pwilayah pengeboran tersebut.3. Lokasi pengeboran dengan nilai produksi yang ekstrim.
4 Signifikansi rata rata produksi panas bumi di area pengeboran tersebut
STATISTIKA DESKRIPTIF
3
4. Signifikansi rata-rata produksi panas bumi di area pengeboran tersebut.INFERENSI
STATISTIKA
StatistikStatistik dandan StatistikaStatistikaStatistikStatistik dandan StatistikaStatistika
Statistik : nilai-nilai ukuran data yang mudah dimengerti.
Contoh : o statistik (mis. rata-rata) nilai elevasi pasang surut air laut di
selat Makassar (m), o statistik (mis. variansi) hasil pengukuran tinggi gelombang
(cm) menggunakan AWLR (Automatic Water Level Recorder)(cm) menggunakan AWLR (Automatic Water Level Recorder)o Statisitik (mis. range) antara nilai tinggi pasang maksimum dan
surut minimum (m)
Statistika : ilmu yang berkaitan dengan carapengumpulan, pengolahan, analisis dan pernarikankesimpulan atas data.
4
JenisJenis--jenis Statistikajenis StatistikaJenisJenis jenis Statistikajenis Statistika
1. Statistika deskriptif: metode yang b k d l dberkaitan dengan pengumpulan danpenyajian data.
2. Statistika inferensi: metode yang berkaitan dengan analisis sampel untukberkaitan dengan analisis sampel untukpenarikan kesimpulan tentangkarakteristik populasi.p p
5
Populasi dan SampelPopulasi dan Sampel
Populasi
SampelSampel
setiap obyek populasi memilikip y p p m mkemungkinan/kesempatan yang sama untuk terpilih
Sampel Acak
hasil pengukuran atau pengamatan Data
6
ContohContoh PopulasiPopulasi dandan SampelSampelContohContoh PopulasiPopulasi dandan SampelSampel
Akan dilakukan pengamatan tentang rata-rata produksi minyak bumi di Indonesiaproduksi minyak bumi di Indonesia.
PopulasiS l h titik
Kendala: - sangat banyak, -menghabiskanSeluruh titik di wilayah Indonesia
?
waktu, -menghabiskan biaya
Kaidah PengambilanSampel (Teknik
Keterwakilan sampel ataspopulasi ??
Sampel
? p (Sampling)
p p
7
pContoh: setiap propinsi diambil beberapa titik pengamatan
JenisJenis--jenis Observasijenis Observasi
OBSERVASI / DATA
KUALITATIF KUANTITATIF
Nominal Ordinal/Rank Diskrit Kontinu
Tidak mengenalurutan dan operasi
aritmatika
Mengenal urutan danoperasi aritmatika
Berhubungan dengan‘proses menghitung’, dan pengamatan atas
Didasarkan padasuatu selang/interval
sehingga meliputiaritmatika himpunan terhitung. semua bilangan riil
Jenis bencana yang terjadi di suatu daerah (banjir,
Jenjang pendidikan (SD, SMP, SMA,...), tingkatan
d h (K l h
Banyaknya gempa yang terjadi di suatu daerah dalam 1 hari banyaknya
Intensitas gempa yang terjadi setiap hari di
t il h ti k t
8
( j ,longsor, gempa, dll), jenis
batuan, dll
daerah (Kelurahan, Kecamatan Kab./Kota, Provinsi, Negara), dll
dalam 1 hari, banyaknya hari hujan dalam satu bulan
di suatu daerah, dll
suatu wilayah, tingkat curah hujan harian di
suatu daerah, dll
© 2012 by UM
UkuranPemusatan
Mean, median, modus, kuartil, desil,
persentil, dll
PARAMETER DISTRIBUSI
UkuranPenyebaran (Variabilitas)
Variansi, simpangan baku, range, jangkauan
kuartil, dll
Kemencengan Skewness
Kelancipan Kurtosis
KarakteristikDistribusi
Kelancipan Kurtosis
Simetris Mean = Median
Kesimetrisan Skew Positif Mean > Median
BENTUK DISTRIBUSI
Skew Negatif Mean < Median
Puncak t l 1 modus
Puncak (Modal)
tunggal 1 modus
Puncak jamak Modus banyak@ UM 9
KarakteristikKarakteristik DistribusiDistribusi1. PARAMETER DISTRIBUSI
Ukuran Pemusatan
mean, median, modus, kuartil atas, kuartil
bawah dllDISTRIBUSI
Ukuran Penyebaran
bawah, dllRange, simpangan baku, variansi, jangkauan antar
kuartil, dll
Kemencengan
Kelancipan
skewness
kurtosis
2. BENTUK DISTRIBUSI Simetris
Menceng/skew
mean = median
Menceng/skew Positif
Menceng/skew Negatif
BerpuncakTunggal
BerpuncakJamak
mean > median
mean < median
10
ggggggJJ
# modus > 1 # modus = 1
CONTOH CONTOH 11CONTOH CONTOH 11Data rata-rata curah hujan bulanan yang diamati dari Stasiun Padaherang pada tahun 2001 (n = 12)
278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82
x1 x2 x12x7 x10
Data yang diurutkan:
29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49
x(1) x(2) x(12)X(7) x(10)
11Adakah perbedaan dari penyajian kedua data di atas?
minimum maksimum
UkuranUkuran PemusatanPemusatan & Penyebaran & Penyebaran Data Data Ukuran pemusatan data
statistik yang memberikan informasi dimana data terkumpul dengan ukuran/jumlah tertentu.Contoh : Mean (rataan) kuartil bawah kuartil Contoh : Mean (rataan), kuartil bawah, kuartil tengah (median), kuartil atas, modus, persentil, ...
Ukuran penyebaran datap ystatistik yang memberikan informasi bagaimana data menyebar di sekitar pusat data.C h ( k d ) IQR ( k Contoh : range (jangkauan data), IQR (jangkauan antar kuartil), variansi, standar deviasi (simpangan baku), ...),
12
UkuranUkuran PemusatanPemusatan Data Data UkuranUkuran PemusatanPemusatan Data Data
1. Mean (rata-rata)1. Mean (rata rata)1 n
ix xn
1in
Contoh :
1 2 12...12
x x xx
278.59 279.78 ... 267.82 222.1712
13
50% data (50% data (akhirakhir))50 % data (50 % data (awalawal))29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
X2. Median
X(6.5)
Nilai tengah yang membagi duakelompok data sama banyak.
3 M d
med = x(6.5) = x(6) + 0.5 (x(7) - x(6) )= 254.58
3. ModusNilai yang paling sering muncul.
14
modus tidak ada
4. Kuartil4. Kuartil25 %25 % 25 %25 % 25 %25 % 25 %25 %29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
q d qKuartil bawah (q1) :
q1 q2 = med q3
1 14
nq x
1 12 1 1 3 4 334 4
1 70.474
q x x x x x4
2 (6 5)12 1 254.58 q x x2 2( 1) 1
4 2n nq x x
Kuartil tengah (q2) :
2 (6.5)12 12
254.58
q x x
3 3( 1)nq x
Kuartil atas (q3) :15
3 3(12 1) 3 9 10 994 4
3 305.214
q x x x x x4
5. Persentil5. Persentil
29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
p25 p50 = med p75
• Persentil ke-i : ( 1)i nx
• Persentil ke-50 :50( 1) 1x x
( 1)100
i n
median
50( 1) 1100 2
n nx x
• Persentil ke-25 dan Persentil ke-75?
16
kuartil ataskuartil bawah
UkuranUkuran Penyebaran Penyebaran Data Data UkuranUkuran Penyebaran Penyebaran Data Data
D Data : x1, x2, x3, ..., xnRataan : x
Ukuran penyebaran data yang Ukuran penyebaran data yang melihat bagaimana SETIAP (keseluruhan) observasi terpisah dari pusat datadari pusat data.
Tidak memberikan informasi apa- ( )n
ix xpapa, karena : 1
( )ii
( ) 0n n
i ix x x nx nx nx Jumlah Kuadrat (JK)
17
1 1i i
2
1( )
n
ii
x x
Ukuran Penyebaran DataUkuran Penyebaran Datayy
1. Jangkauan data (Range)
2n
R = datamax – datamin
2. Variansi
R = 508.49 – 29.08 = 479.41
12 2 2
1 1
1 1( ) 1 1
n
in ni
i ii i
xs x x x
n n n
2 20663.8s
?
3 Si B k ( d d d i i )JKXX
20663.8 143.75 s3. Simpangan Baku (standard deviation)
s = √s2
k k l18
4. Jangkauan antar kuartildq = q3 – q1 dq = q3 – q1 = 234.74
Data PencilanData PencilanData PencilanData PencilanData yang nilainya berbeda jauh dari kelompok data yang lain.
Bagaimana mendeteksi data pencilan ??1. Hitung dq
2 Hitung BBP = q1 – k dq
dq = 234.74
BBP = 70.47–(1.5)(234.74 ) = -281.65
Pilih nilai k = 3/2 (optional)2. Hitung BBP q1 k.dq
3 Hitung BAP = q + k dq
( )( )
BAP = 305 21 + (1 5)(234 74) = 657 323. Hitung BAP = q3 + k.dq
4. Pencilan bawah < BBP
BAP = 305.21 + (1,5)(234.74) = 657.32
tidak ada pencilan bawah
19
5. Pencilan atas > BAP tidak ada pencilan atas
SARI NUMERIKCount (banyak data, n) 12Sum (jumlah data) 2666.01Average (rata-rata) 222.17
mean < medianMedian (kuartil tengah) 254.58Mode (modus) -Minimum 29.08
mean < median
Maximum 508.49Range 479.41Standard Deviation 143.75 Menceng
kiri/negatif ???Variance 20663.8Skewness 0.303*Kurtosis -0.181*
kiri/negatif ???
25th Percentile (persentil-25) 70.46550th Percentile (persentil-50) 254.5875th Percentile (persentil-75) 305.205Interquartile Range (dk) 234.74* Perhitungan dengan Mic. Excel
20
Penyajian DataPenyajian DataPenyajian DataPenyajian Data
1. Tabel Distribusi Frekuensi2. Pie Chart3. Dot Plot4. Histogram5 Diagram Batang Daun (stem leaf)5. Diagram Batang – Daun (stem - leaf)6. Diagram Kotak – Titik (box plot)7. dll…
Penyajian data dalam bentuk grafik dapat dilakukan secara
Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik.
21
Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
T b l Di t ib i F k iT b l Di t ib i F k iTabel Distribusi FrekuensiTabel Distribusi Frekuensi Data banyaknya pelanggan yang datang ke sebuah
k d h d b l ly y p gg y g g
mini market di 15 hari tertentu pada bulan Juli 2011.26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Interval
Titik Tengah Kelas
Frekuensi (f) Frekuensi Kumulatif
21 35 28 1 121-35 28 1 1
36-50 43 4 5
51-65 58 1 6
66-80 73 2 8
81-95 88 7 15PRINSIP DASAR
PELUANG
22
Bagaimana bentuk histogramnya?
PELUANG
Pie ChartPie ChartPie ChartPie Chart
10%
9%
58%23%
Pie chart merupakan grafik yang berbentuk lingkaran yang ti t kili i t tmana setiap potongannya mewakili proporsi atau persentase
suatu komponen dari sebuah kelompok data (100%). Pemakaian pie chart hanya cocok ketika menyatakan data
23
y ydalam bentuk proporsi dari satu kelompok data.
Dot PlotDot PlotDot PlotDot Plot
2.5
3
3.5si
0.5
1
1.5
2
frek
uens
Cara menggambarkan data dalam bentuk titik dengan
00 20 40 60 80 100
nilai
Cara menggambarkan data dalam bentuk titik, denganmemperhatikan frekuensi dari data yang bersangkutan
Titik ditumpuk diatas nilai data yang digambarkan.Titik ditumpuk diatas nilai data yang digambarkan.
24
Histogram Histogram Histogram Histogram
Histogram adalah gambar berdasarkan distribusi g gfrekuensi
Setiap frekuensi dipresentasikan oleh suatu segi empat (rectangle)(rectangle).
Daerah setiap rectangle sebanding dengan frekuensinya.25
Diagram Diagram BatangBatang--DaunDaun ((StemStem--L fL f))
26
LeafLeaf))
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Stem atau batang, mirip dengan grup data pada histogram, sedangkanleaf atau daun, mirip dengan frekuensi.
Stem atau batang adalah digit pertama yang terpenting yang adadalam bilangan yang membentuk harga data, sedangkan digit dib l k k k l f t dbelakangnya akan merupakan leaf atau daun.
Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
Diagram Diagram KotakKotak--TitikTitikgg(Box(Box--Plot)Plot)
95100 max
85
95
76
60
70
80
90max
q2
q3
mean
26
47.5
20
30
40
50
min
q1
Box Plot digunakan untuk menyelidiki distribusi tanpa k d d h d
0
10
menggunakan grup data seperti pada histogram dan diagram batang daun.
Box Plot terdiri dari: data i q1 q2 (median) q3 dan Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan datamax yang disusun secara terurut dengan membentuk kotak. 27
PencilanPencilan padapada Box PlotBox PlotPencilanPencilan padapada Box PlotBox Plot
* pencilan atasBAP (pagar atas)
upper whisker
q2
q3
mean
maksimum
lower whisker
q1
minimumlower whisker
**
pencilan bawahBBP (pagar bawah)
28
Kelemahan dan KeunggulanKelemahan dan KeunggulanKelemahan dan KeunggulanKelemahan dan KeunggulanKELEMAHAN KEUNGGULAN
C DOT PLOT Tidak efektif untuk ukuran data
yang besarCepat
Nilai data asli dapat diperkirakan
Lama Histogram peluang dapat memberi gambaran tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Nilai data tidak nampak
gambaran tentang distribusi populasi
Tidak menuntut ketelitian dalam mencatat setiap nilai data
Cepat
BATANG-DAUN Menuntut ketelitian mencatat daun
p
Tidak memerlukan perhitungan
Nilai data asli dapat dilihat
Memudahkan perhitungan berbagai p g gparameter
BOX PLOT
Membutuhkan perhitungan yang panjang
T di i d i
Box plot dapat memberi gambaran tentangbentuk distribusi populasi
BOX PLOT Terdiri dari parameter-parameter dari data yang sudah diurutkan
Efektif untuk membandingkan bentukdistribusi beberapa kelompok data sekaligus
29
BentukBentuk DistribusiDistribusi IdealIdealNormalNormal
mean = median
Memiliki bentuk distribusi yang simetris, yaitu :
Skewness = 0
K t i 3 (d l ft t t t k t i l 0
30
Kurtosis = 3, (dalam software tertentu kurtosis normal = 0
L tih 1L tih 1Latihan 1Latihan 1 Suatu jenis polimer digunakan dalam sistem evakuasi pesawat
terbang. Penting diperhatikan bahwa polimer tersebut harusmampu melawan proses penuaan. Diambil dua puluh sampelpolimer yang kemudian dibagi atas dua percobaan. Percobaanpertama (batch 1) yang melibatkan 10 sampel dikenakan prosespercepatan penuaan dengan temperatur tinggi selama 10 hari.Sedangkan 10 sampel lainnya (batch 2) tidak dikenakan proses
K k t d t (d l i) l lapa-apa. Kekuatan daya rentang (dalam psi) sampel-sampeltersebut diukur dan dicatat sebagai berikut.
Batch 1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205
Q: Apakah percobaan proses penuaan memberikan
31Sumber: Walpole (2006), hal.13
Q p p p pdampak pada kekuatan daya rentang polimer?
Contoh 2Contoh 2Contoh 2Contoh 2 Apa yang dapat kita lakukan untuk menjawab p y g p j
pertanyaan tersebut???
K l k i ik ki- Keluarkan sari numerik yang mungkinUkuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-ATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL, VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan KURTOSIS Apakah diperlukan???
- Plot dataPilih plot yang informatif untuk menjawab pertanyaan tersebut
32
Misal: BOXPLOT
SARI NUMERIKSARI NUMERIKBatch.1 Batch.II
Mean 222,10 209,90SARI NUMERIKSARI NUMERIKVariansi 23,6556 42,1000
Simp.Baku 4,86 6,49Min. 216 201Max. 229 219Q1 218 204,25
Median 221,5 210Q3 226,5 214,75
226.5229230 230
216218
221.5
210
215
220
225
214.75
219
210210
215
220
225
Batch 1195
200
205
210
201
204.25
210
195
200
205
210
@ UM 33
195 Batch 2195
APA YANG DAPAT DISIMPULKAN?? KESIMPULAN DESKRIPTIF
TransformasiTransformasi DataData (pengayaan)(pengayaan)TransformasiTransformasi DataData (pengayaan)(pengayaan)
Transformasi dilakukan untuk mendapatkanbentuk distribusi yang lebih simetris.y g
Transformasi Tangga Tukey-1/x2 -1/x √x log (x) x x2 x3 10x
data awal untuk bentuk distribusi : skewness negatif
untuk bentuk distribusi : skewness positif
Data contoh kasus : skewness = 0 5 (menceng kiri)
Merenggangkan data‐data yang berharga kecildan merapatkan data‐data yang berharga besar
Merapatkan data‐data yang berharga kecil danmerenggangkan data‐data yang berharga besar
34
Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x2, x3, dan 10x.
TransformasiTransformasi DataData (pengayaan) (pengayaan) ContohContoh KasusKasusContohContoh KasusKasus
x y = x2
Lebih mendekati simetris (skew = 0) 873759
756913693481
Lebih mendekati simetris (skew 0) dibanding sebelum transformasi
(skew = -0,5)
49699583
2401476190256889 k 0 1883
873995
6889756915219025
skew = -0,18
837683
6
6889577668896 626
4635
6762116
transformasi
** Ketika data ditransformasi, maka satuandari data juga akan berubah
Referensi Referensi Referensi Referensi
Walpole, Ronald E., et.al, Statistitic for Scientist and Engineering 8th Ed 2007Engineering, 8th Ed., 2007.
36