Upload
suryati-ade-rita-purba
View
75
Download
1
Embed Size (px)
Citation preview
5/26/2018 2.Representasi Data Dalam Grafik
1/36
Chapter 2
Representasi Data: Grafik
Statistika
5/26/2018 2.Representasi Data Dalam Grafik
2/36
Tujuan Bab
Setelah Mempelajari Bab ini, anda mampu :
Mengidentifikasi tipe-tipe data dan level pengukuran
Membuat dan menginterpretasikan grafik untuk analisis variabel kategorik:
Distribusi frequensi, bar chart, pie chart, dll Membuat grafik untuk data time-series
Membuat dan menginterpretasikan grafik untuk analisis variabel numerik :
Distribusi frekuensi, histogram, diagram batang dan daun
Mengkonstruksi dan interpretasi grafik untuk menggambarkan hubunganantar variabel :
Scatter plot, tabulasi silang
5/26/2018 2.Representasi Data Dalam Grafik
3/36
Tipe-tipe Data
Data
Categorical Numerical
Discrete Continuous
Contoh:
Status perkawinan Jenis Kelamin
Tingkat Pendidikan
Status MerokokContoh:
Banyaknya anak
Banyaknya cacat per
jam
Contoh:
Berat Badan
Hasil panen
Konsumsi BBM perliter
5/26/2018 2.Representasi Data Dalam Grafik
4/36
Measurement Levels
Interval Data
Ordinal Data
Nominal Data
Quantitative Data
Qualitative Data
Kategorik (Tidak adaurutan )
Kategorik terurut
(ranking, urutan, orskaling)
Differences betweenmeasurements but notrue zero
Ratio DataDifferences betweenmeasurements, truezero exists
5/26/2018 2.Representasi Data Dalam Grafik
5/36
Adalah skala yang semata-mata hanya untukmemberikan indeks, atau nama saja dan tidakmempunyai makna yang lain
Misal anda memberi angka untuk Jenis Pekerjaan1 = Petani
2 = Pedagang
3 = PNS
Tidak berarti bahwa Petani lebih rendah dari Pedagang danPNS, begitu juga sebaliknya. Anda dapat mengganti angkaketiganya sesuka hati anda tanpa mempengaruhi artistatistikanya.
Skala nominal
5/26/2018 2.Representasi Data Dalam Grafik
6/36
Adalah skala ranking, di mana kode yang diberikanmemberikan urutan tertentu pada data, tetapi tidakmenunjukkan selisih yang sama dan tidak ada nolmutlak
Misal tingkat kecantikan ranking 1,2,3,4.
Jelas bahwa ranking 1 lebih cantik dari ranking 2,3,dan 4. Akan tetapi, tidak berarti bahwa ranking 1mempunyai kecantikan 4 kali dibanding ranking 4,dst
Skala ordinal
5/26/2018 2.Representasi Data Dalam Grafik
7/36
Skala pengukuran yang mempunyai selisih samaantara satu pengukuran dengan pengukuran yanglain, tetapi tidak memiliki nilai nol mutlak
Nilai A setara dengan 4, B dengan 3, C dengan 2 dan Ddengan 1. Selisih A dan B sama dengan selisih B dan Cdan juga sama persis dengan selisih nilai C dan D.Akan tetapi, tidak boleh dikatakan bahwa A empatkali lebih pintar dibandingkan D, atau A dua kali lebih
pintas dari pada B. Meskipun selisihnya sama, tetapitidak mempunyai nilai nol mutlak.
Skala interval
5/26/2018 2.Representasi Data Dalam Grafik
8/36
Sebagai contoh, suhu, dalam derajat Fahrenheit atauCelcius, merupakan skala interval. Kita dapatmengatakan bahwa suhu 50 > 40 derajat, demikianjuga suhu 30 > 20 derajat. Perbedaan selisih suhu
antara 40 dan 50 derajat = perbedaan suhu antara 20dan 30 derajat, yaitu 10 derajat. Perbedaan antarakedua nilai pada skala interval sudah punya maknayang berarti, berbeda dengan perbedaan pada skala
ordinal yang maknanya tidak berarti. Misalnya,perbedaan antara suhu 40 dan 50 derajat dua kalilebih besar dibandingkan dengan perbedaan antarasuhu 30 dan 35.
5/26/2018 2.Representasi Data Dalam Grafik
9/36
Adalah skala pengukuran yang paling tinggi di manaselisih tiap pengukuran adalah sama dan mempunyainilai nol mutlak
BB 100 benar-benar 2x BB 50. BB Ayah anda 60 kg,berat badan anda 40 kg. Berarti BB ayah anda adalah1,5 x BB anda.
Skala rasio
5/26/2018 2.Representasi Data Dalam Grafik
10/36
Memang agak sedikit susah membedakan skalainterval dengan rasio. Kuncinya adalah di angka 0,apakah nilai nol tersebut mutlak atau tidak?
Suhu bisa berupa skala interval tapi bisa juga skalarasio, tergantung pada skala pengukuran yangdigunakan. Apabila kita menggunakan skala Celciusatau Fahrenheit, termasuk skala interval,
Apabila Kelvin yang digunakan, suhu termasuk skalarasio. Mengapa? Karena suhu 0 derajat Kelvin adalahmutlak! Kita tidak saja dapat mengatakan bahwa suhu200 derajat lebih tinggi daripada suhu 100 derajat,tetapi benar dua kali lebih tinggi.
5/26/2018 2.Representasi Data Dalam Grafik
11/36
Presentasi Grafik
Techniques reviewed in this chapter:
Variabel
Kategorik
Variabel
Numerik
Distribusi Frequensi
Bar chart
Pie chart
Diagram Pareto
Line chart
Histogram
Diagram Batang dan
Daun
Scatter plot
5/26/2018 2.Representasi Data Dalam Grafik
12/36
Tabel Distribusi Frekuensi
Contoh: Banyaknya Pasien Per
Unit
Unit RS # Pasien
Cardiac Care 1,052
Emergency 2,245
Intensive Care 340Maternity 552
Surgery 4,630
(Variabel : Kategorik)
Ringkasan data per kategori
5/26/2018 2.Representasi Data Dalam Grafik
13/36
Contoh Bar Chart
Hospital Patients by Unit
0
1000
2000
3000
4000
5000
Cardiac
Care
Emergency
Intensive
Care
Maternity
Surgery
Numberof
patientsperyea
5/26/2018 2.Representasi Data Dalam Grafik
14/36
Hospital Patients by Unit
Emergency
25%
Maternity
6%
Surgery
53%
Cardiac Care
12%
Intensive Care
4%
Pie Chart Example
(Percentase dibulaskan ke
angka terdekat
Hospital Number % ofUnit of Patients Total
Cardiac Care 1,052 11.93
Emergency 2,245 25.46
Intensive Care 340 3.86Maternity 552 6.26
Surgery 4,630 52.50
5/26/2018 2.Representasi Data Dalam Grafik
15/36
Contoh: 400 barang cacat berdasar faktornya:
Source of
Manufacturing Error Number of defects
Bad Weld 34
Poor Alignment 223
Missing Part 25
Paint Flaw 78Electrical Short 19
Cracked case 21
Total 400
Diagram Pareto
5/26/2018 2.Representasi Data Dalam Grafik
16/36
Step 1:Urutkan berdasar sebab kerusakan
Step 2:Hitunglan prosentasenya
Source ofManufacturing Error Number of defects % of Total Defects
Poor Alignment 223 55.75
Paint Flaw 78 19.50
Bad Weld 34 8.50
Missing Part 25 6.25
Cracked case 21 5.25
Electrical Short 19 4.75
Total 400 100%
Diagram Pareto
5/26/2018 2.Representasi Data Dalam Grafik
17/36
Diagram Pareto
cumulative%
(linegraph)
%o
fdefectsineachcategory
(bargraph)
Pareto Diagram: Cause of Manufacturing Defect
0%
10%
20%
30%
40%
50%
60%
Poor Alignment Paint Flaw Bad Weld Missing Part Cracked case Electrical Short
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Step 3:Presentasi grafik
5/26/2018 2.Representasi Data Dalam Grafik
18/36
Grafik data Time-Series
Plot data time series dalam dibuat dalam grafik garis
digunakan untuk menyajikan nilai-nilai dari suatuvariabel sepanjang waktu tertentu
Waktu diukur pada sumbu mendatar
Variabel data diukur pada sumbu vertikal
5/26/2018 2.Representasi Data Dalam Grafik
19/36
Contoh Plot Data TS
Aids Victim by Year
0
50
100
150
200
250
300
350
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
Tho
usandsofVictim
5/26/2018 2.Representasi Data Dalam Grafik
20/36
Apa Distribusi Frequensi itu ?
Distribusi frequensi adalah sebuah daftar atau table
Berisi kelas-kelas atau kategori-kategori
Dan frekuensi data yang bersesuaian
Distribusi Frequensi
5/26/2018 2.Representasi Data Dalam Grafik
21/36
Interval Kelas dan Batasnya
Masing-masing kelas mempunyai lebar yang sama denganformula
Gunakan mininal 5 kelas, tapi tidak lebih 15-20
interval Interval kelas tidak overlap
Bulatkan ke atas lebar interval
intervalsdesiredofnumbernumbersmallestnumberlargestwidthintervalw
5/26/2018 2.Representasi Data Dalam Grafik
22/36
24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27
Contoh Distribusi Frequensi
Suatu perusahaan insulasi secara random
memilih 20 hari di musim winter dan
Mengukur temperaturnya
Urutkan datanya :
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37,
38, 41, 43, 44, 46, 53, 58
5/26/2018 2.Representasi Data Dalam Grafik
23/36
Hitung range: 58 - 12 = 46
Pilih banyaknya kelas: 5
Hitung lebar interval : 10 (46/5 dibulat ke atas ) Tentukan batas interval: 10 but less than 20, 20 but less than
30, . . . , 60 but less than 70
Hitung observasi dan masukkan ke kelas yang sesuai
Frequency DistributionExample
5/26/2018 2.Representasi Data Dalam Grafik
24/36
Distribusi Frequensi
Interval Frequency
10 but less than 20 3 .15 1520 but less than 30 6 .30 30
30 but less than 40 5 .25 25
40 but less than 50 4 .20 20
50 but less than 60 2 .10 10
Total 20 1.00 100
Relative
FrequencyPercentage
5/26/2018 2.Representasi Data Dalam Grafik
25/36
Histogram
Grafik dari data dalam suatu distribusi frequensi disebut
dengan histogram
Nilai-nilai Interval ditunjukkan pada sumbu horisontal
Sumbu vertikal berisi frequensi, atau frequensi relatif,atau persentase
Batang tegak menunjukkan banyaknya observasi atau
frekuensi masing-masing kelas
5/26/2018 2.Representasi Data Dalam Grafik
26/36
Histogram: Daily High Temperature
0
3
6
5
4
2
0
0
1
2
3
4
5
6
7
0 10 20 30 40 50 60
Frequency
Temperature in Degrees
Contoh Histogram
5/26/2018 2.Representasi Data Dalam Grafik
27/36
Bentuk Distribusi
Bentuk distribusi dikatakan symmetric jika observasiseimbang, atau terdistribusi di tengah.
Symmetric Distribution
0
1
2
3
4
5
6
7
8
9
10
1 2 3 4 5 6 7 8 9
Frequency
5/26/2018 2.Representasi Data Dalam Grafik
28/36
Bentuk Distribusi Bentuk distribusi dikatakan skewed(menceng) jika
observasi tidak symmetric.
Positively Skewed Distribution
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9
Frequency
Negatively Skewed Distribution
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9
Frequency
Suatu distribusi dikatakanmenceng ke kanan jika
ekornya melebar ke kanan.
Suatu distribusi dikatakan
menceng ke kiri jika ekornya
melebar ke kiri
5/26/2018 2.Representasi Data Dalam Grafik
29/36
Diagram Batang dan Daun
Cara yang mudah untuk melihat distribusi data set
METHOD: Pisahkan data terurut keangka utama (batang) dan
angka tambahan (daun)
5/26/2018 2.Representasi Data Dalam Grafik
30/36
Contoh
Di sini, gunakan puluhan sebagai batangnya:
Data terurut :21, 24, 24, 26, 27, 27, 30, 32, 38, 41
21 ditunjukkan
38 ditunjukkan
batang daun
2 1
3 8
5/26/2018 2.Representasi Data Dalam Grafik
31/36
Contoh
Diagram batang dan daun lengkap :
Stem Leaves
2 1 4 4 6 7 73 0 2 8
4 1
Data terurut:21, 24, 24, 26, 27, 27, 30, 32, 38, 41
5/26/2018 2.Representasi Data Dalam Grafik
32/36
Contoh lain
Gunakan ratusan sebagai batang :
Diagram batang dan daun lengkap :
bat daun
6 1 3 6
7 2 2 5 8
8 3 4 6 6 9 9
9 1 3 3 6 8
10 3 5 6
11 4 7
12 2
Data:
613, 632, 658, 717,
722, 750, 776, 827,
841, 859, 863, 891,
894, 906, 928, 933,
955, 982, 1034,
1047,1056, 1140,
1169, 1224
5/26/2018 2.Representasi Data Dalam Grafik
33/36
Diagram Scatter Plot digunakan untukobservasi berpasangan dari dua
variabel numerik
Diagram Scatter :
Satu variabel diukur untuk sumbu vertikal
dan lainnya digunakan untuk sumbuhorisontal
Diagram Scatter Plot
5/26/2018 2.Representasi Data Dalam Grafik
34/36
Contoh Diagram Scatter
Age vs. Blood Pressure
0
50
100
150
200
250
0 10 20 30 40 50 60 70
Age
B.
Pressure
Umur
B.
Pressure
23 125
26 140
29 146
33 160
38 167
42 170
50 18855 195
60 200
5/26/2018 2.Representasi Data Dalam Grafik
35/36
Tabulasi Silang
Tabulasi Silang digunakan untuk menampilkandata observasi dua atau lebih variabel kategorik.
Kombinasi kategori dari Var I dan II, dinamakan
dengan sel. Jika ada r kategiri untuk variabel I (baris), dan c
kategori untuk variabel II (kolom), tabelnyadisebut dengan tabel silang rx c. Ada rx c sel
data.
5/26/2018 2.Representasi Data Dalam Grafik
36/36
Contoh Tabel Silang
Tabulasi silang 4 x 3 untuk Biaya RS untuk 4 kategori dari 3RS berbeda (Dalam 100 ribuan )
Category Hospital A HospitalB HospitalC
A 46.5 55 57.5
B 32.0 34 39.0
C 15.5 20 13.5D 16.0 15 7.0