Upload
amal-budiman
View
225
Download
0
Embed Size (px)
Citation preview
8/15/2019 _Bab 4 Eksplorasi Data.ppt
1/29
EKSPLORASI DATA
Bab 4Menampilkan dan Menjelajahi Data
8/15/2019 _Bab 4 Eksplorasi Data.ppt
2/29
Eksplorasi Data:Diagram Batang-Daun dan
Kotak-Garis
8/15/2019 _Bab 4 Eksplorasi Data.ppt
3/29
Diagram Batang-Daun
Diagram Batang-Daun (Stem-and-Leaf Diagram)o Diagram batang-daun mudah “dibaa! dan mudah
dibuato
"ara membuat:#$ %elitilah data &ang hendak diolah' arilah data terkeil
dan terbesar
$ isahkan masing-masing data ke dalam batang
(biasan&a angka pertama dari data) dan daun (angkakedua dari data)$
o "atatan : batang bisa lebih dari dua angka' sesuaikebutuhan$ %etapi daun han&a mengandung satu angka$
3
8/15/2019 _Bab 4 Eksplorasi Data.ppt
4/29
Diagram Batang-Daun
Diagram Batang-Daun (Stem-and-Leaf Diagram)
*$ Daftarkan batang seara +ertikal dan
berurutan' gambarkan garis +ertikal di sebelahkanan batang$
,$ turlah daun di sebelah kanan garis +ertikal
sedemikian rupa sehingga berurutan danbersesuaian dengan batang$
4
8/15/2019 _Bab 4 Eksplorasi Data.ppt
5/29
8/15/2019 _Bab 4 Eksplorasi Data.ppt
6/29
Diagram Batang-Daun
)ia diagram batang-daun t*r+ihat bah,a
o Lokasi pemusatan dari sebaran data dapat diketahui$o Bentuk (shape) sebaran data dapat diketahui'
apakah simetri ataukah tidak simetri(meleneng0menjulur0ske4ed)$ %entu saja dalam halini tidak tepat benar kesimetri-ann&a$ pakahsebaran memiliki satu punak ataukah dua punak5
o
pakah ada data &ang berperilaku “men&impang!5
6
8/15/2019 _Bab 4 Eksplorasi Data.ppt
7/29
Diagram Batang-Daun
6elemahan Diagram Batang-Daun:
77 Sulit men&usun diagram ini pada kasus datasangat men&ebar$ Misaln&a' data berkisarantara /$1 dengan ##$
77 Sebalikn&a' kalau kisarann&a keil'
penggunaan diagram ini menjadi kurang tepat$Misaln&a' data berkisar antara , dengan ,1$
7
8/15/2019 _Bab 4 Eksplorasi Data.ppt
8/29
St*m-and-+*a dis.+a/ is a statistial tehni8ue to present a set of data$ Eah numerial +alue is di+idedinto t4o parts$ %he leading digit(s) beomes the stem and the trailing digit the leaf$ %he stems are loatedalong the +ertial a9is' and the leaf +alues are staked against eah other along the horiontal a9is$
%4o disad+antages to organiing the data into a fre8uen& distribution:
(#) %he e9at identit& of eah +alue is lost
() Diffiult to tell ho4 the +alues 4ithin eah lass are distributed$
E0A1PLEList*d in Tab+* 42$ is th* numb*r o #(-s*3ond radio ad*rtising s.ots .ur3has*d b/ *a3h o th* 4!
m*mb*rs o th* Gr*at*r Bua+o Automobi+* D*a+*rs Asso3iation +ast /*ar5 Organi6* th* data into ast*m-and-+*a dis.+a/5 Around ,hat a+u*s do th* numb*r o ad*rtising s.ots t*nd to 3+ust*r78hat is th* *,*st numb*r o s.ots .ur3has*d b/ a d*a+*r7 Th* +arg*st numb*r .ur3has*d7
Diagram Batang-Daun
8/15/2019 _Bab 4 Eksplorasi Data.ppt
9/29
8/15/2019 _Bab 4 Eksplorasi Data.ppt
10/29
Diagram Batang Daun
;ntuk membuat diagram batang-daun dari data di atas' kita
dapat memodifikasi dengan menghilangkan angka-angka
&ang ada di belakang koma (titik):/ atau / 22
8/15/2019 _Bab 4 Eksplorasi Data.ppt
11/29
Diagram Batang-Daun
=nterpretasi:o Sebaran0distribusi data meleneng ke kanan (ke arah data
&ang tinggi)o Sebagian besar pelanggan belanja di ba4ah / > (dihitung
jumlahn&a ada 1 pelanggan)o %etapi ada 1 pelanggan &ang berbelanja lebih dari 1/ >
o Bagi manajer : bisa meneliti lagi seara lebih detail bagaimana
ara menarik pelanggan untuk berbelanja lebih ban&ak lagi$
11
8/15/2019 _Bab 4 Eksplorasi Data.ppt
12/29
8/15/2019 _Bab 4 Eksplorasi Data.ppt
13/29
o @uartile (kuartil) arti harafiahn&a : AperempatanA
sehingga'o Median disebut kuartil kedua (@) karena
merupakan dua kuartil atau dua perempatanatau ± 1/ dari semua pengamatan nilain&alebih keil dari median tersebut$
@#: ± 1 dari semua data berada diba4ahn&a$
@* : ± 31 dari semua data berada diba4ahn&a$
Kuartil (Quartile)
8/15/2019 _Bab 4 Eksplorasi Data.ppt
14/29
Kuartil (Quartile)
@uartiles split the ranked data into , e8ualgroups
&!9 &!9 &!9 &!9
Sam.+* Data in Ord*r*d Arra/ $$ $& $# $% $% $' $: &$ &&
E9ample: Cind the first 8uartile
(n .)
@# 1th perentile' so find the (.#) $1 position
so use the +alue half 4a& bet4een the nd and *rd +alues'
so ;$ < $&5!
1#//
@# @ @*
8/15/2019 _Bab 4 Eksplorasi Data.ppt
15/29
Sehingga'
@# @ @*
Mediano Bila Median nilai ;F Matematika sama dengan 2'
artin&a5o Bila 6uartil * nilai ;F = sama dengan
8/15/2019 _Bab 4 Eksplorasi Data.ppt
16/29
Business Statistics: A Decisin-!a"ing A##rac$% 6e & '005 rentice-all% *nc+
,$a# 3-16
?raphial displa& of data using 1-numbersummar&:
Minimum -- @# -- Median -- @* -- Ma9imum
E9ample:
Minimum #st Median *rd Ma9imum
@uartile @uartile
Minimum #st Median *rd Ma9imum
@uartile @uartile
1 1 1 1
Diagram 6otak-?aris (Bo9 lot)
8/15/2019 _Bab 4 Eksplorasi Data.ppt
17/29
%he Bo9 and entral line are entered bet4een theendpoints if data is s&mmetri around the median
Bo9 and Ghisker plot an be sho4n in either +ertialor horiontal format
Diagram 6otak-?aris (Bo9 lot)
8/15/2019 _Bab 4 Eksplorasi Data.ppt
18/29
,nt$ B lt
Belo4 is a Bo9-and-Ghisker plot for the follo4ingdata:
/ * * , 1 1 #/ 3
%his data is +er& right ske4ed' as the plot depits / ( * 1 (3
1in ;$ ;& ;# 1a=
8/15/2019 _Bab 4 Eksplorasi Data.ppt
19/29
Diagram Kta" .aris
@#
o *
I;R < Kisaran antarkuarti+ < ;# - ;$
@ @*
penilanpenilan
;$-#>I;R? ;$-$5!>I;R? ;#@$5!>I;R? ;#@#>I;R?
nter/uart e ange
8/15/2019 _Bab 4 Eksplorasi Data.ppt
20/29
nter/uart e ange(*Q)
"an eliminate some outlier problems b& usingthe int*ruarti+* rang*
Eliminate some high-and lo4-+aluedobser+ations and alulate the range from theremaining +alues$
=nter8uartile range *rd 8uartile H #st 8uartile
8/15/2019 _Bab 4 Eksplorasi Data.ppt
21/29
*nter/uartile ange (*Q)
Median
(@)
Ima9imumIminimum @# @*
E9ample:
1 1 1 1
$& #( 4! !' '(
=nter8uartile range 13 H */ 3
8/15/2019 _Bab 4 Eksplorasi Data.ppt
22/29
Business Statistics: A Decisin-!a"ing A##rac$% 6e & '005 rentice-all% *nc+
,$a# 3-''
Distriutin S$a#e an2B an2 $is"er lt
Jight-Ske4edLeft-Ske4ed S&mmetri
;$ ;& ;# ;$ ;& ;# ;$ ;& ;#
,nt$ *nter#retasi B
8/15/2019 _Bab 4 Eksplorasi Data.ppt
23/29
,nt$ *nter#retasi Blt
Statistik FEM Bhs =ndonesia:Kariable Mean StDe+ Minimum @# Median @* Ma9imum=FD 2*/$.1
8/15/2019 _Bab 4 Eksplorasi Data.ppt
24/29
Statistik FEM =:Kariable Mean StDe+ Minimum @# Median @* Ma9imum= ,1
8/15/2019 _Bab 4 Eksplorasi Data.ppt
25/29
Statistik FEM Matematika:Kariable Mean StDe+ Minimum @# Median @* Ma9imumM% *,*$ #/2$< #,1$/ 2/$/ ***$/ ,/2$/ 22*$/
o Berdasarkan bo9 plot' tebaran
data FEM Matematikamenjulur ke arah positif
o 6etaksetangkupandierminkan oleh ekor kotakke arah atas (positif) lebih
panjang dari ekor ke arahba4ah
o da penilan
o @* di sekitar ,' artin&a sekitar31 sis4a dengan FEM di
ba4ah ,
,nt$ *nter#retasi Blt
,nt$ *nter#retasi B
8/15/2019 _Bab 4 Eksplorasi Data.ppt
26/29
Statistik FEM =:Kariable Mean StDe+ Minimum @# Median @* Ma9imum
= ,1
8/15/2019 _Bab 4 Eksplorasi Data.ppt
27/29
Bo9 lot dapat digunakan untukmembandingkan atau lebih gugus data
"ontoh:N Misalkan ingin dikaji apakah ada perbedaan
kandungan kalori dari sejenis hotdog &ang terbuatdari daging Beef dan Poultry $ Berikut ini adalah data(Moore dan M"abe' #.
8/15/2019 _Bab 4 Eksplorasi Data.ppt
28/29
N Data hotdog &ang terbuat dari Beef dan Poultry : 6andungan 6alori Beef 6andungan 6alori Poultry #
8/15/2019 _Bab 4 Eksplorasi Data.ppt
29/29
# (
#//
#1/
(//
Bahan
6
a l o r i
N Berdasarkan gambar: Kandungan ka+ori bahan $ >B**? +*bihtinggi dari bahan & >Pou+tr/? karena @* Beef lebih tinggi dari @'bahkan @* Beef hampir sama dengan @# oultr&O @ Beef lebihtinggi dari @# oultr&O @# Beef lebih tinggi dari seluruh data oultr&
!eman2ing"an ' .ugusData 2engan B lt