_Bab 4 Eksplorasi Data.ppt

Embed Size (px)

Citation preview

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    1/29

    EKSPLORASI DATA

    Bab 4Menampilkan dan Menjelajahi Data

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    2/29

    Eksplorasi Data:Diagram Batang-Daun dan

    Kotak-Garis

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    3/29

    Diagram Batang-Daun

    Diagram Batang-Daun (Stem-and-Leaf Diagram)o Diagram batang-daun mudah “dibaa! dan mudah

    dibuato

    "ara membuat:#$ %elitilah data &ang hendak diolah' arilah data terkeil

    dan terbesar 

    $ isahkan masing-masing data ke dalam batang

    (biasan&a angka pertama dari data) dan daun (angkakedua dari data)$

    o "atatan : batang bisa lebih dari dua angka' sesuaikebutuhan$ %etapi daun han&a mengandung satu angka$

    3

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    4/29

    Diagram Batang-Daun

    Diagram Batang-Daun (Stem-and-Leaf Diagram)

     

    *$ Daftarkan batang seara +ertikal dan

    berurutan' gambarkan garis +ertikal di sebelahkanan batang$

    ,$  turlah daun di sebelah kanan garis +ertikal

    sedemikian rupa sehingga berurutan danbersesuaian dengan batang$

    4

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    5/29

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    6/29

    Diagram Batang-Daun

    )ia diagram batang-daun t*r+ihat bah,a

    o Lokasi pemusatan dari sebaran data dapat diketahui$o Bentuk (shape) sebaran data dapat diketahui'

    apakah simetri ataukah tidak simetri(meleneng0menjulur0ske4ed)$ %entu saja dalam halini tidak tepat benar kesimetri-ann&a$ pakahsebaran memiliki satu punak ataukah dua punak5

    o

     pakah ada data &ang berperilaku “men&impang!5 

    6

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    7/29

    Diagram Batang-Daun

    6elemahan Diagram Batang-Daun:

    77 Sulit men&usun diagram ini pada kasus datasangat men&ebar$ Misaln&a' data berkisarantara /$1 dengan ##$

    77 Sebalikn&a' kalau kisarann&a keil'

    penggunaan diagram ini menjadi kurang tepat$Misaln&a' data berkisar antara , dengan ,1$

    7

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    8/29

    St*m-and-+*a dis.+a/ is a statistial tehni8ue to present a set of data$ Eah numerial +alue is di+idedinto t4o parts$ %he leading digit(s) beomes the stem and the trailing digit the leaf$ %he stems are loatedalong the +ertial a9is' and the leaf +alues are staked against eah other along the horiontal a9is$

    %4o disad+antages to organiing the data into a fre8uen& distribution:

    (#) %he e9at identit& of eah +alue is lost

    ()  Diffiult to tell ho4 the +alues 4ithin eah lass are distributed$

    E0A1PLEList*d in Tab+* 42$ is th* numb*r o #(-s*3ond radio ad*rtising s.ots .ur3has*d b/ *a3h o th* 4!

    m*mb*rs o th* Gr*at*r Bua+o Automobi+* D*a+*rs Asso3iation +ast /*ar5 Organi6* th* data into ast*m-and-+*a dis.+a/5 Around ,hat a+u*s do th* numb*r o ad*rtising s.ots t*nd to 3+ust*r78hat is th* *,*st numb*r o s.ots .ur3has*d b/ a d*a+*r7 Th* +arg*st numb*r .ur3has*d7

    Diagram Batang-Daun

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    9/29

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    10/29

    Diagram Batang Daun

    ;ntuk membuat diagram batang-daun dari data di atas' kita

    dapat memodifikasi dengan menghilangkan angka-angka

      &ang ada di belakang koma (titik):/ atau / 22

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    11/29

    Diagram Batang-Daun

    =nterpretasi:o  Sebaran0distribusi data meleneng ke kanan (ke arah data

    &ang tinggi)o Sebagian besar pelanggan belanja di ba4ah / > (dihitung

     jumlahn&a ada 1 pelanggan)o %etapi ada 1 pelanggan &ang berbelanja lebih dari 1/ >

     o Bagi manajer : bisa meneliti lagi seara lebih detail bagaimana

    ara menarik pelanggan untuk berbelanja lebih ban&ak lagi$ 

    11

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    12/29

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    13/29

    o @uartile (kuartil) arti harafiahn&a : AperempatanA

    sehingga'o Median disebut kuartil kedua (@) karena

    merupakan dua kuartil atau dua perempatanatau ± 1/ dari semua pengamatan nilain&alebih keil dari median tersebut$

    @#: ± 1 dari semua data berada diba4ahn&a$

    @* : ± 31 dari semua data berada diba4ahn&a$

    Kuartil (Quartile)

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    14/29

    Kuartil (Quartile)

    @uartiles split the ranked data into , e8ualgroups

    &!9 &!9 &!9 &!9

    Sam.+* Data in Ord*r*d Arra/ $$ $& $# $% $% $' $: &$ && 

    E9ample: Cind the first 8uartile

    (n .)

    @# 1th perentile' so find the (.#) $1 position

    so use the +alue half 4a& bet4een the nd and *rd +alues'

    so ;$ < $&5!

     1#//

    @# @ @*

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    15/29

    Sehingga'

    @# @ @*

      Mediano Bila Median nilai ;F Matematika sama dengan 2'

    artin&a5o Bila 6uartil * nilai ;F = sama dengan

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    16/29

    Business Statistics: A Decisin-!a"ing A##rac$% 6e & '005 rentice-all% *nc+

    ,$a# 3-16

      ?raphial displa& of data using 1-numbersummar&:

    Minimum -- @# -- Median -- @* -- Ma9imum

    E9ample:

    Minimum #st Median *rd Ma9imum

      @uartile @uartile

    Minimum #st Median *rd Ma9imum

      @uartile @uartile

    1 1 1 1

    Diagram 6otak-?aris (Bo9 lot)

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    17/29

    %he Bo9 and entral line are entered bet4een theendpoints if data is s&mmetri around the median

      Bo9 and Ghisker plot an be sho4n in either +ertialor horiontal format

    Diagram 6otak-?aris (Bo9 lot)

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    18/29

    ,nt$ B lt

    Belo4 is a Bo9-and-Ghisker plot for the follo4ingdata:

      / * * , 1 1 #/ 3

    %his data is +er& right ske4ed' as the plot depits  / ( * 1 (3

    1in ;$ ;& ;# 1a=

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    19/29

    Diagram Kta" .aris

    @#

     

    o *

    I;R < Kisaran antarkuarti+ < ;# - ;$

    @ @*

    penilanpenilan

    ;$-#>I;R? ;$-$5!>I;R? ;#@$5!>I;R? ;#@#>I;R? 

    nter/uart e ange

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    20/29

    nter/uart e ange(*Q)

    "an eliminate some outlier problems b& usingthe int*ruarti+* rang* 

    Eliminate some high-and lo4-+aluedobser+ations and alulate the range from theremaining +alues$

    =nter8uartile range *rd 8uartile H #st 8uartile

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    21/29

    *nter/uartile ange (*Q)

    Median

    (@)

    Ima9imumIminimum @# @*

    E9ample:

    1 1 1 1

    $& #( 4! !' '(

    =nter8uartile range 13 H */ 3

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    22/29

    Business Statistics: A Decisin-!a"ing A##rac$% 6e & '005 rentice-all% *nc+

    ,$a# 3-''

    Distriutin S$a#e an2B an2 $is"er lt

    Jight-Ske4edLeft-Ske4ed S&mmetri

    ;$ ;& ;# ;$ ;& ;# ;$ ;& ;#

    ,nt$ *nter#retasi B

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    23/29

    ,nt$ *nter#retasi Blt

    Statistik FEM Bhs =ndonesia:Kariable Mean StDe+ Minimum @# Median @* Ma9imum=FD 2*/$.1

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    24/29

    Statistik FEM =:Kariable Mean StDe+ Minimum @# Median @* Ma9imum= ,1

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    25/29

    Statistik FEM Matematika:Kariable Mean StDe+ Minimum @# Median @* Ma9imumM% *,*$ #/2$< #,1$/ 2/$/ ***$/ ,/2$/ 22*$/

     

    o Berdasarkan bo9 plot' tebaran

    data FEM Matematikamenjulur ke arah positif 

    o 6etaksetangkupandierminkan oleh ekor kotakke arah atas (positif) lebih

    panjang dari ekor ke arahba4ah

    o  da penilan

    o @* di sekitar ,' artin&a sekitar31 sis4a dengan FEM di

    ba4ah ,

    ,nt$ *nter#retasi Blt

    ,nt$ *nter#retasi B

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    26/29

    Statistik FEM =:Kariable Mean StDe+ Minimum @# Median @* Ma9imum

    = ,1

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    27/29

    Bo9 lot dapat digunakan untukmembandingkan atau lebih gugus data

    "ontoh:N Misalkan ingin dikaji apakah ada perbedaan

    kandungan kalori dari sejenis hotdog &ang terbuatdari daging Beef  dan Poultry $ Berikut ini adalah data(Moore dan M"abe' #.

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    28/29

    N Data hotdog  &ang terbuat dari Beef   dan Poultry :  6andungan 6alori Beef 6andungan 6alori Poultry   #

  • 8/15/2019 _Bab 4 Eksplorasi Data.ppt

    29/29

    # (

    #//

    #1/

    (//

    Bahan

          6

         a      l     o     r      i

    N Berdasarkan gambar: Kandungan ka+ori bahan $ >B**? +*bihtinggi dari bahan & >Pou+tr/? karena @* Beef lebih tinggi dari @'bahkan @* Beef hampir sama dengan @# oultr&O @ Beef lebihtinggi dari @# oultr&O @# Beef lebih tinggi dari seluruh data oultr&

    !eman2ing"an ' .ugusData 2engan B lt