87
Bahan ajar Statistika Inferensial Jurusan Matematika FMIPA Unnes – Putriaji Hendikawati 2011 0 BAHAN AJAR STATISTIKA INFERENSIAL KODE MATA KULIAH MAT 201 ROMBEL 410140-03 410140-04 410140-05 410140-06 410140-07 Semester Gasal 2011/2012 Disusun Oleh Putriaji Hendikawati, S.Si., M.Pd., M.Sc. Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Semarang 2011

STATISTIKA INFERENSIAL 1

Embed Size (px)

Citation preview

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    0

    BAHAN AJAR

    STATISTIKA INFERENSIAL

    KODE MATA KULIAH MAT 201

    ROMBEL 410140-03 410140-04 410140-05 410140-06 410140-07

    Semester Gasal 2011/2012

    Disusun Oleh Putriaji Hendikawati, S.Si., M.Pd., M.Sc.

    Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam

    Universitas Negeri Semarang 2011

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    1

    DAFTAR ISI

    BAB I PENAKSIRAN PARAMETER

    1. Pengertian Penaksiran

    2. Menaksir Rata-rata 3. Menaksir Proporsi 4. Menaksir Simpangan Baku 5. Menaksir Selisih Rata-Rata

    6. Menaksir Selisih Proporsi

    BAB II PENGUJIAN HIPOTESIS

    1. Pendahuluan

    2. Dua Macam Kekeliruan

    3. Langkah Pengujian Hipotesis

    4. Uji Hipotesis Rata-Rata

    5. Uji Hipotesis Proporsi

    6. Uji Hipotesis Varians

    7. Uji Hipotesis Kesamaan Dua Rata-Rata

    8. Uji Hipotesis Kesamaan Dua Proporsi

    9. Uji Hipotesis Kesamaan Dua Varians

    10. Uji Homogenitas Varians Populasi

    BAB III ANALISIS VARIANS

    BAB IV ANALISIS REGRESI

    BAB V ANALISIS KORELASI

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    2

    BAB I

    PENAKSIRAN PARAMETER

    1. Pengertian Penaksiran Statistika digunakan untuk menyimpulkan populasi.

    Kelakuan populasi dipelajari berdasarkan data yang diambil baik secara

    sampling maupun sensus. Namun, karena berbagai faktor untuk

    menyimpulkan populasi diambil sebuah sampel yang representatif kemudian

    berdasarkan hasil analisis terhadap data sampel, kesimpulan mengenai

    populasi dibuat.

    Kelakuan populasi yang akan diamati adalah mengenai parameter populasi

    dan sampel yang digunakan adalah sampel acak. Data sampel dianalisis, nilai-

    nilai yang perlu yaitu statistik dihitung dan berdasarkan nilai-nilai statistik

    dapat disimpulkan bagaimana parameter bertingkah laku.

    Cara pengambilan kesimpulan tentang parameter sehubungan dengan cara-

    cara menaksir harga parameter. Harga parameter yang sebenarnya tetapi tidak

    diketahui nilainya tersebut akan ditaksir berdasarkan statistik sampel yang

    diambil dari populasi yang bersangkutan.

    Parameter populasi yang akan ditaksir pada bab ini adalah rata-rata,

    simpangan baku dan proporsi.

    Secara umum parameter populasi akan diberi simbol (baca: theta). Jadi bisa merupakan rata-rata , simpangan baku , proporsi dan sebagainya. Jika tidak diketahui harganya, ditaksir oleh harga (baca: theta topi), maka dinamakan penaksir.

    Sangat diharapkan = , yaitu penaksir dapat mengatakan harga parameter yang sebenarnya. Namun, keinginan ini dapat dikatakan terlalu ideal.

    Kenyataan yang sering terjadi adalah:

    a. menaksir oleh terlalu tinggi, atau

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    3

    b. menaksir oleh terlalu rendah.

    Kriteria untuk memperoleh penaksir yang baik yaitu: takbias, memiliki varians

    minimum dan konsisten.

    a. penaksir dikatakan penaksir takbias jika rata-rata semua harga yang mungkin akan sama dengan , ditulis ( ) =E . Penaksir yang tidak takbias disebut penaksir bias.

    b. penaksir bervarians minimum ialah penaksir dengan varians terkecil

    diantara semua penaksir untuk parameter yang sama. Jika 1 dan 2 dua penaksir untuk , jika varians 1 < varians 2 , maka 1 merupakan penaksir bervarians minimum.

    c. Misalkan penaksir untuk yang dihitung berdasarkan sebuah sampel acak berukuran n. Jika ukuran sampel n makin besar mendekati ukuran

    populasi menyebabkan mendekati , maka disebut penaksir konsisten.

    d. Penaksir yang takbias dan bervariansi minimum dinamakan penaksir

    terbaik.

    Jika harga parameter ditaksir oleh tertentu, maka dinamakan penaksir atau tepatnya titik taksiran (estimasi titik).

    Misalkan akan ditaksir rata-rata tinggi mahasiswa jurusan matematika Unnes.

    Maka diambil sebuah sampel acak, kemudian data sampel dikumpulkan lalu

    dihitung rata-ratanya. Misalkan diperoleh x = 160 cm. Jika 160 cm ini

    digunakan untuk menaksir rata-rata tinggi mahasiswa jurusan matematika

    Unnes, maka 160 adalah titik taksiran untuk rata-rata tinggi mahasiswa

    matematika Unnes.

    Secara umum x adalah penaksir atau titik taksiran untuk .

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    4

    Titik taksiran untuk suatu parameter , harganya akan berlainan tergantung pada harga x yang diperoleh dari sampel yang diambil, sehingga hasilnya

    kurang meyakinkan atau kurang dapat dipercaya. Untuk itu digunakan interval

    taksiran atau selang taksiran, yaitu menaksir harga parameter di antara batas

    dua harga.

    Dalam prakteknya harus dicari interval taksiran yang sempit dengan derajat

    kepercayaan yang memuaskan. Derajat kepercayaan menaksir, disebut

    koefisien kepercayaan, merupakan pernyataan dalam bentuk peluang.

    Jika koefisien kepercayaan dinyatakan dengan (baca: gamma), maka 10

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    5

    2. Menaksir Rata-rata Misalkan dipunyai populasi berukuran N dengan rata-rata dan simpangan baku . Dari populasi ini akan ditaksir parameter rata-rata . Untuk itu ambil sebuah sampel acak berukuran n, hitung satatistik yang diperlukan yaitu

    x dan s . Titik taksiran untuk rata-rata adalah x . Dengan kata lain, nilai ditaksir oleh harga x yang diperoleh dari sampel. Untuk memperoleh taksiran yang tinggi derajat kepercayaannya, digunakan

    interval taksiran atau selang taksiran disertai nilai koefisien kepercayaan yang

    dikehendaki.

    a. Simpangan baku diketahui dan populasi berdistribusi normal Rumus (I.1) menjadi:

    (I.2) =

    +

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    6

    Untuk interval kepercayaannya:

    (I.5) nstx

    nstx pp .. +

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    7

    Penyelesaian

    Diketahui x = 68,6

    = 5,75 = 95% = 0,95

    21 475,0= 475,0z = 1,96

    a. Sampel n = 30 %51000

    30 =Nn

    n

    zxn

    zx .. 2121 +

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    8

    3. Menaksir Proporsi Misalkan sebuah sampel acak berukuran n diambil dari populasi binomial

    berukuran N dimana terdapat proporsi untuk peristiwa A yang ada dalam populasi tersebut. Jika terdapat x peristiwa A, sehingga proporsi sampel untuk

    peristiwa A = nx . Jadi titik taksiran untuk adalah nx .

    Digunakan pendekatan oleh distribusi normal kepada binomial untuk ukuran

    sampel n cukup besar.

    Rumus 100 % keyakinan untuk interval kepercayaan adalah

    (I.8) npqzp

    npqzp ..

    21

    21 +

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    9

    ( ) ( )( ) ( ) ( )( )100

    4,06,0.96,16,0100

    4,06,0.96,16,0 +

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    10

    Contoh

    Dari sebuah populasi yang berdistribusi normal, diambil sampel yang representatif

    dan diperoleh simpangan baku sebesar 6 dengan ukuran sampel 31. Dengan

    koefisien kepercayaan 99%, taksirlah interval dari simpangan baku populasi.

    Penyelesaian

    Diketahui n = 31

    s = 6

    = 99 % = 0,99 ( ) ( ) ( ) ( ) ( ) 7,53

    230,995,0

    2131,99,012

    12

    ,121 === ++ dk

    ( ) ( ) ( ) ( ) ( ) 8,132

    30,005,02

    131,99,0121

    2,12

    1 === dk Interval kepercayaan simpangan baku populasi adalah

    ( )( )

    ( )( )

    212

    1

    22

    212

    1

    2 11

    +

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    11

    Akan ditaksir selisih rata-rata )( 21 . Titik taksiran untuk adalah )( 21 adalah )( 21 xx . Untuk menaksir selisih rata-rata dibedakan hal-hal berikut:

    a. Dalam hal 21 = Jika kedua populasi normal dan memiliki == 21 yang besarnya diketahui, maka 100 % interval kepercayaan untuk )( 21 adalah

    (I.11) 212

    12121212

    12111)(11)(nn

    zxxnn

    zxx ++

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    12

    Dengan memisalkan 11 =s dan 22 =s untuk sampel-sampel acak berukuran cukup besar, dapat dilakukan pendekatan kepada distribusi normal.

    Rumus interval kepercayaan ditentukan oleh:

    (I.14) 2

    22

    1

    21

    212121

    2

    22

    1

    21

    2121 )()( n

    snszxx

    ns

    nszxx ++

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    13

    dengan pt diperoleh dari daftar distribusi Student dengan ( )+= 121p dan ( )1= ndk .

    Contoh (Sudjana)

    Ada dua cara pengukuran untuk mengukur kelembaban suatu zat. Cara I

    dilakukan 50 kali yang menghasilkan 1x = 60,2 dan 21s = 24,7. Cara II dilakukan

    60 kali dengan 2x = 70,4 dan 22s = 37,2. Tentukan interval kepercayaan 95%

    mengenai perbedaan rata-rata pengukuran dari kedua cara tersebut.

    Penyelesaian

    Diketahui 1x = 60,2 ; 21s = 24,7

    2x = 70,4 ; 22s = 37,2

    Dimisalkan hasil kedua cara pengukuran berdistribusi normal.

    ( ) ( ) 975,095,0121121 =+=+= p ; 10826050 =+=dk Karena kedua populasi normal dan memiliki == 21 tetapi besarnya tidak diketahui, maka varians gabungan dari sampel adalah

    ( ) ( ) ( )( ) ( )( ) 53,3126050

    2,371607,241502

    11

    21

    222

    2112 =+

    +=++=

    nnsnsns

    Maka interval kepercayaan

    21

    212121

    2111.)(11.)(nn

    stxxnn

    stxx pp ++

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    14

    diambil sebuah sampel acak berukuran 1n dan 2n . Proporsi untuk peristiwa

    yang diperhatikan pada sampel tersebut adalah 1

    11 n

    xp = dan 2

    22 n

    xp = dengan

    1x dan 2x menyatakan banyaknya peristiwa yang diperhatikan.

    Akan ditentukan interval taksiran untuk ( )21 dengan menggunakan pendekatan oleh distribusi normal asalkan 1n dan 2n cukup besar.

    Rumus untuk 100 % interval kepercayaan selisih ( )21 adalah (I.16)

    ( ) ( )2

    22

    1

    11

    212121

    2

    22

    1

    11

    2121 n

    qpnqp

    zppn

    qpnqp

    zpp ++

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    15

    ( ) ( )2

    22

    1

    11

    212121

    2

    22

    1

    11

    2121 n

    qpnqp

    zppn

    qpnqp

    zpp ++

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    16

    c. simpangan baku kedua populasi diasumsikan tidak sama.

    4. Dari populasi tanaman padi jenis A dan jenis B, diambil sampel tinggi

    tanaman padi sbb:

    Sampel I dari padi jenis A : 39,3 ; 45,5 ; 41,2 ; 53 ; 44,2 ; 42,5 ; 63,9.

    Sampel II dari padi jenis B : 37 ; 42,4 ; 40,1 ; 52,2 ; 41,5 ; 40,8 ; 60,2.

    Dengan observasi berpasangan tersebut dan interval kepercayaan 95 %,,

    taksirlah selisih rata-ratanya.

    5. Sebuah sampel berukuran 200 lampu yang dihasilkan oleh sebuah mesin

    produksi menunjukkan 15 buah lampu rusak. Sebuah sampel lain berukuran

    100 buah lampu yang dihasilkan oleh mesin kedua mengandung 12 buah

    lampu yang rusak. Tentukan interval kepercayaan 99% untuk selisih kedua

    perbandingan.

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    17

    BAB II

    PENGUJIAN HIPOTESIS

    1. Pendahuluan Sebelumnya telah dipelajari cara-cara menaksir parameter untuk mengambil

    kesimpulan tentang berapa besar harga parameter. Cara pengambilan

    kesimpulan yang kedua akan dipelajari adalah melalui pengujian hipotesis.

    Hipotesis adalah asumsi atau dugaan mengenai sesuatu hal yang dibuat untuk

    menjelaskan hal tersebut yang sering dituntut untuk melakukan

    pengecekannya.

    Jika asumsi atau dugaan tersebut dikhususkan mengenai populasi, umumnya

    mengenai nilai-nilai parameter populasi, maka hipotesis disebut hipotesis

    statistik.

    Contoh hipotesis

    a. peluang lahirnya bayi berjenis kelamin laki-laki = 0,5.

    b. 25 % masyarakat termasuk golongan A.

    c. Rata-rata pendapatan keluarga di suatu daerah Rp 300.000,00 tiap bulan.

    Setiap hipotesis bisa benar atau tidak benar, maka perlu diadakan penelitian

    sebelum hipotesis itu diterima atau ditolak. Langkah atau prosedur untuk

    menentukan apakah menerima atau menolak hipotesis dinamakan pengujian

    hipotesis.

    2. Dua Macam Kekeliruan Meskipun dalam penelitian hipotesis telah diterima atau ditolak, tidak berarti

    bahwa telah dibuktikan kebenaran hipotesis. Yang diperlihatkan adalah hanya

    menerima atau menolak hipotesis saja.

    Dalam melakukan pengujian hipotesis, ada dua macam kekeliruan yang dapat

    terjadi, yaitu:

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    18

    a. Kekeliruan tipe I ialah menolak hipotesis yang seharusnya diterima,

    b. Kekeliruan tipe II ialah menerima hipotesis yang seharusnya ditolak.

    Tipe Kekeliruan Ketika Membuat Kesimpulan tentang Hipotesis

    Keadaan Sebenarnya Kesimpulan Hipotesis Benar Hipotesis Salah Terima Hipotesis BENAR SALAH

    (Kekeliruan tipe II) Tolak Hipotesis SALAH

    (Kekeliruan tipe II) BENAR

    Kedua tipe kekeliruan dinyatakan dalam bentuk peluang. Peluang membuat

    kekeliruan tipe I biasa dinyatakan dengan (alpha) maka disebut pula kekeliruan dan peluang membuat kekeliruan tipe II dinyatakan dengan (beta) dikenal dengan kekeliruan . disebut taraf signifikan (level of significan) atau taraf arti atau sering disebut taraf nyata.

    Jika diperkecil, maka menjadi besar dan demikian sebaliknya. Harga yang biasa digunakan adalah 01,0= atau 05,0= . Misalnya, dengan 05,0= atau sering disebut taraf nyata (taraf signifikansi) 5%, artinya kira-kira 5 dari tiap 100 kesimpulan bahwa akan menolak

    hipotesis yang harusnya diterima. Dengan kata lain kira-kira 95% yakin

    bahwa telah dibuat kesimpulan yang benar. Dalam hal demikian dikatakan

    bahwa hipotesis telah ditolak pada taraf nyata 0,05 yang berarti mungkin salah

    dengan peluang 0,05.

    3. Langkah Pengujian Hipotesis Pengujian hipotesis akan membawa pada kesimpulan untuk menerima atau

    menolak hipotesis. Sehingga terdapat dua pilihan, dimana digunakan

    perumusan seperlunya agar lebih terperinci dan lebih mudah dalam penentuan

    di antara dua pilihan tersebut.

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    19

    Hipotesis yang biasa dinyatakan dengan H, perlu dirumuskan dengan singkat

    dan jelas sesuai dengan persoalan yang dihadapi. Agar tampak adanya dua

    pilihan, maka hipotesis H ini didampingi pernyataan lain yang isinya

    berlawanan yang disebut dengan hipotesis tandingan (alternatif) yang

    dinyatakan dengan A.

    Pasangan hipotesis H dan A, tepatnya H melawan A, akan menentukan

    kriteria pengujian yang terdiri dari daerah penerimaan dan daerah penolakan

    hipotesis. Daerah penolakan hipotesis sering disebut dengan daerah kritis.

    Bila menguji parameter ( dapat berupa rata-rata , proporsi , simpangan baku , dll), maka: a. Hipotesis mengandung pengertian sama

    Pengujian sederhana lawan sederhana

    1) H : 0 = A : 1 = dengan 10 , dua nilai berbeda yang diketahui.

    Pengujian sederhana lawan komposit

    2) H : 0 = A : 0

    3) H : 0 = A : 0 >

    4) H : 0 = A : 0 <

    b. Hipotesis mengandung pengertian maksimum (pengujian komposit lawan

    komposit)

    H : 0 A : 0 >

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    20

    c. Hipotesis mengandung pengertian minimum pengujian komposit lawan

    komposit)

    H : 0 A : 0 <

    Berikut hanya akan dipelajari pengujian terhadap hipotesis yang

    perumusannya mengandung pengertian sama atau tidak memiliki perbedaan,

    disebut hipotesis nol 0H melawan hipotesis tandingannya 1H , yang

    mengandung pengertian tidak sama, lebih besar atau lebih kecil. 1H harus

    dipilih dan ditentukan peneliti sesuai dengan persoalan yang dihadapi.

    Pasangan 0H dan 1H yang telah dirumuskan dituliskan dalam bentuk berikut.

    =

    01

    00

    : H : H

    atau

    >=

    01

    00

    : H : H

    atau

    =

    01

    00

    : H : H

    2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.

    Tolak 0H jika 5,0zz , selainnya 0H diterima. Dengan 5,0z diperoleh dari daftar distribusi normal baku dengan

    peluang ( )5,0 . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

    menggunakan statistik z yang sama dengan rumus (II.1).

    5. Menarik kesimpulan berdasarkan hasil 3 dan 4.

    b. Dalam hal tidak diketahui

    Pada kenyataannya simpangan baku sering tidak diketahui, maka digunakan taksirannya yaitu simpangan baku s .

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    27

    Langkah pengujian hipotesis:

    1. Hipotesis pengujian

    >=

    01

    00

    : H : H

    2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.

    Tolak 0H jika 1tt , selainnya 0H diterima. Dengan 1t diperoleh dari daftar distribusi t (distribusi Student)

    dengan peluang 1 dan 1= ndk . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

    menggunakan statistik t yang sama dengan rumus (II.2).

    5. Menarik kesimpulan berdasarkan hasil 3 dan 4.

    Contoh

    Proses pembuatan barang rata-rata menghasilkan 15,7 unit per jam. Hasil produksi

    memiliki varians 2,3. metode baru diusulkan untuk mengganti metode lama jika

    rata-ratanya per jam menghasilkan paling sedikit 16 buah. Untuk menentukan

    apakah metode akan diganti atau tidak, metode baru dicoba 20 kali dan ternyata

    rata-rata perjam menghasilkan 16,9 buah. Pengusaha bermaksud mengambil risiko

    5% untuk menggunakan metode baru apabila metode ini rata-rata menghasilkan

    labih dari 16 buah. Apakah keputusan yang akan diambil pengusaha?

    Penyelesaian

    Diketahui x = 16,9 ; n = 20 ; = 3,2 , 0 =16 Langkah pengujian hipotesis:

    1. Hipotesis pengujian

    =

    01

    00

    : H : H

    yaitu

    >=

    16 : H 16 : H

    1

    0

    2. Taraf signifikansi = 5%. 3. Kriteria pengujian.

    Tolak 0H jika 5,0zz 64,105,05,05,0 == zz

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    28

    4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

    65,2

    203,2169,160 ===

    n

    xz

    5. Kesimpulan : karena 64,165,2 5,0 =>= zzhitung terletak pada daerah kritis maka 0H ditolak. Jadi, 16> . Sehingga dapat disimpulkan bahwa dengan risiko 5% metode baru dapat menggantikan metode lama.

    Uji Pihak Kiri

    a. Dalam hal diketahui Langkah pengujian hipotesis:

    1. Hipotesis pengujian

    =81,0 : H

    81,0 : H2

    1

    20

    2. Taraf signifikansi = 5%. 3. Kriteria pengujian.

    Tolak 0H jika 21

    2 , selainnya terima 0H .

    919,16205,0.2

    1 = dengan 91101 === ndk 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.

    ( ) ( )( ) 0,1681,0

    44,31110120

    22 ===

    sn

    5. Kesimpulan : karena 919,1616 205,0.2

    12 =

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    37

    akan digunakan dasar distribusi sampling mengenai selisih statistik, misalnya

    selisih rata-rata dan selisih proporsi.

    Misalkan dipunyai dua buah populasi, keduanya berdistribusi normal dengan

    rata-rata dan simpangan baku masing-masing 1 dan 1 untuk populasi pertama, 2 dan 2 untuk populasi kedua. Secara independen diambil sebuah sampel acak dengan ukuran 1n dan 2n dari masing-masing populasi. Rata-rata

    dan simpangan baku dari sampel-sampel itu berturut-turut 1x , 1s dan 2x , 2s .

    Akan diuji tentang rata-rata 1 dan 2 . a. Dalam hal == 21 dan diketahui

    Langkah pengujian hipotesis:

    a. Hipotesis pengujian

    =

    211

    210

    : H : H

    b. Tentukan besarnya taraf signifikansi . c. Kriteria pengujian.

    Terima 0H jika ( ) ( )

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    38

    3. Kriteria pengujian.

    Terima 0H jika 211211

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    39

    3. Kriteria pengujian.

    Terima 0H jika 211211

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    40

    mt , diperoleh dari daftar distribusi Student dengan peluang dan mdk = .

    4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.

    (II.11)

    2

    22

    1

    21

    21

    ns

    ns

    xxt+=

    5. Menarik kesimpulan berdasarkan hasil 3 dan 4.

    Contoh (Sudjana)

    Suatu barang dihasilkan dengan menggunakan dua proses. Ingin diketahui apakah

    kedua proses itu menghasilkan barang yang sama kualitasnya ditinjau dari rata-

    rata daya tekannya. Maka diadakan percobaan sebanyak 20 kali masing-masing

    dari hasil proses pertama maupun kedua. Diperoleh informasi 1x = 9,25 kg ; 2x =

    10,4 kg ; 1s = 2,24 kg ; 2s = 3,12 kg. Bila populasinya dianggap normal dengan

    varians kedua populasi tidak sama, dengan taraf nyata 5%, ujilah bagaimana

    hasilnya!

    Penyelesaian

    Diketahui 1x = 9,25 kg ; 2x = 10,4 kg ; 1s = 2,24 kg ; 2s = 3,12 kg.

    Pada kasus ini populasi dianggap normal dan variansnya tidak diketahui namun

    sama besar.

    Langkah pengujian hipotesis dalam hal 21 dan keduanya tidak diketahui 1. Hipotesis pengujian

    =

    berbeda yang tekan daya rata-rata kualitasdengan barangan menghasilk proses kedua; : Hsama yang tekan daya rata-rata kualitasdengan barangan menghasilk proses kedua; : H

    211

    210

    2. Taraf signifikansi = 5%. 3. Kriteria pengujian.

    Terima 0H jika 21

    2211

    21

    2211

    wwtwtwt

    wwtwtw

    ++

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    41

    2509,0200176,5

    1

    21

    1 === nsw ; 4867,0

    207344,9

    2

    22

    2 === nsw

    ( ) ( ) ( ) ( ) 09,219;975,0120,05,0.2111,2111 1 ===== tttt n

    ( ) ( ) ( ) ( ) 09,219;975,0120,05,0.2111,2112 2 ==== tttt n

    Sehingga 21

    2211

    21

    2211

    wwtwtwt

    wwtwtw

    ++

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    42

    Dengan 211t diperoleh dari daftar distribusi t dengan peluang

    211 dan 1= ndk . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.

    (II.12)

    nsBt

    B=

    5. Menarik kesimpulan berdasarkan hasil 3 dan 4.

    11. Uji Hipotesis Kesamaan Dua Rata-Rata: Uji Satu Pihak Serupa dengan uji dua pihak, pada uji satu pihak juga dimisalkan dipunyai dua

    buah populasi, keduanya berdistribusi normal dengan rata-rata masing-masing

    1 dan 2 dan simpangan baku 1 dan 2 . Uji Pihak Kanan

    a. Dalam hal 21 = Langkah pengujian hipotesis:

    1) Hipotesis pengujian

    >=

    211

    210

    : H : H

    2) Tentukan besarnya taraf signifikansi . 3) Kriteria pengujian.

    Terima 0H jika < 1tt , dan tolak 0H untuk harga t yang lain. Dengan 221 += nndk dan peluang ( )1 dari daftar distribusi t.

    4) Statistik hitung berdasarkan data penelitian (sampel) yang diambil

    menggunakan statistik t yang sama dengan rumus (II.9) dan (II.10).

    5) Menarik kesimpulan berdasarkan hasil 3 dan 4.

    b. Dalam hal 21

    Pendekatan yang cukup memuaskan adalah dengan menggunakan statistik

    t .

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    43

    Langkah pengujian hipotesis:

    a) Hipotesis pengujian

    >=

    211

    210

    : H : H

    b) Tentukan besarnya taraf signifikansi . c) Kriteria pengujian.

    Tolak 0H jika 21

    2211

    wwtwtwt +

    + , dan terima 0H jika terjadi sebaliknya.

    Dengan 1

    21

    1 nsw = ;

    2

    22

    2 nsw =

    ( ) ( )1,2111 1= ntt dan ( ) ( )1,2112 2= ntt Peluang untuk penggunaan daftar distribusi t adalah ( )1 sedangkan derajat kebebasannya masing-masing ( )11 n dan ( )12 n .

    d) Statistik hitung berdasarkan data penelitian (sampel) yang diambil

    menggunakan statistik t yang sama dengan rumus (II.11). e) Menarik kesimpulan berdasarkan hasil 3 dan 4.

    c. Observasi berpasangan

    Langkah pengujian hipotesis:

    1. Hipotesis pengujian

    >=

    0 : H0 : H

    1

    0

    B

    B

    2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.

    Tolak 0H jika 1tt , selainnya terima 0H . Dengan 1t diperoleh dari daftar distribusi t dengan peluang 1 dan 1= ndk .

    4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

    menggunakan statistik t yang sama dengan rumus (II.12).

    5. Menarik kesimpulan berdasarkan hasil 3 dan 4.

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    44

    Uji Pihak Kiri

    a. Dalam hal 21 = dan keduanya tidak diketahui Langkah pengujian hipotesis:

    1. Hipotesis pengujian

    =

    : H : H

    B1

    B0

    A

    A

    2. Taraf signifikansi = 5%. 3. Kriteria pengujian.

    Tolak 0H jika 5,0zz dan Terima 0H jika < 5,0zz . 64,105,05,05,0 == zz

    4. Statistik hitung berdasarkan data penelitian (sampel)

    74,01001006880 =+

    +=++=

    BA

    BA

    nnxxp

    26,074,011 === pq

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    49

    ( )( )94,1

    1001

    100126,074,0

    10068

    10080

    11=

    +=

    +

    =

    BA

    B

    B

    A

    A

    nnpq

    nx

    nx

    z

    5. Kesimpulan: karena 64,194,1 >=hitungz maka 0H ditolak. Jadi, B >A . Artinya, pada taraf 5%, pemberian obat dapat membantu penyembuhan penyakit.

    Bagaimanakah bila penelitian ini diuji dengan taraf nyata 1%, apakah masih

    memberikan hasil yang sama dengan kesimpulan di atas!

    14. Uji Hipotesis Kesamaan Dua Varians: Uji Dua Pihak Ketika menaksir selisih rata-rata dan menguji kesamaan atau perbedaan dua

    rata-rata ditekankan asumsi bahwa kedua populasi memiliki varians yang

    sama agar menaksir dan menguji bisa dilakukan. Dalam hal varians yang

    berbeda, hingga saat ini hanya digunakan cara pendekatan. Oleh karena itu,

    maka perlu dilakukan pengujian mengenai kesamaan dua varians atau lebih.

    Populasi-populasi dengan varians yang sama besar dinamakan populasi

    dengan varians yang homogen. Bila populasi tersebut memiliki varians yang

    berbeda disebut populasi dengan varians yang heterogen.

    Berikut akan dilakukan pengujian kesamaan varians untuk dua populasi.

    Misalkan dipunyai dua populasi normal dengan varians 21 dan 22 . Langkah pengujian hipotesis:

    1. Hipotesis pengujian

    =

    22

    211

    22

    210

    :: H

    : H

    2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.

    Terima 0H jika ( ) ( ) ( )1,1211,1,211 2121

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    50

    4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil jika

    sampel dari populasi pertama berukuran 1n dengan variansi 21s dan sampel

    dari populasi kedua berukuran 2n dengan variansi 22s .

    (II.14) 22

    21

    ssF =

    Statistik lain yang digunakan

    (II.15) terkecilVariansterbesarVariansF =

    Kriteria pengujian.

    Tolak 0H jika ( )21 ,21 vvFF .

    Dengan ( )21 ,21 vvF diperoleh dari daftar distribusi F dengan peluang 21 dan derajat kebebasan v1 dan v2.

    5. Menarik kesimpulan berdasarkan hasil 3 dan 4.

    Contoh

    Dari dua populasi siswa diukur hasil prestasi belajar siswa. Dari populasi pertama

    diukur 10 orang siswa ternyata 21s = 24,7. Dari populasi kedua diukur 13 siswa

    ternyata 22s = 37,2. Dengan = 10%, ujilah apakah kedua populasi tersebut homogen.

    Penyelesaian

    Diketahui 21s = 24,7 n1 = 10

    22s = 37,2 n2 = 13

    Langkah pengujian hipotesis:

    1. Hipotesis pengujian

    =

    22

    211

    22

    210

    :: H

    : H

    2. Taraf signifikansi = 10%. 3. Kriteria pengujian.

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    51

    Terima 0H jika ( ) ( ) ( )1,1211,1,211 2121

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    52

    15. Uji Hipotesis Kesamaan Dua Varians: Uji Satu Pihak

    Uji Pihak Kanan

    Langkah pengujian hipotesis:

    1. Hipotesis pengujian

    >=

    22

    211

    22

    210

    :: H

    : H

    2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.

    Tolak 0H jika ( )1,1 21 nnFF , selainnya terima 0H . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

    menggunakan statistik yang sama dengan rumus (II.14)

    5. Menarik kesimpulan berdasarkan hasil 3 dan 4.

    Uji Pihak Kiri

    Langkah pengujian hipotesis:

    1. Hipotesis pengujian

    k populasi yang berdistribusi normal.

    Dasar pemikiran penggunaan analisis varians adalah bahwa varians total semua

    subjek dalam suatu eksperimen dapat dianalisis dari dua sumber, yaitu variansi

    antar kelompok dan variansi di dalam kelompok.

    Asumsi dasar dari analisis varians adalah sebagai berikut:

    Populasi yang diamati memiliki distribusi normal.

    Pengambilan sampel dilakukan secara acak dan setiap sampel independen/tidak

    terikat sampel yang lain.

    Populasi-populasi dimana nilai sampel diperoleh memiliki varians populasi yang

    sama atau dapat ditulis 22221 , k === K dengan k jumlah populasi.

    Dikenal beberapa jenis varians sampel 2s , salah satunya dihitung dengan rumus

    ( )1

    22

    =

    nxx

    s i dan varians populasi adalah 2 . Varians untuk sekumpulan data ini melukiskan derajat perbedaan atau variansi

    nilai data individu yang ada dalam kelompok atau kumpulan data tersebut.

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    56

    Variansi ini dihitung dari nilai rata-rata kumpulan data. Selain itu dikenal pula

    varians sampling berbagai statistik, untuk rata-rata diberi lambang 2x , untuk proporsi dengan lambang 2

    nx , dan sebagainya.

    Langkah-langkah Analisis varians adalah sebagai berikut:

    1. Rumuskan hipotesis nol ( 0H ) dan hipotesis tandingannya ( 1H ).

    0H : mean k populasi ( )2>k yang berdistribusi normal adalah sama. 1H : diantara k populasi ( )2>k terdapat mean populasi yang berbeda.

    (minimum ada satu tanda sama dengan tidak berlaku)

    Atau secara matematis

    kH ==== K3210 :

    k

    k

    kH

    =====

    KKK

    321

    321

    3211 :

    2. Ambil sampel acak dari k buah ( )2>k populasi sbb: Sampel I Sampel II Sampel III ... Sampel k

    11x 12x 13x ... kx1

    21x 22x 23x ... kx2

    31x 32x 33x ... kx3 M M M ... M

    1nx 2nx 3nx ... nkx

    1x 2x 3x ... kx 3. Tentukan besarnya taraf signifikansi . 4. Gunakan statistik F (Fisher)

    kelompokdalamiansmeansantarians

    VDKVAMFhitung var

    var==

    ( )1

    1

    2

    22

    ====

    k

    xxnnSVAM

    k

    jj

    x , 1= kdk

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    57

    ( )( )11 1

    2

    == =

    nk

    xxVDK

    n

    i

    k

    jjij

    Dengan x mean dari semua mean sampel

    jx mean sampel ke-j, j = 1, 2, ..., k

    ijx nilai data observasi ke-i dari sampel ke-j

    5. Kriteria pengujian.

    Terima 0H jika ( )( )1,1; nkkhitung FF . Tolak 0H jika ( )( )1,1; > nkkhitung FF .

    6. Mengambil kesimpulan berdasarkan hasil 4 dan 5.

    7. Jika 0H diterima maka pengujian berakhir.

    Jika 0H ditolak, analisis dilanjutkan dengan Uji Lanjut salah satunya

    dengan menggunakan Uji

    21LSD (Least Significant Different).

    ( ) dnk StLSD .1,211211

    =

    ji

    d ns

    nsS

    22

    += , VDKs =2

    Kriteria pengujian Uji lanjut

    211

    LSD

    Bandingkan antara ix dan jx : ji xx jika 211

    >= LSDxxd jiij .

    Contoh

    Diterapkan model pembelajaran dengan 3 metode, kemudian dilakukan tes dan

    diperoleh skor hasil tes sbb:

    Sampel ke-

    Metode I Metode II Metode III

    1 25 22 22 2 29 25 21 3 28 24 26 4 30 25 23

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    58

    a. Dengan anava selidikilah apakah ada perbedaan diantara tiga mean skor

    hasil belajar dengan ketiga metode tersebut.

    b. Bila terdapat perbedaan, dengan uji lanjut selidikilah model pembelajaran

    yang manakah yang terbaik. Gunakan = 5%. Penyelesaian

    Diketahui 1x = 28 2x = 24 3x = 23

    x = 25

    Langkah-langkah Analisis varians:

    Merumuskan hipotesis uji

    3210 : ==H 1H : paling sedikit ada satu tanda sama dengan tidak berlaku.

    Sampel acak dari 3 buah populasi seperti tertera pada soal di atas.

    Taraf signifikansi = 5%.. Gunakan statistik F (Fisher)

    ( ) ( ) ( ) ( ){ } 2813

    25232524252841

    2221

    2

    =++=

    ==

    k

    xxnVAM

    k

    jj

    ( )( )

    ( ) ( )( ) ( )

    ( ) ( )( ) ( )

    ( ) ( )( ) ( )

    ( )78,3

    91

    14328232826

    28212822

    28252824

    28252822

    28302828

    28292825

    1

    22

    22

    22

    22

    22

    22

    1 1

    2

    ==

    ++++

    ++++

    +++

    =

    == =

    nk

    xxVDK

    n

    i

    k

    jjij

    41,778,3

    28 ===VDKVAMFhitung

    Kriteria pengujian.

    Terima 0H jika ( )( )1,1; nkkhitung FF Tolak 0H jika ( )( )1,1; > nkkhitung FF

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    59

    ( )( ) ( )( ) ( ) 26,49,2;05,0143,13;05,01,1; === FFF nkk Kesimpulan : karena ( )( ) 26,441,7 1,1; =>= nkkhitung FF maka 0H ditolak.

    Artinya, ada perbedaan diantara ketiga mean skor hasil belajar dengan

    ketiga metode tersebut.

    Karena 0H ditolak, maka analisis dilanjutkan dengan Uji Lanjut menggunakan

    Uji

    211

    LSD

    3748,1478,3

    478,322 =+=+=

    jid n

    snsS , 78,32 ==VDKs

    ( ) ( ) ( ) ( )( ) ( )( ) ( ) 11,33748,1.26,2

    3748,1.

    3748,1..

    9,975,0

    143,05,02111,2

    11211

    =====

    t

    tStLSD dnk

    Kriteria pengujian Uji lanjut

    211

    LSD

    Bandingkan antara ix dan jx : ji xx jika 211

    >= LSDxxd jiij .

    11,3424282112112

    =>===

    LSDxxd . Berarti 1x > 2x .

    11,3523282113113

    =>===

    LSDxxd . Berarti 1x > 3x .

    11,3123242113223

    =

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    60

    Jawa Madura Bali 341 360 302 323 300 304 356 296 286 289 223 245 343 250 235 335 296 216 361 284 287 298 200 296 300 208 264 P

    rodu

    ksi s

    usu

    (lite

    r)

    309 231 259 Dengan taraf signifikansi = 5%, selidiki apakah ada perbedaan perbandingan produksi susu sapi di 3 lokasi tersebut? Jika ada perbedaan

    manakah yang paling berbeda!

    2. Dilakukan pengamatan terhadap hasil tes UAN siswa SMA. Para siswa itu

    dikelompokkan dalam 3 kategori (1) SMA Favorit, (2) SMA Negeri, dan (3)

    SMA Swasta. Diperoleh data pengamatan sebagai berikut:

    No SMA Nilai No SMA Nilai No SMA Nilai 1 favorit 4,25 8 negeri 4,00 15 swasta 4,00 2 favorit 5,00 9 negeri 3,00 16 swasta 3,50 3 favorit 4,75 10 negeri 3,50 17 swasta 3,75 4 favorit 3,75 11 negeri 3,75 18 swasta 3,00 5 favorit 4,50 12 negeri 3,50 19 swasta 3,25 6 favorit 4,25 13 negeri 3,25 20 swasta 3,50 7 favorit 4,00 14 negeri 4,25 21 swasta 2,75

    Selidiki apakah ketiga kelompok tersebut memiliki nilai rata-rata UAN yang

    sama dengan taraf signifikansi = 5%. 3. Dilakukan penelitian mengenai berat badan mahasiswa berdasarkan sarapan

    yang dimakan dari 4 kelompok sampel dan diperoleh data berat badan (dalam

    kg) sbb:

    Sampel ke-

    Mie instan

    Nasi Roti Singkong

    1 45 46 47 43 2 55 54 58 52 3 40 45 44 40 4 65 64 65 48 5 60 62 63 58 6 58 59 62 60 7 57 54 59 55

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    61

    Dengan taraf signifikansi = 5%, selidiki sarapan manakah yang membuat berat badan mahasiswa lebih tinggi dari yang lain!

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    62

    BAB IV

    ANALISIS REGRESI

    1. Pendahuluan Metode analisis yang telah dibahas sebelumnya adalah analisis terhadap data

    mengenai sebuah karakteristik atau atribut (data kualitatif) dan mengenai

    sebuah variabel, diskrit maupun kontinu (data kuantitatif). Namun, kenyataan

    yang terjadi, banyak persoalan yang meliputi lebih dari sebuah variabel.

    Misalkan, hasil belajar siswa tergantung pada waktu belajar, hasil produksi

    padi tergantung pada cuaca serta penggunaan pupuk, dan lain sebagainya.

    Oleh karena itu perlu untuk mempelajari analisis data yang terdiri atas banyak

    variabel.

    Jika dipunyai data yang terdiri atas dua atau lebih variabel, maka dapat

    dipelajari bagaimana variabel-variabel tersebut berhubungan. Hubungan yang

    diperoleh umumnya dinyatakan dalam bentuk persamaan matematik yang

    menyatakan hubungan fungsional antara variabel. Studi yang mmempelajari

    hubungan antar variabel ini dikenal dengan analisis regresi.

    Tujuan dari bab ini adalah bagaimana menghitung suatu perkiraan atau

    persamaan regresi yang akan menjelaskan hubungan antara dua variabel.

    Yang akan dibahas adalah regresi garis sederhana, dimana akan dibahas

    mengenai hubungan antara dua variabel yang biasanya cukup tepat dinyatakan

    dalam suatu garis lurus. Selanjutnya tujuan dari penggunaan persamaan

    regresi adalah memperkirakan nilai dari suatu variabel pada nilai tertentu dari

    variabel lain dengan kata lain persamaan regresi digunakan untuk peramalan.

    2. Hubungan Fungsional Antara Variabel Dalam analisis regresi, variabel akan dibedakan menjadi dua, yaitu variabel

    bebas (variabel prediktor) dan variabel takbebas (variabel respon). Variabel

    yang mudah diperoleh atau tersedia dapat digolongkan ke dalam variabel

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    63

    bebas sedangkan variabel yang terjadi karena variabel bebas, merupakan

    variabel takbebas. Dalam analisis regresi, variabel bebas akan dinyatakan

    dengan kXXX ,,, 21 K ( )1k sedangkan variabel takbebas dinyatakan dengan Y.

    Telah diketahui bahwa statistika bertujuan untuk menyimpulkan populasi

    dengan menggunakan hasil analisis data sampel. Untuk analisis regresi juga

    akan ditentukan hubungan fungsional yang diharapkan berlaku untuk populasi

    berdasarkan data sampel yang diambil dari populasi yang bersangkutan.

    Hubungan fungsional ini akan dituliskan dalam bentuk persamaan matematik

    yang disebut dengan persamaan regresi yang akan bergantung pada

    parameter-parameter.

    Secara umum model atau persamaan regresi untuk populasi dapat ditulis

    dalam bentuk

    (IV.1) ( )mkxxxy XXXk ,,,,,, 2121,,,. 21 KKK = Dengan m ,,, 21 K parameter-parameter yang ada dalam regresi.

    Model regresi sederhana untuk populasi dengan sebuah variabel bebas yang

    biasa dikenal dengan regresi linier sederhana adalah

    (IV.2) Xxy 21. += Dalam hal ini parameternya adalah 1 dan 2 . Berdasarkan sebuah sampel, akan ditentukan atau ditaksir persamaan regresi

    populasi pada rumus (IV.1). Hal ini dapat dilakukan dengan jalan menaksir

    parameter-parameter m ,,, 21 K . Untuk kasus regresi linier sederhana, perlu ditaksir parameter 1 dan 2 . Jika

    1 dan 2 ditaksir oleh a dan b , maka persamaan regresi berdasarkan sampel adalah

    (IV.3) bXaY +=

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    64

    Regresi dengan X merupakan variabel bebas dan Y variabel takbebasnya

    dinamakan regresi Y atas X.

    Model regresi populasi pangkat dua atau parabola untuk sebuah variabel bebas

    dengan parameter 1 , 2 dan 3 adalah (IV.4) 2321. 2 XXxxy ++= Dan berdasarkan sampel acak, parameter-parameter 1 , 2 dan 3 perlu ditaksir dengan persamaan berikut

    (IV.5) 2 cXbXaY ++= Dengan a , b dan c masing-masing diperoleh dari perhitungan berdasarkan

    data penelitian yang berturut-turut merupakan taksiran untuk 1 , 2 dan 3 .

    Berikut cara menentukan persamaan regresi, apabila dimiliki data

    pengamatan.

    3. Metode Tangan Bebas Metode ini merupakan metode kira-kira dengan menggunakan diagram pencar

    (scatter diagram) dengan data yang diperoleh berdasarkan hasil pengamatan.

    Jika variabel yang diamati meliputi variabel bebas X dan variabel takbebas Y,

    maka data pengamatan yang diperoleh digambarkan pada sebuah diagram

    dengan X dinyatakan pada sumbu mendatar dan Y pada sumbu tegak sehingga

    terbentuk diagram pencar yang menunjukkan titik-titik tertentu.

    Ada dua manfaat dari penggunaan diagram pencar ini yaitu: (1) Membantu

    menunjukkan apakah terdapat hubungan yang bermanfaat antara dua variabel,

    (2) Membantu menetapkan tipe persamaan yang menunjukkan hubungan

    antara kedua variabel tersebut. Seperti yang tertulis dalam manfaat yang

    kedua, dari letak titik-titik pada diagram pencar, dapat diperkirakan bentuk

    regresinya. Jika letak titik-titik yang terbentuk di sekitar garis lurus, maka

    dapat diduga terjadi regresi linier. Namun, hubungan yang terbentuk tidak

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    65

    selalu harus berupa garis lurus. Jika letak titik-titik yang terbentuk di sekitar

    garis lengkung, maka dapat diduga terjadi regresi nonlinier.

    Hubungan yang tergambar pada diagram pencar dapat berupa hubungan

    positif (atau langsung) antar dua variabel yaitu jika variabel bebas meningkat

    maka variabel takbebas juga meningkat. Namun, adapula kemungkinan pada

    variabel tertentu terdapat hubungan yang negatif (atau berlawanan) yaitu jika

    variabel bebas meningkat maka variabel takbebas akan menurun. Atau bahkan

    tidak ada hubungan sama sekali antara variabel (titik-titik yang terbentuk pada

    diagram pencar tidak menunjukkan pola tertentu).

    4. Metode Kuadrat Terkecil Untuk Regresi Linier Metode ini berdasarkan pada kenyataan bahwa jumlah pangkat dua (kuadrat)

    dari jarak antara titik-titik dengan garis regresi yang sedang dicari harus

    sekecil mungkin.

    Untuk pengamatan yang terdiri dari sebuah variabel bebas X dan variabel

    takbebas Y di mana model regresi linier untuk populasi seperti rumus (IV.2)

    telah dapat diduga, maka perlu ditaksir parameter-parameter regresi sehingga

    diperoleh persamaan seperti rumus (IV.3). Jadi untuk populasi, model regresi

    linier adalah

    Xxy 21. += Harga parameter 1 dan 2 ditaksir oleh a dan b , sehingga persamaan regresi menggunakan data sampel adalah

    bXaY +=

    Koefisien-koefisien regresi a dan b untuk regresi linier dapat dihitung

    dengan rumus

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    66

    (IV.6)

    ( )( ) ( )( )( )

    ( )( )( )22

    22

    2

    =

    =

    ii

    iiii

    ii

    iiiii

    XXn

    YXYXnb

    XXn

    YXXXYa

    Jika terlebih dahulu dihitung koefisien b , maka koefisien a dapat pula

    ditentukan dengan rumus

    (IV.7) XbYa = dengan X dan Y masing-masing adalah rata-rata untuk variabel X dan Y.

    Dalam regresi linier, koefisien b berarti perubahan rata-rata Y untuk setiap

    perubahan satu unit variabel X. Perubahan nilai Y bertambah apabila nilai b

    bertanda positif dan berkurang untuk tanda b negatif.

    Contoh (Supranto)

    Berikut data penjualan dari perusahaan makanan ringan

    X : persentase kenaikan biaya iklan

    Y : persentase kenaikan hasil penjualan

    X 1 2 4 5 7 9 10 12

    Y 2 4 5 7 8 10 12 14

    Berapakah besarnya ramalan presentase kenaikan penjualan apabila biaya

    iklan dinaikkan menjadi 15 %.

    Penyelesaian

    X Y 2X XY

    1 2 1 2

    2 4 4 8

    4 5 16 20

    5 7 25 35

    7 8 49 56

    9 10 81 90

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    67

    10 12 100 120

    12 14 144 168

    = 50iX 25,6=X

    = 62iY 75,7=Y

    = 4202iX = 499iiYX

    Untuk menghitung ramalan presentase kenaikan penjualan, terlebih dahulu

    dicari persamaan regresi dari data tersebut.

    ( )( )( )

    ( ) ( )( )( ) ( ) 04,1860

    892504208

    62504998222

    ===

    = ii

    iiii

    XXn

    YXYXnb

    ( ) 25,125,604,175,7 === XbYa Sehingga diperoleh persamaan XbXaY 04,125,1 +=+= Nilai koefisien 04,1=b artinya setiap ada kenaikan 1% biaya iklan, maka hasil penjualan akan naik sebesar 1,04 %.

    Persamaan XbXaY 04,125,1 +=+= selanjutnya dapat digunakan untuk meramalkan presentase kenaikan penjualan apabila terjadi perubahan

    (kenaikan atau pengurangan) biaya iklan.

    Jika biaya iklan dinaikkan menjadi 15 %, maka ramalan presentase kenaikan

    penjualan adalah

    XY 04,125,1 += dengan X = 15 % diperoleh ( ) 85,161504,125,1 =+=Y . Jadi besarnya ramalan presentase kenaikan penjualan apabila biaya iklan

    dinaikkan menjadi 15 % adalah 16,85.

    5. Berbagai Varians Sehubungan dengan Regresi Linier Sederhana Untuk analisis selanjutnya tentang regresi linier sederhana, terdapat beberapa

    asumsi yang harus diambil.

    Asumsi pertama, mengenai kekeliruan prediksi atau galat prediksi atau

    perbedaan YYe = yang terjadi, mengingat hasil pengamatan variabel takbebas Y belum tentu sama nilainya dengan harga yang diharapkan yaitu Y

    yang diperoleh dari regresi hasil pengamatan (sampel). Dalam populasi, galat

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    68

    prediksi dimisalkan berbentuk variabel acak yang mengikuti distribusi normal

    dengan rata-rata nol dan varians 2 . Asumsi kedua, untuk setiap harga X yang diberikan, variabel takbebas Y

    independen dan berdistribusi normal dengan rata-rata ( )X21 + dan varians 2

    .XY . Varians 2.XY dimisalkan sama untuk setiap X maka dapat dinyatakn oleh varians kekeliruan taksiran ( )2 dan kekeliruan baku taksiran xy. .

    5.1. Kesalahan Baku Regresi dan Koefisien Regresi Sederhana Kesalahan baku atau selisih taksir standar merupakan indeks yang

    digunakan untuk mengukur tingkat ketepatan regresi dan koefisien regresi

    atau mengukur variasi titik-titik observasi di sekitar garis regresi. Dengan

    kesalahan baku, batasan seberapa jauh melesetnya perkiraan dalam

    meramalkan data dapat diketahui (Hasan, 2010). Apabila semua titik

    observasi berada tepat pada garis regresi maka kesalahan baku akan bernilai

    sama dengan nol. Hal ini menunjukkan bahwa perkiraan yang dilakukan

    pada data pengamatan sesuai dengan data yang sebenarnya.

    Berikut rumus yang digunakan untuk menghitung kesalahan baku regresi

    dan koefisien regresi.

    a. Kesalahan baku untuk regresi

    2

    .2

    =

    nXYbYaY

    Se

    b. Kesalahan baku untuk koefisien regresi a (parameter a )

    ( )222

    =

    XXn

    SXS ea

    c. Kesalahan baku untuk koefisien regresi b (parameter b )

    ( )nX

    X

    SS eb 22

    =

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    69

    Coba Anda hitung kesalahan baku regresi, koefisien regresi a dan

    koefisien regresi b dengan data dari contoh soal sebelumnya!

    5.2. Pendugaan Interval Koefisien Regresi

    6. Regresi Non Linier Seringkali regresi linier tidak dapat digunakan pada beberapa data karena

    hipotesis kelinieran telah ditolak. Hal ini juga dapat dilihat dari bentuk

    diagram pencar yang tidak menunjukkan bentuk garis lurus, sehingga model

    regresi linier akan menyimpang dari letak titik-titik dalam diagram pencar.

    Hal ini perlu diperbaiki dengan menggunakan regresi nonlinier.

    Beberapa model regresi nonlinier yang mudah dan sering digunakan, antara

    lain:

    6.1. Model Parabola kuadratik

    Persamaan umum model ini ditaksir oleh

    (IV.8) 2 cXbXaY ++= Dengan koefisien-koefisien cba ,, harus ditentukan berdasarkan data

    hasil pengamatan. Dengan menggunakan metode kuadrat terkecil, maka

    cba ,, dapat dihitung dengan sistem persamaan:

    ++= 2iii XcXbnaY ++= 32 iiiii XcXbXaYX ++= 4322 iiiii XcXbXaYX

    6.2. Model Parabola Kubik

    Persamaan umum model ini ditaksir oleh

    (IV.9) 32 dXcXbXaY +++=

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    70

    Dengan koefisien-koefisien dcba ,,, dihitung dari data pengamatan.

    Sistem persamaan yang harus diselesaikan untuk menentukan dcba ,,,

    adalah:

    +++= 32 iiii XdXcXbnaY +++= 432 iiiiii XdXcXbXaYX +++= 54322 iiiiii XdXcXbXaYX +++= 65433 iiiiii XdXcXbXaYX

    Semakin tinggi pangkat X dalam persamaan regresi, maka semakin

    banyak pula sistem persamaan yang harus diselesaikan.

    6.3. Model Eksponen

    Persamaan umum model ini ditaksir oleh

    (IV.10) XbaY = Bentuk ini dapat dikembalikan kepada model linier apabila diambil

    logaritmanya. Dalam logaritma persamaannya akan menjadi

    (IV.11) ( )XbaY logloglog += Apabila diambil YY log = , aa log= , dan bb log= , maka diperoleh model XbaY += yang adalah model linier seperti pada rumus (IV.3). dengan rumus (IV.6), maka a dan b dapat dihitung, selanjutnya karena

    aa log= dan bb log= , maka a dan b juga dapat dihitung. Dalam logaritma, maka a dan b dapat dicari dari rumus

    (IV.12) ( )

    =

    nX

    bn

    Ya ii log

    loglog

    ( ) ( )( )( )

    = 22

    logloglog

    ii

    iiii

    XXn

    YXYXnb

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    71

    Model eksponensial dalam rumus XbaY = sering pula disebut model pertumbuhan karena sering digunakan dalam menganalisis data hasil

    pengamatan yang berhubungan dengan fenomena yang sifatnya tumbuh.

    Dalam hal ini, model persamaannya menjadi

    (IV.13) bXeaY = dengan e adalah bilangan pokok logaritma asli.

    6.4. Model Geometrik

    Persamaan umum model ini ditaksir oleh

    (IV.14) bXaY = Bentuk ini dapat dikembalikan kepada model linier dan apabila diambil

    logaritmanya, maka

    (IV.15) XbaY logloglog += Bentuk ini merupakan model linier dalam Xlog dan Ylog . Koefisien a

    dan b dapat dihitung dari:

    (IV.16)

    =

    nX

    bn

    Ya ii

    logloglog

    ( ) ( )( )( )

    = 22 log)log(loglogloglog

    ii

    iiii

    XXn

    YXYXnb

    6.5. Model Logistik

    Model paling sederhana model logistik dapat ditaksir oleh

    (IV.17) XabY 1 =

    Untuk Y yang tidak sama dengan nol, maka bentuk di atas dapat pula

    ditulis sebagai XabY

    =1 .

    Jika diambil logaritmanya, diperoleh

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    72

    (IV.18) ( )XbaY

    loglog1log +=

    Yang merupakan model linier dalam variabel-variabel X dan

    Y1log .

    Koefisien-koefisien a dan b dapat dicari dengan menggunakan rumus

    (IV.19) ( )

    =

    nX

    bn

    Ya ii log

    loglog

    ( ) ( )( )( )

    = 22

    logloglog

    ii

    iiii

    XXn

    YXYXnb

    Dengan Ylog diganti oleh

    Y1log .

    6.6. Model Hiperbola

    Persamaan umum yang sederhana untuk model hiperbola dapat dituliskan

    dalam bentuk

    (IV.20) bXa

    Y +=1

    Atau jika tidak ada Y berharga nol dapat ditulis menjadi

    (IV.21) bXaY

    +=1

    Yang merupakan bentuk linier dalam variabel-variabel X dan Y1 .

    Koefisien-koefisien a dan b dapat dihitung dengan rumus

    (IV.22) ( )( ) ( )( )

    ( )

    = 22

    2

    )( ii

    iiiii

    XXn

    YXXXYa

    ( ) ( )( )( )

    = 22 )( iiiiii

    XXn

    YXYXnb

    Apabila variabel Y diganti oleh Y1 .

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    73

    7. Regresi Linier Ganda Sebelumnya telah dibahas hubungan linear dari dua variabel X dan Y dengan

    menggunakan persamaan regresi linier bXaY += . Dalam kenyataan, banyak data pengamatan yang terjadi dengan melibatkan

    lebih dari dua variabel. Misalnya hasil panen padi (Y) dipengaruhi oleh

    penggunaan pupuk ( 1X ), luas sawah ( 2X ) dan curah hujan ( 3X ). Secara

    umum, data hasil pengamatan Y dapat terjadi atau dipengaruhi oleh variabel-

    variabel bebas kXXX ,,, 21 K .

    Akan ditentukan hubungan antara Y dan kXXX ,,, 21 K sehingga diperoleh

    regresi antara Y dan kXXX ,,, 21 K . Yang akan ditinjau hanyalah garis regresi

    sederhana yang dikenal dengan nama regresi linier berganda. Model regresi

    linier ganda atas kXXX ,,, 21 K akan ditaksir oleh

    (IV.23) kk XbXbXbaY ++++= K2211 dengan kbbba ,,,, 21 K merupakan koefisien-koefisien yang harus ditentukan

    berdasarkan data pengamatan. Perhatikan bahwa regresi linier bXaY += merupakan hal istimewa dari rumus (IV.23) untuk 021 ===== kbbba K .

    Koefisien-koefisien kbbba ,,,, 21 K ditentukan dengan menggunakan metode

    kuadrat terkecil (Least Square Method) yang menghasilkan persamaan normal

    sebagai berikut

    (IV.24) =++++ YXbXbXban kkK2211 =++++ YXXXbXXbXbXa kk 112122111 K =++++ YXXXbXbXXbXa kk 222221212 K

    M

    =++++ YXXbXXbXXbXa kkkkkk 22211 K Bila persamaan tersebut diselesaikan, maka akan diperoleh nilai

    kbbba ,,,, 21 K . Kemudian dapat dibentuk persamaan regresi berganda.

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    74

    Apabila persamaan regresi telah diperoleh, maka dapat diramalkan nilai Y

    dengan syarat bila nilai kXXX ,,, 21 K sebagai variabel bebas sudah

    diketahui.

    Sama halnya dengan regresi linier, dalam regresi linier ganda perubahan rata-

    rata Y memperhatikan nilai dan tanda koefisien dari masing-masing variabel

    X. Pada rumus (IV.23) maka koefisien 1b menyatakan perubahan rata-rata Y

    untuk setiap perubahan satu unit variabel 1X apabila kXXX ,,, 32 K

    semuanya dianggap tetap. Koefisien 2b menyatakan perubahan rata-rata Y

    untuk setiap perubahan satu unit variabel 2X apabila kXXX ,,, 31 K

    semuanya dianggap tetap, demikian seterusnya. Jelas bahwa setiap koefisien

    hanya memberikan gambaran parsial apa yang terjadi pada Y untuk perubahan

    X yang berhubungan dengan koefisien yang bersesuaian. Oleh karena itu

    koefisien-koefisien kbbba ,,,, 21 K disebut pula koefisien regresi parsial.

    Contoh (Supranto)

    Perhatikan file PDF

    LATIHAN 1. Dengan menggunakan persamaan garis regresi bXaY += , hitunglah ramalan

    nilai Y jika X = 16 dari kedua data berikut a.

    X 2 4 3 8 9 10 15 13

    Y 1 2 5 7 8 11 13 14

    b. X 1 3 4 7 9 11 13

    Y 12 11 9 8 6 5 4

    2. Berikut data nilai hasil ujian mahasiswa matematika Unnes

    X : nilai hasil ujian Kalkulus mahasiswa matematika Unnes

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    75

    Y : nilai hasil ujian Statistika mahasiswa matematika Unnes

    X 7 6 8 9 10 5 4 9 7 3

    Y 6 8 9 7 9 6 5 8 8 4

    a. Dengan menggunakan persamaan regresi, berapakah nilai ujian Statistika

    jika nilai ujian Kalkulus yang diperoleh sebesar 8,5.

    b. Tuliskan persamaan regresi linier sederhana, berapakah besarnya nilai

    koefisien regresi? Jelaskan arti dari nilai-nilai tersebut!

    c. Tentukan kesalahan baku regesi, koefisien regresi a dan koefisien regresi

    b .

    d. Dalam soal ini bolehkan variabel Y memiliki nilai negatif? Berikan alasan

    Anda!

    3. Dipunyai kumpulan data berikut

    X ni XXXX ,,,,, 21 KK

    Y ni YYYY ,,,,, 21 KK

    Jika ( )( )

    ( )

    = 2XX

    YYXXb

    i

    ii dan XbYa =

    dengan = iXnX 1 dan = iYnY 1 Tunjukkan bahwa:

    a. ( )( )( )22

    =ii

    iiii

    XXn

    YXYXnb

    b. ( )=

    =n

    ii XbaY

    1

    0

    4. Sebuah perusahaan mencatat hasil penjualan dari tahun ketahun sebagai

    berikut. Tahun 1980 1981 1982 1983 1984 1985 1986

    Hasil Penjualan

    (jutaan Rp)

    83 60 54 21 22 13 13

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    76

    Terlihat adanya kemunduran dalam hasil penjualan tersebut. Dengan menggunakan trend parabola 2 cXbXaY ++= , hitung berapa ramalan hasil penjualan untuk tahun 1987 dan 1988? Gambarkan grafik Y dan Y dalam satu gambar!

    5. Perhatikan data berikut

    X : harga barang perunit dalam ribuan rupiah

    Y : hasil penjualan barang X dalam jutaan rupiah

    X 20 35 60 100 150 300 500 800

    Y 150 125 105 100 92 77 62 58

    Dengan menggunakan trend eksponensial XbaY = , berapakah ramalan hasil penjualan jika X = 900!

    6. Perkembangan jumlah pabrik pada suatu daerah selama 6 tahun adalah sebagai berikut.

    Tahun 1981 1982 1983 1984 1985 1986

    Banyaknya pabrik 4 8 12 18 18 20

    Dengan menggunakan trend logistik XabY 1 = , hitung ramalan banyaknya

    pabrik yang dibangun pada tahun 1987?

    7. PT ANGIN MOBAT MABIT menerapkan stategi promosi untuk meningkatkan pendapatan penjualan mesin jahit. Akan dilihat pengaruh iklan melalui televisi dan koran terhadap pendapatan. Berikut data mingguan yang tercatat:

    Iklan TV (juta rupiah)

    Iklan Koran (juta rupiah)

    Pendapatan (juta rupiah)

    1 2 4 6 7 9

    2 4 5 7 8

    10

    1 3 6 8 9

    11

    Dengan menggunakan persamaan regresi linier berganda, berapakah ramalanpendapatan penjualan mesin jahit jika promosi dengan Iklan TV sebesar 10 juta rupiah dan promosi dengan Iklan koran sebesar 12 juta rupiah!

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    77

    BAB V

    ANALISIS KORELASI

    1. Pendahuluan Jika data hasil pengamatan terdiri dari banyak variabel, maka hal yang perlu

    diketahui berikutnya adalah seberapa kuat hubungan antara variabel-variabel

    tersebut terjadi. Dengan kata lain, perlu ditentukan derajat hubungan antara

    variabel-variabel. Studi yang membahas tentang derajat hubungan antara

    variabel dikenal dengan nama analisis korelasi. Sedangkan ukuran yang

    digunakan untuk mengetahui derajat hubungan, terutama untuk data

    kuantitatif, dinamakan koefisien korelasi.

    Adanya hubungan (korelasi) antara variabel yang satu dengan variabel lainnya

    dapat dinyatakan dengan perubahan nilai variabel. Dalam bab ini hanya akan

    dibahas mengenai hubungan linier antara dua variabel X dan Y .

    Apabila dua variabel X dan Y mempunyai hubungan, maka nilai variabel X

    yang sudah diketahui dapat digunakan untuk memperkirakan/menaksir atau

    meramalkan Y. Ramalan pada dasarnya merupakan perkiraan/taksiran

    mengenai terjadinya suatu kejadian (nilai suatu variabel) untuk waktu

    mendatang, misalnya ramalan harga beras bulan depan, ramalan jumlah

    penduduk 10 tahun mendatang, dan lain sebagainya.

    Serupa dengan analisis regresi, variabel Y yang nilainya akan diramalkan

    disebut variabel takbebas, sedangkan variabel X yang nilainya digunakan

    untuk meramalkan nilai Y disebut variabel bebas atau variabel peramal

    (predictor) atau sering disebut variabel yang menerangkan (explanatory).

    2. Koefisien Korelasi

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    78

    Hubungan dua variabel dapat merupakan hubungan positif maupun negatif.

    Hubungan X dan Y dikatakan positif apabila kenaikan (penurunan) X pada

    umumnya diikuti oleh kenaikan (penurunan) Y. Sebaliknya dikatakan negatif

    jika kenaikan (penurunan) X pada umumnya diikuti oleh penurunan

    (kenaikan) Y.

    Jika antara variabel X dan Y ada hubungan, bentuk diagram pencarnya akan

    mulus/teratur. Apabila terdapat hubungan positif, maka diagram pencar akan

    bergerak dari kiri bawah ke kanan atas, sedangkan apabila terdapat hubungan

    negatif, maka diagram pencar akan bergerak dari kiri atas ke kanan bawah.

    Bila bentuk diagram pencar tidak teratur, artinya kenaikan/penurunan X pada

    umumnya tidak diikuti oleh naik turunnya Y, dikatakan X dan Y tidak

    berkorelasi. Atau dengan kata lain, X dan Y dikatakan saling bebas

    (independent) jika naik dan turunnya varianel X tidak mempengaruhi Y atau

    antara X dan Y tidak ada hubungan atau hubungnnya sangat lemah sehingga

    dapat diabaikan.

    Apabila hubungan X dan Y dapat dinyatakan dengan fungsi linier, maka kuat

    hubungan antara X dan Y diukur dengan suatu nilai yang disebut Koefisien

    Korelasi. Nilai koefisien korelasi.ini paling sedikit -1 dan paling besar 1. Jika

    r adalah koefisien korelasi,maka nilai r dapat dinyatakan sebagai

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    79

    11 r Jika

    1=r , hubungan X dan Y sempurna dan positif (mendekati 1, hubungan sangat kuat dan positif)

    1=r , hubungan X dan Y sempurna dan negatif (mendekati -1, hubungan sangat kuat dan negatif)

    0=r , hubungan X dan Y lemah sekali atau tidak ada hubungan.

    X dikatakan mempengaruhi Y, jika perubahan nilai X menyebabkan adanya

    perubahan nilai Y, artinya naik turunnya nilai X akan mengakibatkan naik

    turunnya nilai Y, sehingga nilai Y akan bervariasi. Namun, naik turunnya nilai

    Y tidak hanya disebabkan oleh variabel X, karena masih ada faktor lain yang

    menyebabkannya. Misalnya naik turunnya hasil panen padi (Y) dipengaruhi

    oleh penggunaan pupuk ( 1X ), namun juga dapat dipengaruhi faktor-faktor

    lain misalnya luas sawah, curah hujan dan lain-lain. Selanjutnya dapat

    dihitung besar kontribusi dari X terhadap naik turunnya nilai Y dengan suatu

    koefisien yang disebut koefisien penentuan/koefisien determinasi (coefficient

    of determination).

    Jika koefisien determinasi ditulis KD, maka untuk menghitung KD sebagai

    berikut

    2rKD = Besar koefisien determinasi menunjukkan besarnya sumbangan variabel bebas

    terhadap variabel takbebas. Total nilai koefisien determinasi sebesar 100 %,

    jika koefisien determinasi bernilai kurang dari 100 % maka sisanya

    dipengaruhi oleh faktor lain.

    Cara menghitung r adalah sebagai berikut

    Rumus 1

    ==

    ==n

    ii

    n

    ii

    n

    iii

    yx

    yxr

    1

    2

    1

    2

    1

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    80

    XXx ii = =

    =n

    iiXn

    X1

    1

    YYy ii = =

    =n

    iiYn

    Y1

    1

    atau

    Rumus 2

    = == =

    ===

    =

    n

    i

    n

    iii

    n

    i

    n

    iii

    n

    ii

    n

    ii

    n

    iii

    YYnXXn

    YXYXnr

    1

    2

    1

    2

    1

    2

    1

    2

    111

    Contoh (Supranto)

    Berikut data penjualan dari perusahaan makanan ringan

    X : persentase kenaikan biaya iklan

    Y : persentase kenaikan hasil penjualan

    X 1 2 4 5 7 9 10 12

    Y 2 4 5 7 8 10 12 14

    Hitunglah r!

    Penyelesaian

    Untuk menghitung r, dibuat tabel berikut

    Dengan rumus 1 X Y

    ( )xXX

    ( )yYY

    2x 2y xy

    1 2 - 5,25 - 5,75 27,5625 33,0625 30,1875

    2 4 - 4,25 - 3,75 18,0625 14,0625 15,9375

    4 5 - 2,25 - 2,75 5,0625 7,5625 6,1875

    5 7 - 1,25 - 0,75 1,5625 0,5625 0,9375

    7 8 0,75 0,25 0,5625 0,0625 0,1875

    9 10 2,75 2,25 7,5625 5,0625 6,1875

    10 12 3,75 4,25 14,0625 18,0625 15,9375

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    81

    12 14 5,75 6,25 33,0625 39,0625 35,9375

    = 50iX 25,6=X

    = 62iY 75,7=Y

    = 0ix

    = 0iy

    = 5,1072ix

    = 5,1172iy

    = 5,111ii yx

    99,0389,1125,111

    5,1175,1075,111

    1

    2

    1

    2

    1 ====

    ==

    =n

    ii

    n

    ii

    n

    iii

    yx

    yxr

    Hubungan antara X dan Y sebesar 0,99 yang menunjukkan hubungan yang

    sangat kuat dan positif, artinya kenaikan biaya iklan pada umumnya

    menaikkan hasil penjualan.

    Koefisien determinasi %989801,02 === rKD artinya sumbangan iklan terhadap variasi Y (naik turunnya hasil penjualan) adalah 98 %, dan 2 %

    sisanya disebabkan oleh faktor-faktor lainnya.

    Dengan rumus 2

    X Y 2X 2Y XY

    1 2 1 4 2

    2 4 4 16 8

    4 5 16 25 20

    5 7 25 49 35

    7 8 49 64 56

    9 10 81 100 90

    10 12 100 144 120

    12 14 144 196 168

    = 50iX = 62iY = 4202iX = 5982iY = 499iiYX

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    82

    = == =

    ===

    =

    8

    1

    28

    1

    28

    1

    28

    1

    2

    8

    1

    8

    1

    8

    1

    88

    8

    i iii

    i iii

    ii

    ii

    iii

    YYXX

    YXYXr

    ( ) ( )( )( ) ( ) ( ) ( )22 625988504208

    62504998

    =r

    99,0075,899

    892940860

    892 ===

    3. Korelasi Rank (Peringkat) Misalkan ada dua orang Adi dan Bayu yang sama-sama minuman ringan

    dalam kemasan. Kedua orang tersebut diminta untuk memberikan penilaian

    terhadap 10 merk minuman ringan dalam kemasan. Minuman ringan yang

    paling digemari diberi nilai 1 dan seterusnya sampai minuman ringan yang

    tidak disenangi diberi nilai 10. Sehingga dalam hal ini Adi dan Bayu

    memberikan rank (peringkat) terhadap merk minuman ringan tersebut.

    Pemberian peringkat ini dapat juga dibalik, minuman ringan yang paling

    digemari diberi nilai 10 dan seterusnya sampai yang tidak disenangi diberi

    nilai 1. Diperoleh hasil pemberian rank sebagai berikut

    No Merk Minuman Ringan Rank dari Adi Rank dari Bayu 1 Coca Cola 9 8 2 Fanta 5 3 3 Sprite 10 9 4 Frestea 1 2 5 Mizone 8 7 6 Pulpy Orange 7 10 7 Teh Sosro 3 4 8 Pepsi Blue 4 6 9 Fruittea 2 1

    10 Tebs 6 5

    Untuk menghitung koefisien korelasi antara rank dari Adi dan Bayu terhadap

    10 merk minuman ringan dalam kemasan tersebut digunakan Koefisien

    Korelasi Rank (Rank Spearman).

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    83

    ( )161 22

    =nn

    dr irank

    dimana

    id = selisih dari pasangan rank ke-i

    n = banyaknya pasangan rank (dalam hal ini n = 10)

    Contoh

    Carilah koefisien korelasi rank antara rank Adi dan Bayu dalam menilai 10

    merk minuman ringan.

    Penyelesaian

    Rank Adi 8 3 9 2 7 10 4 6 1 5

    Rank Bayu 9 5 10 1 8 7 3 4 2 6

    Selisih Rank (d) -1 -2 -1 1 -1 3 1 2 -1 -1 2d 1 4 1 1 1 9 1 4 1 1

    Sehingga

    ( ) ( )( ) 85,08545,01455,01110010 114161161 22

    ===++++==

    Knn

    dr irank

    Jadi, koefisien korelasi rank antara rank Adi dan Bayu dalam menilai 10 merk

    minuman ringan sebesar 0,85.

    Contoh (Supranto, 1992: 159)

    Ada 10 calon sales yang diuji mengenai teknik penjualan. Setelah mereka

    selesai diuji kemudian ditugaskan untuk melakukan penjualan. Diperoleh data

    hasil ujian (X) dan hasil penjualan tahun pertama (Y). Nilai X dan Y dari 10

    sales termasuk rank-nya adalah sebagai berikut.

    Sales Nilai Ujian (X)

    Rank Hasil Penjualan

    (Y)

    Rank Selisih Rank (d)

    2d

    A 48 3 312 2 1 1 B 32 6 164 8 -2 4 C 40 5 280 4 1 1 D 34 7 196 7 0 0

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    84

    E 30 8 200 6 2 4 F 50 1,5 288 3 -1,5 2,25 G 26 9 146 10 -1 1 H 50 1,5 361 1 0,5 0,25 I 22 10 149 9 1 1 J 43 4 252 5 -1 1

    Karena F dan H memiliki nilai yang sama maka rank mereka harus sama yaitu

    5,12

    21 =+ . Mula-mula F diberi nilai 1 dan H diberi nilai 2 (atau sebaliknya, kemudian dirata-rata). Apabila terdapat 3 objek yang memiliki nilai yang

    sama, maka diurutkan dan dicari rata-ratanya.

    Sehingga

    ( ) ( )( ) 9061,00939,01110010 114161161 22

    ==++++==

    Knn

    dr irank

    Jadi, koefisien korelasi rank antara rank nilai ujian dan hasil penjualan sebesar

    0,9061.

    LATIHAN

    1. Berikan contoh pasangan variabel yang memiliki hubungan positif dan

    negatif.

    2. Tentukan apakah hubungan variabel X dan Y berikut positif atau negatif.

    Hitung nilai koefisien korelasi dan koefisien determinasi kemudian

    interpretasikan hasilnya.

    a. X 2 4 3 8 9 10 15 13

    Y 1 2 5 7 8 11 13 14

    b. X 1 3 4 7 9 11 13

    Y 12 11 9 8 6 5 4

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    85

    3. Berikut data nilai hasil ujian mahasiswa matematika Unnes

    X : nilai hasil ujian Kalkulus mahasiswa matematika Unnes

    Y : nilai hasil ujian Statistika mahasiswa matematika Unnes

    X 7 6 8 9 10 5 4 9 7 3

    Y 6 8 9 7 9 6 5 8 8 4

    Hitung nilai koefisien korelasi dan koefisien determinasi kemudian

    interpretasikan hasilnya.

    4. Amat dan Budi diminta untuk memberikan rank berdasarkan suka dan

    tidaknya terhadap merk rokok tertentu. Rokok yang paling disenangi diberi

    nilai 10 dan yang paling tidak disenangi diberi nilai 1. Diperoleh hasil rank

    sebagai berikut.

    No Merk Rokok Rank dari Amat Rank dari Budi 1 AAA 2 9 2 BBB 10 4 3 CCC 8 3 4 DDD 3 6 5 EEE 4 5 6 FFF 1 7 7 GGG 5 8 8 HHH 2 6

    Hitung koefisien korelasi rank berdasarkan data tersebut!

    5. Tabel berikut menunjukkan nilai 10 mahasiswa yang telah berbentuk rank,

    yang diperoleh dari hasil ujian kuliah Statistika dan Praktikum. Carilah

    korelasi ranknya.

    Praktikum 8 3 9 2 7 10 4 6 1 5

    Statistika 9 5 10 1 8 7 3 4 2 6

  • Bahan ajar Statistika Inferensial

    Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

    86

    DAFTAR PUSTAKA

    Hasan, I. 2001. Pokok-Pokok Materi Statistik 2 (Statistik Inferensif). Edisi Kedua.

    Bumi Aksara. Jakarta.

    Sudjana. 1996. Metoda Statistika Edisi ke 6. Penerbit Tarsito. Bandung.

    Sugiyono. 2005. Statistik Untuk Penelitian. Penerbit Alfabeta. Bandung.

    Supranto, J. 1992. Statistik Teori dan Aplikasi. Jilid 1. Erlangga. Jakarta.

    Walpole, R & Myers, R. 1986. Ilmu Peluang dan Statistika Untuk Insinyur dan

    Ilmuan. Terjemahan. Penerbit ITB. Bandung.