Upload
sonya-eki-santoso
View
83
Download
2
Embed Size (px)
Citation preview
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
0
BAHAN AJAR
STATISTIKA INFERENSIAL
KODE MATA KULIAH MAT 201
ROMBEL 410140-03 410140-04 410140-05 410140-06 410140-07
Semester Gasal 2011/2012
Disusun Oleh Putriaji Hendikawati, S.Si., M.Pd., M.Sc.
Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Negeri Semarang 2011
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
1
DAFTAR ISI
BAB I PENAKSIRAN PARAMETER
1. Pengertian Penaksiran
2. Menaksir Rata-rata 3. Menaksir Proporsi 4. Menaksir Simpangan Baku 5. Menaksir Selisih Rata-Rata
6. Menaksir Selisih Proporsi
BAB II PENGUJIAN HIPOTESIS
1. Pendahuluan
2. Dua Macam Kekeliruan
3. Langkah Pengujian Hipotesis
4. Uji Hipotesis Rata-Rata
5. Uji Hipotesis Proporsi
6. Uji Hipotesis Varians
7. Uji Hipotesis Kesamaan Dua Rata-Rata
8. Uji Hipotesis Kesamaan Dua Proporsi
9. Uji Hipotesis Kesamaan Dua Varians
10. Uji Homogenitas Varians Populasi
BAB III ANALISIS VARIANS
BAB IV ANALISIS REGRESI
BAB V ANALISIS KORELASI
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
2
BAB I
PENAKSIRAN PARAMETER
1. Pengertian Penaksiran Statistika digunakan untuk menyimpulkan populasi.
Kelakuan populasi dipelajari berdasarkan data yang diambil baik secara
sampling maupun sensus. Namun, karena berbagai faktor untuk
menyimpulkan populasi diambil sebuah sampel yang representatif kemudian
berdasarkan hasil analisis terhadap data sampel, kesimpulan mengenai
populasi dibuat.
Kelakuan populasi yang akan diamati adalah mengenai parameter populasi
dan sampel yang digunakan adalah sampel acak. Data sampel dianalisis, nilai-
nilai yang perlu yaitu statistik dihitung dan berdasarkan nilai-nilai statistik
dapat disimpulkan bagaimana parameter bertingkah laku.
Cara pengambilan kesimpulan tentang parameter sehubungan dengan cara-
cara menaksir harga parameter. Harga parameter yang sebenarnya tetapi tidak
diketahui nilainya tersebut akan ditaksir berdasarkan statistik sampel yang
diambil dari populasi yang bersangkutan.
Parameter populasi yang akan ditaksir pada bab ini adalah rata-rata,
simpangan baku dan proporsi.
Secara umum parameter populasi akan diberi simbol (baca: theta). Jadi bisa merupakan rata-rata , simpangan baku , proporsi dan sebagainya. Jika tidak diketahui harganya, ditaksir oleh harga (baca: theta topi), maka dinamakan penaksir.
Sangat diharapkan = , yaitu penaksir dapat mengatakan harga parameter yang sebenarnya. Namun, keinginan ini dapat dikatakan terlalu ideal.
Kenyataan yang sering terjadi adalah:
a. menaksir oleh terlalu tinggi, atau
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
3
b. menaksir oleh terlalu rendah.
Kriteria untuk memperoleh penaksir yang baik yaitu: takbias, memiliki varians
minimum dan konsisten.
a. penaksir dikatakan penaksir takbias jika rata-rata semua harga yang mungkin akan sama dengan , ditulis ( ) =E . Penaksir yang tidak takbias disebut penaksir bias.
b. penaksir bervarians minimum ialah penaksir dengan varians terkecil
diantara semua penaksir untuk parameter yang sama. Jika 1 dan 2 dua penaksir untuk , jika varians 1 < varians 2 , maka 1 merupakan penaksir bervarians minimum.
c. Misalkan penaksir untuk yang dihitung berdasarkan sebuah sampel acak berukuran n. Jika ukuran sampel n makin besar mendekati ukuran
populasi menyebabkan mendekati , maka disebut penaksir konsisten.
d. Penaksir yang takbias dan bervariansi minimum dinamakan penaksir
terbaik.
Jika harga parameter ditaksir oleh tertentu, maka dinamakan penaksir atau tepatnya titik taksiran (estimasi titik).
Misalkan akan ditaksir rata-rata tinggi mahasiswa jurusan matematika Unnes.
Maka diambil sebuah sampel acak, kemudian data sampel dikumpulkan lalu
dihitung rata-ratanya. Misalkan diperoleh x = 160 cm. Jika 160 cm ini
digunakan untuk menaksir rata-rata tinggi mahasiswa jurusan matematika
Unnes, maka 160 adalah titik taksiran untuk rata-rata tinggi mahasiswa
matematika Unnes.
Secara umum x adalah penaksir atau titik taksiran untuk .
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
4
Titik taksiran untuk suatu parameter , harganya akan berlainan tergantung pada harga x yang diperoleh dari sampel yang diambil, sehingga hasilnya
kurang meyakinkan atau kurang dapat dipercaya. Untuk itu digunakan interval
taksiran atau selang taksiran, yaitu menaksir harga parameter di antara batas
dua harga.
Dalam prakteknya harus dicari interval taksiran yang sempit dengan derajat
kepercayaan yang memuaskan. Derajat kepercayaan menaksir, disebut
koefisien kepercayaan, merupakan pernyataan dalam bentuk peluang.
Jika koefisien kepercayaan dinyatakan dengan (baca: gamma), maka 10
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
5
2. Menaksir Rata-rata Misalkan dipunyai populasi berukuran N dengan rata-rata dan simpangan baku . Dari populasi ini akan ditaksir parameter rata-rata . Untuk itu ambil sebuah sampel acak berukuran n, hitung satatistik yang diperlukan yaitu
x dan s . Titik taksiran untuk rata-rata adalah x . Dengan kata lain, nilai ditaksir oleh harga x yang diperoleh dari sampel. Untuk memperoleh taksiran yang tinggi derajat kepercayaannya, digunakan
interval taksiran atau selang taksiran disertai nilai koefisien kepercayaan yang
dikehendaki.
a. Simpangan baku diketahui dan populasi berdistribusi normal Rumus (I.1) menjadi:
(I.2) =
+
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
6
Untuk interval kepercayaannya:
(I.5) nstx
nstx pp .. +
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
7
Penyelesaian
Diketahui x = 68,6
= 5,75 = 95% = 0,95
21 475,0= 475,0z = 1,96
a. Sampel n = 30 %51000
30 =Nn
n
zxn
zx .. 2121 +
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
8
3. Menaksir Proporsi Misalkan sebuah sampel acak berukuran n diambil dari populasi binomial
berukuran N dimana terdapat proporsi untuk peristiwa A yang ada dalam populasi tersebut. Jika terdapat x peristiwa A, sehingga proporsi sampel untuk
peristiwa A = nx . Jadi titik taksiran untuk adalah nx .
Digunakan pendekatan oleh distribusi normal kepada binomial untuk ukuran
sampel n cukup besar.
Rumus 100 % keyakinan untuk interval kepercayaan adalah
(I.8) npqzp
npqzp ..
21
21 +
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
9
( ) ( )( ) ( ) ( )( )100
4,06,0.96,16,0100
4,06,0.96,16,0 +
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
10
Contoh
Dari sebuah populasi yang berdistribusi normal, diambil sampel yang representatif
dan diperoleh simpangan baku sebesar 6 dengan ukuran sampel 31. Dengan
koefisien kepercayaan 99%, taksirlah interval dari simpangan baku populasi.
Penyelesaian
Diketahui n = 31
s = 6
= 99 % = 0,99 ( ) ( ) ( ) ( ) ( ) 7,53
230,995,0
2131,99,012
12
,121 === ++ dk
( ) ( ) ( ) ( ) ( ) 8,132
30,005,02
131,99,0121
2,12
1 === dk Interval kepercayaan simpangan baku populasi adalah
( )( )
( )( )
212
1
22
212
1
2 11
+
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
11
Akan ditaksir selisih rata-rata )( 21 . Titik taksiran untuk adalah )( 21 adalah )( 21 xx . Untuk menaksir selisih rata-rata dibedakan hal-hal berikut:
a. Dalam hal 21 = Jika kedua populasi normal dan memiliki == 21 yang besarnya diketahui, maka 100 % interval kepercayaan untuk )( 21 adalah
(I.11) 212
12121212
12111)(11)(nn
zxxnn
zxx ++
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
12
Dengan memisalkan 11 =s dan 22 =s untuk sampel-sampel acak berukuran cukup besar, dapat dilakukan pendekatan kepada distribusi normal.
Rumus interval kepercayaan ditentukan oleh:
(I.14) 2
22
1
21
212121
2
22
1
21
2121 )()( n
snszxx
ns
nszxx ++
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
13
dengan pt diperoleh dari daftar distribusi Student dengan ( )+= 121p dan ( )1= ndk .
Contoh (Sudjana)
Ada dua cara pengukuran untuk mengukur kelembaban suatu zat. Cara I
dilakukan 50 kali yang menghasilkan 1x = 60,2 dan 21s = 24,7. Cara II dilakukan
60 kali dengan 2x = 70,4 dan 22s = 37,2. Tentukan interval kepercayaan 95%
mengenai perbedaan rata-rata pengukuran dari kedua cara tersebut.
Penyelesaian
Diketahui 1x = 60,2 ; 21s = 24,7
2x = 70,4 ; 22s = 37,2
Dimisalkan hasil kedua cara pengukuran berdistribusi normal.
( ) ( ) 975,095,0121121 =+=+= p ; 10826050 =+=dk Karena kedua populasi normal dan memiliki == 21 tetapi besarnya tidak diketahui, maka varians gabungan dari sampel adalah
( ) ( ) ( )( ) ( )( ) 53,3126050
2,371607,241502
11
21
222
2112 =+
+=++=
nnsnsns
Maka interval kepercayaan
21
212121
2111.)(11.)(nn
stxxnn
stxx pp ++
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
14
diambil sebuah sampel acak berukuran 1n dan 2n . Proporsi untuk peristiwa
yang diperhatikan pada sampel tersebut adalah 1
11 n
xp = dan 2
22 n
xp = dengan
1x dan 2x menyatakan banyaknya peristiwa yang diperhatikan.
Akan ditentukan interval taksiran untuk ( )21 dengan menggunakan pendekatan oleh distribusi normal asalkan 1n dan 2n cukup besar.
Rumus untuk 100 % interval kepercayaan selisih ( )21 adalah (I.16)
( ) ( )2
22
1
11
212121
2
22
1
11
2121 n
qpnqp
zppn
qpnqp
zpp ++
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
15
( ) ( )2
22
1
11
212121
2
22
1
11
2121 n
qpnqp
zppn
qpnqp
zpp ++
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
16
c. simpangan baku kedua populasi diasumsikan tidak sama.
4. Dari populasi tanaman padi jenis A dan jenis B, diambil sampel tinggi
tanaman padi sbb:
Sampel I dari padi jenis A : 39,3 ; 45,5 ; 41,2 ; 53 ; 44,2 ; 42,5 ; 63,9.
Sampel II dari padi jenis B : 37 ; 42,4 ; 40,1 ; 52,2 ; 41,5 ; 40,8 ; 60,2.
Dengan observasi berpasangan tersebut dan interval kepercayaan 95 %,,
taksirlah selisih rata-ratanya.
5. Sebuah sampel berukuran 200 lampu yang dihasilkan oleh sebuah mesin
produksi menunjukkan 15 buah lampu rusak. Sebuah sampel lain berukuran
100 buah lampu yang dihasilkan oleh mesin kedua mengandung 12 buah
lampu yang rusak. Tentukan interval kepercayaan 99% untuk selisih kedua
perbandingan.
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
17
BAB II
PENGUJIAN HIPOTESIS
1. Pendahuluan Sebelumnya telah dipelajari cara-cara menaksir parameter untuk mengambil
kesimpulan tentang berapa besar harga parameter. Cara pengambilan
kesimpulan yang kedua akan dipelajari adalah melalui pengujian hipotesis.
Hipotesis adalah asumsi atau dugaan mengenai sesuatu hal yang dibuat untuk
menjelaskan hal tersebut yang sering dituntut untuk melakukan
pengecekannya.
Jika asumsi atau dugaan tersebut dikhususkan mengenai populasi, umumnya
mengenai nilai-nilai parameter populasi, maka hipotesis disebut hipotesis
statistik.
Contoh hipotesis
a. peluang lahirnya bayi berjenis kelamin laki-laki = 0,5.
b. 25 % masyarakat termasuk golongan A.
c. Rata-rata pendapatan keluarga di suatu daerah Rp 300.000,00 tiap bulan.
Setiap hipotesis bisa benar atau tidak benar, maka perlu diadakan penelitian
sebelum hipotesis itu diterima atau ditolak. Langkah atau prosedur untuk
menentukan apakah menerima atau menolak hipotesis dinamakan pengujian
hipotesis.
2. Dua Macam Kekeliruan Meskipun dalam penelitian hipotesis telah diterima atau ditolak, tidak berarti
bahwa telah dibuktikan kebenaran hipotesis. Yang diperlihatkan adalah hanya
menerima atau menolak hipotesis saja.
Dalam melakukan pengujian hipotesis, ada dua macam kekeliruan yang dapat
terjadi, yaitu:
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
18
a. Kekeliruan tipe I ialah menolak hipotesis yang seharusnya diterima,
b. Kekeliruan tipe II ialah menerima hipotesis yang seharusnya ditolak.
Tipe Kekeliruan Ketika Membuat Kesimpulan tentang Hipotesis
Keadaan Sebenarnya Kesimpulan Hipotesis Benar Hipotesis Salah Terima Hipotesis BENAR SALAH
(Kekeliruan tipe II) Tolak Hipotesis SALAH
(Kekeliruan tipe II) BENAR
Kedua tipe kekeliruan dinyatakan dalam bentuk peluang. Peluang membuat
kekeliruan tipe I biasa dinyatakan dengan (alpha) maka disebut pula kekeliruan dan peluang membuat kekeliruan tipe II dinyatakan dengan (beta) dikenal dengan kekeliruan . disebut taraf signifikan (level of significan) atau taraf arti atau sering disebut taraf nyata.
Jika diperkecil, maka menjadi besar dan demikian sebaliknya. Harga yang biasa digunakan adalah 01,0= atau 05,0= . Misalnya, dengan 05,0= atau sering disebut taraf nyata (taraf signifikansi) 5%, artinya kira-kira 5 dari tiap 100 kesimpulan bahwa akan menolak
hipotesis yang harusnya diterima. Dengan kata lain kira-kira 95% yakin
bahwa telah dibuat kesimpulan yang benar. Dalam hal demikian dikatakan
bahwa hipotesis telah ditolak pada taraf nyata 0,05 yang berarti mungkin salah
dengan peluang 0,05.
3. Langkah Pengujian Hipotesis Pengujian hipotesis akan membawa pada kesimpulan untuk menerima atau
menolak hipotesis. Sehingga terdapat dua pilihan, dimana digunakan
perumusan seperlunya agar lebih terperinci dan lebih mudah dalam penentuan
di antara dua pilihan tersebut.
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
19
Hipotesis yang biasa dinyatakan dengan H, perlu dirumuskan dengan singkat
dan jelas sesuai dengan persoalan yang dihadapi. Agar tampak adanya dua
pilihan, maka hipotesis H ini didampingi pernyataan lain yang isinya
berlawanan yang disebut dengan hipotesis tandingan (alternatif) yang
dinyatakan dengan A.
Pasangan hipotesis H dan A, tepatnya H melawan A, akan menentukan
kriteria pengujian yang terdiri dari daerah penerimaan dan daerah penolakan
hipotesis. Daerah penolakan hipotesis sering disebut dengan daerah kritis.
Bila menguji parameter ( dapat berupa rata-rata , proporsi , simpangan baku , dll), maka: a. Hipotesis mengandung pengertian sama
Pengujian sederhana lawan sederhana
1) H : 0 = A : 1 = dengan 10 , dua nilai berbeda yang diketahui.
Pengujian sederhana lawan komposit
2) H : 0 = A : 0
3) H : 0 = A : 0 >
4) H : 0 = A : 0 <
b. Hipotesis mengandung pengertian maksimum (pengujian komposit lawan
komposit)
H : 0 A : 0 >
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
20
c. Hipotesis mengandung pengertian minimum pengujian komposit lawan
komposit)
H : 0 A : 0 <
Berikut hanya akan dipelajari pengujian terhadap hipotesis yang
perumusannya mengandung pengertian sama atau tidak memiliki perbedaan,
disebut hipotesis nol 0H melawan hipotesis tandingannya 1H , yang
mengandung pengertian tidak sama, lebih besar atau lebih kecil. 1H harus
dipilih dan ditentukan peneliti sesuai dengan persoalan yang dihadapi.
Pasangan 0H dan 1H yang telah dirumuskan dituliskan dalam bentuk berikut.
=
01
00
: H : H
atau
>=
01
00
: H : H
atau
=
01
00
: H : H
2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.
Tolak 0H jika 5,0zz , selainnya 0H diterima. Dengan 5,0z diperoleh dari daftar distribusi normal baku dengan
peluang ( )5,0 . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik z yang sama dengan rumus (II.1).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
b. Dalam hal tidak diketahui
Pada kenyataannya simpangan baku sering tidak diketahui, maka digunakan taksirannya yaitu simpangan baku s .
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
27
Langkah pengujian hipotesis:
1. Hipotesis pengujian
>=
01
00
: H : H
2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.
Tolak 0H jika 1tt , selainnya 0H diterima. Dengan 1t diperoleh dari daftar distribusi t (distribusi Student)
dengan peluang 1 dan 1= ndk . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik t yang sama dengan rumus (II.2).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh
Proses pembuatan barang rata-rata menghasilkan 15,7 unit per jam. Hasil produksi
memiliki varians 2,3. metode baru diusulkan untuk mengganti metode lama jika
rata-ratanya per jam menghasilkan paling sedikit 16 buah. Untuk menentukan
apakah metode akan diganti atau tidak, metode baru dicoba 20 kali dan ternyata
rata-rata perjam menghasilkan 16,9 buah. Pengusaha bermaksud mengambil risiko
5% untuk menggunakan metode baru apabila metode ini rata-rata menghasilkan
labih dari 16 buah. Apakah keputusan yang akan diambil pengusaha?
Penyelesaian
Diketahui x = 16,9 ; n = 20 ; = 3,2 , 0 =16 Langkah pengujian hipotesis:
1. Hipotesis pengujian
=
01
00
: H : H
yaitu
>=
16 : H 16 : H
1
0
2. Taraf signifikansi = 5%. 3. Kriteria pengujian.
Tolak 0H jika 5,0zz 64,105,05,05,0 == zz
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
28
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
65,2
203,2169,160 ===
n
xz
5. Kesimpulan : karena 64,165,2 5,0 =>= zzhitung terletak pada daerah kritis maka 0H ditolak. Jadi, 16> . Sehingga dapat disimpulkan bahwa dengan risiko 5% metode baru dapat menggantikan metode lama.
Uji Pihak Kiri
a. Dalam hal diketahui Langkah pengujian hipotesis:
1. Hipotesis pengujian
=81,0 : H
81,0 : H2
1
20
2. Taraf signifikansi = 5%. 3. Kriteria pengujian.
Tolak 0H jika 21
2 , selainnya terima 0H .
919,16205,0.2
1 = dengan 91101 === ndk 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
( ) ( )( ) 0,1681,0
44,31110120
22 ===
sn
5. Kesimpulan : karena 919,1616 205,0.2
12 =
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
37
akan digunakan dasar distribusi sampling mengenai selisih statistik, misalnya
selisih rata-rata dan selisih proporsi.
Misalkan dipunyai dua buah populasi, keduanya berdistribusi normal dengan
rata-rata dan simpangan baku masing-masing 1 dan 1 untuk populasi pertama, 2 dan 2 untuk populasi kedua. Secara independen diambil sebuah sampel acak dengan ukuran 1n dan 2n dari masing-masing populasi. Rata-rata
dan simpangan baku dari sampel-sampel itu berturut-turut 1x , 1s dan 2x , 2s .
Akan diuji tentang rata-rata 1 dan 2 . a. Dalam hal == 21 dan diketahui
Langkah pengujian hipotesis:
a. Hipotesis pengujian
=
211
210
: H : H
b. Tentukan besarnya taraf signifikansi . c. Kriteria pengujian.
Terima 0H jika ( ) ( )
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
38
3. Kriteria pengujian.
Terima 0H jika 211211
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
39
3. Kriteria pengujian.
Terima 0H jika 211211
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
40
mt , diperoleh dari daftar distribusi Student dengan peluang dan mdk = .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
(II.11)
2
22
1
21
21
ns
ns
xxt+=
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh (Sudjana)
Suatu barang dihasilkan dengan menggunakan dua proses. Ingin diketahui apakah
kedua proses itu menghasilkan barang yang sama kualitasnya ditinjau dari rata-
rata daya tekannya. Maka diadakan percobaan sebanyak 20 kali masing-masing
dari hasil proses pertama maupun kedua. Diperoleh informasi 1x = 9,25 kg ; 2x =
10,4 kg ; 1s = 2,24 kg ; 2s = 3,12 kg. Bila populasinya dianggap normal dengan
varians kedua populasi tidak sama, dengan taraf nyata 5%, ujilah bagaimana
hasilnya!
Penyelesaian
Diketahui 1x = 9,25 kg ; 2x = 10,4 kg ; 1s = 2,24 kg ; 2s = 3,12 kg.
Pada kasus ini populasi dianggap normal dan variansnya tidak diketahui namun
sama besar.
Langkah pengujian hipotesis dalam hal 21 dan keduanya tidak diketahui 1. Hipotesis pengujian
=
berbeda yang tekan daya rata-rata kualitasdengan barangan menghasilk proses kedua; : Hsama yang tekan daya rata-rata kualitasdengan barangan menghasilk proses kedua; : H
211
210
2. Taraf signifikansi = 5%. 3. Kriteria pengujian.
Terima 0H jika 21
2211
21
2211
wwtwtwt
wwtwtw
++
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
41
2509,0200176,5
1
21
1 === nsw ; 4867,0
207344,9
2
22
2 === nsw
( ) ( ) ( ) ( ) 09,219;975,0120,05,0.2111,2111 1 ===== tttt n
( ) ( ) ( ) ( ) 09,219;975,0120,05,0.2111,2112 2 ==== tttt n
Sehingga 21
2211
21
2211
wwtwtwt
wwtwtw
++
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
42
Dengan 211t diperoleh dari daftar distribusi t dengan peluang
211 dan 1= ndk . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.
(II.12)
nsBt
B=
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
11. Uji Hipotesis Kesamaan Dua Rata-Rata: Uji Satu Pihak Serupa dengan uji dua pihak, pada uji satu pihak juga dimisalkan dipunyai dua
buah populasi, keduanya berdistribusi normal dengan rata-rata masing-masing
1 dan 2 dan simpangan baku 1 dan 2 . Uji Pihak Kanan
a. Dalam hal 21 = Langkah pengujian hipotesis:
1) Hipotesis pengujian
>=
211
210
: H : H
2) Tentukan besarnya taraf signifikansi . 3) Kriteria pengujian.
Terima 0H jika < 1tt , dan tolak 0H untuk harga t yang lain. Dengan 221 += nndk dan peluang ( )1 dari daftar distribusi t.
4) Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik t yang sama dengan rumus (II.9) dan (II.10).
5) Menarik kesimpulan berdasarkan hasil 3 dan 4.
b. Dalam hal 21
Pendekatan yang cukup memuaskan adalah dengan menggunakan statistik
t .
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
43
Langkah pengujian hipotesis:
a) Hipotesis pengujian
>=
211
210
: H : H
b) Tentukan besarnya taraf signifikansi . c) Kriteria pengujian.
Tolak 0H jika 21
2211
wwtwtwt +
+ , dan terima 0H jika terjadi sebaliknya.
Dengan 1
21
1 nsw = ;
2
22
2 nsw =
( ) ( )1,2111 1= ntt dan ( ) ( )1,2112 2= ntt Peluang untuk penggunaan daftar distribusi t adalah ( )1 sedangkan derajat kebebasannya masing-masing ( )11 n dan ( )12 n .
d) Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik t yang sama dengan rumus (II.11). e) Menarik kesimpulan berdasarkan hasil 3 dan 4.
c. Observasi berpasangan
Langkah pengujian hipotesis:
1. Hipotesis pengujian
>=
0 : H0 : H
1
0
B
B
2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.
Tolak 0H jika 1tt , selainnya terima 0H . Dengan 1t diperoleh dari daftar distribusi t dengan peluang 1 dan 1= ndk .
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik t yang sama dengan rumus (II.12).
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
44
Uji Pihak Kiri
a. Dalam hal 21 = dan keduanya tidak diketahui Langkah pengujian hipotesis:
1. Hipotesis pengujian
=
: H : H
B1
B0
A
A
2. Taraf signifikansi = 5%. 3. Kriteria pengujian.
Tolak 0H jika 5,0zz dan Terima 0H jika < 5,0zz . 64,105,05,05,0 == zz
4. Statistik hitung berdasarkan data penelitian (sampel)
74,01001006880 =+
+=++=
BA
BA
nnxxp
26,074,011 === pq
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
49
( )( )94,1
1001
100126,074,0
10068
10080
11=
+=
+
=
BA
B
B
A
A
nnpq
nx
nx
z
5. Kesimpulan: karena 64,194,1 >=hitungz maka 0H ditolak. Jadi, B >A . Artinya, pada taraf 5%, pemberian obat dapat membantu penyembuhan penyakit.
Bagaimanakah bila penelitian ini diuji dengan taraf nyata 1%, apakah masih
memberikan hasil yang sama dengan kesimpulan di atas!
14. Uji Hipotesis Kesamaan Dua Varians: Uji Dua Pihak Ketika menaksir selisih rata-rata dan menguji kesamaan atau perbedaan dua
rata-rata ditekankan asumsi bahwa kedua populasi memiliki varians yang
sama agar menaksir dan menguji bisa dilakukan. Dalam hal varians yang
berbeda, hingga saat ini hanya digunakan cara pendekatan. Oleh karena itu,
maka perlu dilakukan pengujian mengenai kesamaan dua varians atau lebih.
Populasi-populasi dengan varians yang sama besar dinamakan populasi
dengan varians yang homogen. Bila populasi tersebut memiliki varians yang
berbeda disebut populasi dengan varians yang heterogen.
Berikut akan dilakukan pengujian kesamaan varians untuk dua populasi.
Misalkan dipunyai dua populasi normal dengan varians 21 dan 22 . Langkah pengujian hipotesis:
1. Hipotesis pengujian
=
22
211
22
210
:: H
: H
2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.
Terima 0H jika ( ) ( ) ( )1,1211,1,211 2121
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
50
4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil jika
sampel dari populasi pertama berukuran 1n dengan variansi 21s dan sampel
dari populasi kedua berukuran 2n dengan variansi 22s .
(II.14) 22
21
ssF =
Statistik lain yang digunakan
(II.15) terkecilVariansterbesarVariansF =
Kriteria pengujian.
Tolak 0H jika ( )21 ,21 vvFF .
Dengan ( )21 ,21 vvF diperoleh dari daftar distribusi F dengan peluang 21 dan derajat kebebasan v1 dan v2.
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Contoh
Dari dua populasi siswa diukur hasil prestasi belajar siswa. Dari populasi pertama
diukur 10 orang siswa ternyata 21s = 24,7. Dari populasi kedua diukur 13 siswa
ternyata 22s = 37,2. Dengan = 10%, ujilah apakah kedua populasi tersebut homogen.
Penyelesaian
Diketahui 21s = 24,7 n1 = 10
22s = 37,2 n2 = 13
Langkah pengujian hipotesis:
1. Hipotesis pengujian
=
22
211
22
210
:: H
: H
2. Taraf signifikansi = 10%. 3. Kriteria pengujian.
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
51
Terima 0H jika ( ) ( ) ( )1,1211,1,211 2121
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
52
15. Uji Hipotesis Kesamaan Dua Varians: Uji Satu Pihak
Uji Pihak Kanan
Langkah pengujian hipotesis:
1. Hipotesis pengujian
>=
22
211
22
210
:: H
: H
2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.
Tolak 0H jika ( )1,1 21 nnFF , selainnya terima 0H . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil
menggunakan statistik yang sama dengan rumus (II.14)
5. Menarik kesimpulan berdasarkan hasil 3 dan 4.
Uji Pihak Kiri
Langkah pengujian hipotesis:
1. Hipotesis pengujian
k populasi yang berdistribusi normal.
Dasar pemikiran penggunaan analisis varians adalah bahwa varians total semua
subjek dalam suatu eksperimen dapat dianalisis dari dua sumber, yaitu variansi
antar kelompok dan variansi di dalam kelompok.
Asumsi dasar dari analisis varians adalah sebagai berikut:
Populasi yang diamati memiliki distribusi normal.
Pengambilan sampel dilakukan secara acak dan setiap sampel independen/tidak
terikat sampel yang lain.
Populasi-populasi dimana nilai sampel diperoleh memiliki varians populasi yang
sama atau dapat ditulis 22221 , k === K dengan k jumlah populasi.
Dikenal beberapa jenis varians sampel 2s , salah satunya dihitung dengan rumus
( )1
22
=
nxx
s i dan varians populasi adalah 2 . Varians untuk sekumpulan data ini melukiskan derajat perbedaan atau variansi
nilai data individu yang ada dalam kelompok atau kumpulan data tersebut.
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
56
Variansi ini dihitung dari nilai rata-rata kumpulan data. Selain itu dikenal pula
varians sampling berbagai statistik, untuk rata-rata diberi lambang 2x , untuk proporsi dengan lambang 2
nx , dan sebagainya.
Langkah-langkah Analisis varians adalah sebagai berikut:
1. Rumuskan hipotesis nol ( 0H ) dan hipotesis tandingannya ( 1H ).
0H : mean k populasi ( )2>k yang berdistribusi normal adalah sama. 1H : diantara k populasi ( )2>k terdapat mean populasi yang berbeda.
(minimum ada satu tanda sama dengan tidak berlaku)
Atau secara matematis
kH ==== K3210 :
k
k
kH
=====
KKK
321
321
3211 :
2. Ambil sampel acak dari k buah ( )2>k populasi sbb: Sampel I Sampel II Sampel III ... Sampel k
11x 12x 13x ... kx1
21x 22x 23x ... kx2
31x 32x 33x ... kx3 M M M ... M
1nx 2nx 3nx ... nkx
1x 2x 3x ... kx 3. Tentukan besarnya taraf signifikansi . 4. Gunakan statistik F (Fisher)
kelompokdalamiansmeansantarians
VDKVAMFhitung var
var==
( )1
1
2
22
====
k
xxnnSVAM
k
jj
x , 1= kdk
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
57
( )( )11 1
2
== =
nk
xxVDK
n
i
k
jjij
Dengan x mean dari semua mean sampel
jx mean sampel ke-j, j = 1, 2, ..., k
ijx nilai data observasi ke-i dari sampel ke-j
5. Kriteria pengujian.
Terima 0H jika ( )( )1,1; nkkhitung FF . Tolak 0H jika ( )( )1,1; > nkkhitung FF .
6. Mengambil kesimpulan berdasarkan hasil 4 dan 5.
7. Jika 0H diterima maka pengujian berakhir.
Jika 0H ditolak, analisis dilanjutkan dengan Uji Lanjut salah satunya
dengan menggunakan Uji
21LSD (Least Significant Different).
( ) dnk StLSD .1,211211
=
ji
d ns
nsS
22
+= , VDKs =2
Kriteria pengujian Uji lanjut
211
LSD
Bandingkan antara ix dan jx : ji xx jika 211
>= LSDxxd jiij .
Contoh
Diterapkan model pembelajaran dengan 3 metode, kemudian dilakukan tes dan
diperoleh skor hasil tes sbb:
Sampel ke-
Metode I Metode II Metode III
1 25 22 22 2 29 25 21 3 28 24 26 4 30 25 23
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
58
a. Dengan anava selidikilah apakah ada perbedaan diantara tiga mean skor
hasil belajar dengan ketiga metode tersebut.
b. Bila terdapat perbedaan, dengan uji lanjut selidikilah model pembelajaran
yang manakah yang terbaik. Gunakan = 5%. Penyelesaian
Diketahui 1x = 28 2x = 24 3x = 23
x = 25
Langkah-langkah Analisis varians:
Merumuskan hipotesis uji
3210 : ==H 1H : paling sedikit ada satu tanda sama dengan tidak berlaku.
Sampel acak dari 3 buah populasi seperti tertera pada soal di atas.
Taraf signifikansi = 5%.. Gunakan statistik F (Fisher)
( ) ( ) ( ) ( ){ } 2813
25232524252841
2221
2
=++=
==
k
xxnVAM
k
jj
( )( )
( ) ( )( ) ( )
( ) ( )( ) ( )
( ) ( )( ) ( )
( )78,3
91
14328232826
28212822
28252824
28252822
28302828
28292825
1
22
22
22
22
22
22
1 1
2
==
++++
++++
+++
=
== =
nk
xxVDK
n
i
k
jjij
41,778,3
28 ===VDKVAMFhitung
Kriteria pengujian.
Terima 0H jika ( )( )1,1; nkkhitung FF Tolak 0H jika ( )( )1,1; > nkkhitung FF
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
59
( )( ) ( )( ) ( ) 26,49,2;05,0143,13;05,01,1; === FFF nkk Kesimpulan : karena ( )( ) 26,441,7 1,1; =>= nkkhitung FF maka 0H ditolak.
Artinya, ada perbedaan diantara ketiga mean skor hasil belajar dengan
ketiga metode tersebut.
Karena 0H ditolak, maka analisis dilanjutkan dengan Uji Lanjut menggunakan
Uji
211
LSD
3748,1478,3
478,322 =+=+=
jid n
snsS , 78,32 ==VDKs
( ) ( ) ( ) ( )( ) ( )( ) ( ) 11,33748,1.26,2
3748,1.
3748,1..
9,975,0
143,05,02111,2
11211
=====
t
tStLSD dnk
Kriteria pengujian Uji lanjut
211
LSD
Bandingkan antara ix dan jx : ji xx jika 211
>= LSDxxd jiij .
11,3424282112112
=>===
LSDxxd . Berarti 1x > 2x .
11,3523282113113
=>===
LSDxxd . Berarti 1x > 3x .
11,3123242113223
=
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
60
Jawa Madura Bali 341 360 302 323 300 304 356 296 286 289 223 245 343 250 235 335 296 216 361 284 287 298 200 296 300 208 264 P
rodu
ksi s
usu
(lite
r)
309 231 259 Dengan taraf signifikansi = 5%, selidiki apakah ada perbedaan perbandingan produksi susu sapi di 3 lokasi tersebut? Jika ada perbedaan
manakah yang paling berbeda!
2. Dilakukan pengamatan terhadap hasil tes UAN siswa SMA. Para siswa itu
dikelompokkan dalam 3 kategori (1) SMA Favorit, (2) SMA Negeri, dan (3)
SMA Swasta. Diperoleh data pengamatan sebagai berikut:
No SMA Nilai No SMA Nilai No SMA Nilai 1 favorit 4,25 8 negeri 4,00 15 swasta 4,00 2 favorit 5,00 9 negeri 3,00 16 swasta 3,50 3 favorit 4,75 10 negeri 3,50 17 swasta 3,75 4 favorit 3,75 11 negeri 3,75 18 swasta 3,00 5 favorit 4,50 12 negeri 3,50 19 swasta 3,25 6 favorit 4,25 13 negeri 3,25 20 swasta 3,50 7 favorit 4,00 14 negeri 4,25 21 swasta 2,75
Selidiki apakah ketiga kelompok tersebut memiliki nilai rata-rata UAN yang
sama dengan taraf signifikansi = 5%. 3. Dilakukan penelitian mengenai berat badan mahasiswa berdasarkan sarapan
yang dimakan dari 4 kelompok sampel dan diperoleh data berat badan (dalam
kg) sbb:
Sampel ke-
Mie instan
Nasi Roti Singkong
1 45 46 47 43 2 55 54 58 52 3 40 45 44 40 4 65 64 65 48 5 60 62 63 58 6 58 59 62 60 7 57 54 59 55
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
61
Dengan taraf signifikansi = 5%, selidiki sarapan manakah yang membuat berat badan mahasiswa lebih tinggi dari yang lain!
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
62
BAB IV
ANALISIS REGRESI
1. Pendahuluan Metode analisis yang telah dibahas sebelumnya adalah analisis terhadap data
mengenai sebuah karakteristik atau atribut (data kualitatif) dan mengenai
sebuah variabel, diskrit maupun kontinu (data kuantitatif). Namun, kenyataan
yang terjadi, banyak persoalan yang meliputi lebih dari sebuah variabel.
Misalkan, hasil belajar siswa tergantung pada waktu belajar, hasil produksi
padi tergantung pada cuaca serta penggunaan pupuk, dan lain sebagainya.
Oleh karena itu perlu untuk mempelajari analisis data yang terdiri atas banyak
variabel.
Jika dipunyai data yang terdiri atas dua atau lebih variabel, maka dapat
dipelajari bagaimana variabel-variabel tersebut berhubungan. Hubungan yang
diperoleh umumnya dinyatakan dalam bentuk persamaan matematik yang
menyatakan hubungan fungsional antara variabel. Studi yang mmempelajari
hubungan antar variabel ini dikenal dengan analisis regresi.
Tujuan dari bab ini adalah bagaimana menghitung suatu perkiraan atau
persamaan regresi yang akan menjelaskan hubungan antara dua variabel.
Yang akan dibahas adalah regresi garis sederhana, dimana akan dibahas
mengenai hubungan antara dua variabel yang biasanya cukup tepat dinyatakan
dalam suatu garis lurus. Selanjutnya tujuan dari penggunaan persamaan
regresi adalah memperkirakan nilai dari suatu variabel pada nilai tertentu dari
variabel lain dengan kata lain persamaan regresi digunakan untuk peramalan.
2. Hubungan Fungsional Antara Variabel Dalam analisis regresi, variabel akan dibedakan menjadi dua, yaitu variabel
bebas (variabel prediktor) dan variabel takbebas (variabel respon). Variabel
yang mudah diperoleh atau tersedia dapat digolongkan ke dalam variabel
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
63
bebas sedangkan variabel yang terjadi karena variabel bebas, merupakan
variabel takbebas. Dalam analisis regresi, variabel bebas akan dinyatakan
dengan kXXX ,,, 21 K ( )1k sedangkan variabel takbebas dinyatakan dengan Y.
Telah diketahui bahwa statistika bertujuan untuk menyimpulkan populasi
dengan menggunakan hasil analisis data sampel. Untuk analisis regresi juga
akan ditentukan hubungan fungsional yang diharapkan berlaku untuk populasi
berdasarkan data sampel yang diambil dari populasi yang bersangkutan.
Hubungan fungsional ini akan dituliskan dalam bentuk persamaan matematik
yang disebut dengan persamaan regresi yang akan bergantung pada
parameter-parameter.
Secara umum model atau persamaan regresi untuk populasi dapat ditulis
dalam bentuk
(IV.1) ( )mkxxxy XXXk ,,,,,, 2121,,,. 21 KKK = Dengan m ,,, 21 K parameter-parameter yang ada dalam regresi.
Model regresi sederhana untuk populasi dengan sebuah variabel bebas yang
biasa dikenal dengan regresi linier sederhana adalah
(IV.2) Xxy 21. += Dalam hal ini parameternya adalah 1 dan 2 . Berdasarkan sebuah sampel, akan ditentukan atau ditaksir persamaan regresi
populasi pada rumus (IV.1). Hal ini dapat dilakukan dengan jalan menaksir
parameter-parameter m ,,, 21 K . Untuk kasus regresi linier sederhana, perlu ditaksir parameter 1 dan 2 . Jika
1 dan 2 ditaksir oleh a dan b , maka persamaan regresi berdasarkan sampel adalah
(IV.3) bXaY +=
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
64
Regresi dengan X merupakan variabel bebas dan Y variabel takbebasnya
dinamakan regresi Y atas X.
Model regresi populasi pangkat dua atau parabola untuk sebuah variabel bebas
dengan parameter 1 , 2 dan 3 adalah (IV.4) 2321. 2 XXxxy ++= Dan berdasarkan sampel acak, parameter-parameter 1 , 2 dan 3 perlu ditaksir dengan persamaan berikut
(IV.5) 2 cXbXaY ++= Dengan a , b dan c masing-masing diperoleh dari perhitungan berdasarkan
data penelitian yang berturut-turut merupakan taksiran untuk 1 , 2 dan 3 .
Berikut cara menentukan persamaan regresi, apabila dimiliki data
pengamatan.
3. Metode Tangan Bebas Metode ini merupakan metode kira-kira dengan menggunakan diagram pencar
(scatter diagram) dengan data yang diperoleh berdasarkan hasil pengamatan.
Jika variabel yang diamati meliputi variabel bebas X dan variabel takbebas Y,
maka data pengamatan yang diperoleh digambarkan pada sebuah diagram
dengan X dinyatakan pada sumbu mendatar dan Y pada sumbu tegak sehingga
terbentuk diagram pencar yang menunjukkan titik-titik tertentu.
Ada dua manfaat dari penggunaan diagram pencar ini yaitu: (1) Membantu
menunjukkan apakah terdapat hubungan yang bermanfaat antara dua variabel,
(2) Membantu menetapkan tipe persamaan yang menunjukkan hubungan
antara kedua variabel tersebut. Seperti yang tertulis dalam manfaat yang
kedua, dari letak titik-titik pada diagram pencar, dapat diperkirakan bentuk
regresinya. Jika letak titik-titik yang terbentuk di sekitar garis lurus, maka
dapat diduga terjadi regresi linier. Namun, hubungan yang terbentuk tidak
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
65
selalu harus berupa garis lurus. Jika letak titik-titik yang terbentuk di sekitar
garis lengkung, maka dapat diduga terjadi regresi nonlinier.
Hubungan yang tergambar pada diagram pencar dapat berupa hubungan
positif (atau langsung) antar dua variabel yaitu jika variabel bebas meningkat
maka variabel takbebas juga meningkat. Namun, adapula kemungkinan pada
variabel tertentu terdapat hubungan yang negatif (atau berlawanan) yaitu jika
variabel bebas meningkat maka variabel takbebas akan menurun. Atau bahkan
tidak ada hubungan sama sekali antara variabel (titik-titik yang terbentuk pada
diagram pencar tidak menunjukkan pola tertentu).
4. Metode Kuadrat Terkecil Untuk Regresi Linier Metode ini berdasarkan pada kenyataan bahwa jumlah pangkat dua (kuadrat)
dari jarak antara titik-titik dengan garis regresi yang sedang dicari harus
sekecil mungkin.
Untuk pengamatan yang terdiri dari sebuah variabel bebas X dan variabel
takbebas Y di mana model regresi linier untuk populasi seperti rumus (IV.2)
telah dapat diduga, maka perlu ditaksir parameter-parameter regresi sehingga
diperoleh persamaan seperti rumus (IV.3). Jadi untuk populasi, model regresi
linier adalah
Xxy 21. += Harga parameter 1 dan 2 ditaksir oleh a dan b , sehingga persamaan regresi menggunakan data sampel adalah
bXaY +=
Koefisien-koefisien regresi a dan b untuk regresi linier dapat dihitung
dengan rumus
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
66
(IV.6)
( )( ) ( )( )( )
( )( )( )22
22
2
=
=
ii
iiii
ii
iiiii
XXn
YXYXnb
XXn
YXXXYa
Jika terlebih dahulu dihitung koefisien b , maka koefisien a dapat pula
ditentukan dengan rumus
(IV.7) XbYa = dengan X dan Y masing-masing adalah rata-rata untuk variabel X dan Y.
Dalam regresi linier, koefisien b berarti perubahan rata-rata Y untuk setiap
perubahan satu unit variabel X. Perubahan nilai Y bertambah apabila nilai b
bertanda positif dan berkurang untuk tanda b negatif.
Contoh (Supranto)
Berikut data penjualan dari perusahaan makanan ringan
X : persentase kenaikan biaya iklan
Y : persentase kenaikan hasil penjualan
X 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Berapakah besarnya ramalan presentase kenaikan penjualan apabila biaya
iklan dinaikkan menjadi 15 %.
Penyelesaian
X Y 2X XY
1 2 1 2
2 4 4 8
4 5 16 20
5 7 25 35
7 8 49 56
9 10 81 90
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
67
10 12 100 120
12 14 144 168
= 50iX 25,6=X
= 62iY 75,7=Y
= 4202iX = 499iiYX
Untuk menghitung ramalan presentase kenaikan penjualan, terlebih dahulu
dicari persamaan regresi dari data tersebut.
( )( )( )
( ) ( )( )( ) ( ) 04,1860
892504208
62504998222
===
= ii
iiii
XXn
YXYXnb
( ) 25,125,604,175,7 === XbYa Sehingga diperoleh persamaan XbXaY 04,125,1 +=+= Nilai koefisien 04,1=b artinya setiap ada kenaikan 1% biaya iklan, maka hasil penjualan akan naik sebesar 1,04 %.
Persamaan XbXaY 04,125,1 +=+= selanjutnya dapat digunakan untuk meramalkan presentase kenaikan penjualan apabila terjadi perubahan
(kenaikan atau pengurangan) biaya iklan.
Jika biaya iklan dinaikkan menjadi 15 %, maka ramalan presentase kenaikan
penjualan adalah
XY 04,125,1 += dengan X = 15 % diperoleh ( ) 85,161504,125,1 =+=Y . Jadi besarnya ramalan presentase kenaikan penjualan apabila biaya iklan
dinaikkan menjadi 15 % adalah 16,85.
5. Berbagai Varians Sehubungan dengan Regresi Linier Sederhana Untuk analisis selanjutnya tentang regresi linier sederhana, terdapat beberapa
asumsi yang harus diambil.
Asumsi pertama, mengenai kekeliruan prediksi atau galat prediksi atau
perbedaan YYe = yang terjadi, mengingat hasil pengamatan variabel takbebas Y belum tentu sama nilainya dengan harga yang diharapkan yaitu Y
yang diperoleh dari regresi hasil pengamatan (sampel). Dalam populasi, galat
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
68
prediksi dimisalkan berbentuk variabel acak yang mengikuti distribusi normal
dengan rata-rata nol dan varians 2 . Asumsi kedua, untuk setiap harga X yang diberikan, variabel takbebas Y
independen dan berdistribusi normal dengan rata-rata ( )X21 + dan varians 2
.XY . Varians 2.XY dimisalkan sama untuk setiap X maka dapat dinyatakn oleh varians kekeliruan taksiran ( )2 dan kekeliruan baku taksiran xy. .
5.1. Kesalahan Baku Regresi dan Koefisien Regresi Sederhana Kesalahan baku atau selisih taksir standar merupakan indeks yang
digunakan untuk mengukur tingkat ketepatan regresi dan koefisien regresi
atau mengukur variasi titik-titik observasi di sekitar garis regresi. Dengan
kesalahan baku, batasan seberapa jauh melesetnya perkiraan dalam
meramalkan data dapat diketahui (Hasan, 2010). Apabila semua titik
observasi berada tepat pada garis regresi maka kesalahan baku akan bernilai
sama dengan nol. Hal ini menunjukkan bahwa perkiraan yang dilakukan
pada data pengamatan sesuai dengan data yang sebenarnya.
Berikut rumus yang digunakan untuk menghitung kesalahan baku regresi
dan koefisien regresi.
a. Kesalahan baku untuk regresi
2
.2
=
nXYbYaY
Se
b. Kesalahan baku untuk koefisien regresi a (parameter a )
( )222
=
XXn
SXS ea
c. Kesalahan baku untuk koefisien regresi b (parameter b )
( )nX
X
SS eb 22
=
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
69
Coba Anda hitung kesalahan baku regresi, koefisien regresi a dan
koefisien regresi b dengan data dari contoh soal sebelumnya!
5.2. Pendugaan Interval Koefisien Regresi
6. Regresi Non Linier Seringkali regresi linier tidak dapat digunakan pada beberapa data karena
hipotesis kelinieran telah ditolak. Hal ini juga dapat dilihat dari bentuk
diagram pencar yang tidak menunjukkan bentuk garis lurus, sehingga model
regresi linier akan menyimpang dari letak titik-titik dalam diagram pencar.
Hal ini perlu diperbaiki dengan menggunakan regresi nonlinier.
Beberapa model regresi nonlinier yang mudah dan sering digunakan, antara
lain:
6.1. Model Parabola kuadratik
Persamaan umum model ini ditaksir oleh
(IV.8) 2 cXbXaY ++= Dengan koefisien-koefisien cba ,, harus ditentukan berdasarkan data
hasil pengamatan. Dengan menggunakan metode kuadrat terkecil, maka
cba ,, dapat dihitung dengan sistem persamaan:
++= 2iii XcXbnaY ++= 32 iiiii XcXbXaYX ++= 4322 iiiii XcXbXaYX
6.2. Model Parabola Kubik
Persamaan umum model ini ditaksir oleh
(IV.9) 32 dXcXbXaY +++=
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
70
Dengan koefisien-koefisien dcba ,,, dihitung dari data pengamatan.
Sistem persamaan yang harus diselesaikan untuk menentukan dcba ,,,
adalah:
+++= 32 iiii XdXcXbnaY +++= 432 iiiiii XdXcXbXaYX +++= 54322 iiiiii XdXcXbXaYX +++= 65433 iiiiii XdXcXbXaYX
Semakin tinggi pangkat X dalam persamaan regresi, maka semakin
banyak pula sistem persamaan yang harus diselesaikan.
6.3. Model Eksponen
Persamaan umum model ini ditaksir oleh
(IV.10) XbaY = Bentuk ini dapat dikembalikan kepada model linier apabila diambil
logaritmanya. Dalam logaritma persamaannya akan menjadi
(IV.11) ( )XbaY logloglog += Apabila diambil YY log = , aa log= , dan bb log= , maka diperoleh model XbaY += yang adalah model linier seperti pada rumus (IV.3). dengan rumus (IV.6), maka a dan b dapat dihitung, selanjutnya karena
aa log= dan bb log= , maka a dan b juga dapat dihitung. Dalam logaritma, maka a dan b dapat dicari dari rumus
(IV.12) ( )
=
nX
bn
Ya ii log
loglog
( ) ( )( )( )
= 22
logloglog
ii
iiii
XXn
YXYXnb
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
71
Model eksponensial dalam rumus XbaY = sering pula disebut model pertumbuhan karena sering digunakan dalam menganalisis data hasil
pengamatan yang berhubungan dengan fenomena yang sifatnya tumbuh.
Dalam hal ini, model persamaannya menjadi
(IV.13) bXeaY = dengan e adalah bilangan pokok logaritma asli.
6.4. Model Geometrik
Persamaan umum model ini ditaksir oleh
(IV.14) bXaY = Bentuk ini dapat dikembalikan kepada model linier dan apabila diambil
logaritmanya, maka
(IV.15) XbaY logloglog += Bentuk ini merupakan model linier dalam Xlog dan Ylog . Koefisien a
dan b dapat dihitung dari:
(IV.16)
=
nX
bn
Ya ii
logloglog
( ) ( )( )( )
= 22 log)log(loglogloglog
ii
iiii
XXn
YXYXnb
6.5. Model Logistik
Model paling sederhana model logistik dapat ditaksir oleh
(IV.17) XabY 1 =
Untuk Y yang tidak sama dengan nol, maka bentuk di atas dapat pula
ditulis sebagai XabY
=1 .
Jika diambil logaritmanya, diperoleh
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
72
(IV.18) ( )XbaY
loglog1log +=
Yang merupakan model linier dalam variabel-variabel X dan
Y1log .
Koefisien-koefisien a dan b dapat dicari dengan menggunakan rumus
(IV.19) ( )
=
nX
bn
Ya ii log
loglog
( ) ( )( )( )
= 22
logloglog
ii
iiii
XXn
YXYXnb
Dengan Ylog diganti oleh
Y1log .
6.6. Model Hiperbola
Persamaan umum yang sederhana untuk model hiperbola dapat dituliskan
dalam bentuk
(IV.20) bXa
Y +=1
Atau jika tidak ada Y berharga nol dapat ditulis menjadi
(IV.21) bXaY
+=1
Yang merupakan bentuk linier dalam variabel-variabel X dan Y1 .
Koefisien-koefisien a dan b dapat dihitung dengan rumus
(IV.22) ( )( ) ( )( )
( )
= 22
2
)( ii
iiiii
XXn
YXXXYa
( ) ( )( )( )
= 22 )( iiiiii
XXn
YXYXnb
Apabila variabel Y diganti oleh Y1 .
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
73
7. Regresi Linier Ganda Sebelumnya telah dibahas hubungan linear dari dua variabel X dan Y dengan
menggunakan persamaan regresi linier bXaY += . Dalam kenyataan, banyak data pengamatan yang terjadi dengan melibatkan
lebih dari dua variabel. Misalnya hasil panen padi (Y) dipengaruhi oleh
penggunaan pupuk ( 1X ), luas sawah ( 2X ) dan curah hujan ( 3X ). Secara
umum, data hasil pengamatan Y dapat terjadi atau dipengaruhi oleh variabel-
variabel bebas kXXX ,,, 21 K .
Akan ditentukan hubungan antara Y dan kXXX ,,, 21 K sehingga diperoleh
regresi antara Y dan kXXX ,,, 21 K . Yang akan ditinjau hanyalah garis regresi
sederhana yang dikenal dengan nama regresi linier berganda. Model regresi
linier ganda atas kXXX ,,, 21 K akan ditaksir oleh
(IV.23) kk XbXbXbaY ++++= K2211 dengan kbbba ,,,, 21 K merupakan koefisien-koefisien yang harus ditentukan
berdasarkan data pengamatan. Perhatikan bahwa regresi linier bXaY += merupakan hal istimewa dari rumus (IV.23) untuk 021 ===== kbbba K .
Koefisien-koefisien kbbba ,,,, 21 K ditentukan dengan menggunakan metode
kuadrat terkecil (Least Square Method) yang menghasilkan persamaan normal
sebagai berikut
(IV.24) =++++ YXbXbXban kkK2211 =++++ YXXXbXXbXbXa kk 112122111 K =++++ YXXXbXbXXbXa kk 222221212 K
M
=++++ YXXbXXbXXbXa kkkkkk 22211 K Bila persamaan tersebut diselesaikan, maka akan diperoleh nilai
kbbba ,,,, 21 K . Kemudian dapat dibentuk persamaan regresi berganda.
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
74
Apabila persamaan regresi telah diperoleh, maka dapat diramalkan nilai Y
dengan syarat bila nilai kXXX ,,, 21 K sebagai variabel bebas sudah
diketahui.
Sama halnya dengan regresi linier, dalam regresi linier ganda perubahan rata-
rata Y memperhatikan nilai dan tanda koefisien dari masing-masing variabel
X. Pada rumus (IV.23) maka koefisien 1b menyatakan perubahan rata-rata Y
untuk setiap perubahan satu unit variabel 1X apabila kXXX ,,, 32 K
semuanya dianggap tetap. Koefisien 2b menyatakan perubahan rata-rata Y
untuk setiap perubahan satu unit variabel 2X apabila kXXX ,,, 31 K
semuanya dianggap tetap, demikian seterusnya. Jelas bahwa setiap koefisien
hanya memberikan gambaran parsial apa yang terjadi pada Y untuk perubahan
X yang berhubungan dengan koefisien yang bersesuaian. Oleh karena itu
koefisien-koefisien kbbba ,,,, 21 K disebut pula koefisien regresi parsial.
Contoh (Supranto)
Perhatikan file PDF
LATIHAN 1. Dengan menggunakan persamaan garis regresi bXaY += , hitunglah ramalan
nilai Y jika X = 16 dari kedua data berikut a.
X 2 4 3 8 9 10 15 13
Y 1 2 5 7 8 11 13 14
b. X 1 3 4 7 9 11 13
Y 12 11 9 8 6 5 4
2. Berikut data nilai hasil ujian mahasiswa matematika Unnes
X : nilai hasil ujian Kalkulus mahasiswa matematika Unnes
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
75
Y : nilai hasil ujian Statistika mahasiswa matematika Unnes
X 7 6 8 9 10 5 4 9 7 3
Y 6 8 9 7 9 6 5 8 8 4
a. Dengan menggunakan persamaan regresi, berapakah nilai ujian Statistika
jika nilai ujian Kalkulus yang diperoleh sebesar 8,5.
b. Tuliskan persamaan regresi linier sederhana, berapakah besarnya nilai
koefisien regresi? Jelaskan arti dari nilai-nilai tersebut!
c. Tentukan kesalahan baku regesi, koefisien regresi a dan koefisien regresi
b .
d. Dalam soal ini bolehkan variabel Y memiliki nilai negatif? Berikan alasan
Anda!
3. Dipunyai kumpulan data berikut
X ni XXXX ,,,,, 21 KK
Y ni YYYY ,,,,, 21 KK
Jika ( )( )
( )
= 2XX
YYXXb
i
ii dan XbYa =
dengan = iXnX 1 dan = iYnY 1 Tunjukkan bahwa:
a. ( )( )( )22
=ii
iiii
XXn
YXYXnb
b. ( )=
=n
ii XbaY
1
0
4. Sebuah perusahaan mencatat hasil penjualan dari tahun ketahun sebagai
berikut. Tahun 1980 1981 1982 1983 1984 1985 1986
Hasil Penjualan
(jutaan Rp)
83 60 54 21 22 13 13
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
76
Terlihat adanya kemunduran dalam hasil penjualan tersebut. Dengan menggunakan trend parabola 2 cXbXaY ++= , hitung berapa ramalan hasil penjualan untuk tahun 1987 dan 1988? Gambarkan grafik Y dan Y dalam satu gambar!
5. Perhatikan data berikut
X : harga barang perunit dalam ribuan rupiah
Y : hasil penjualan barang X dalam jutaan rupiah
X 20 35 60 100 150 300 500 800
Y 150 125 105 100 92 77 62 58
Dengan menggunakan trend eksponensial XbaY = , berapakah ramalan hasil penjualan jika X = 900!
6. Perkembangan jumlah pabrik pada suatu daerah selama 6 tahun adalah sebagai berikut.
Tahun 1981 1982 1983 1984 1985 1986
Banyaknya pabrik 4 8 12 18 18 20
Dengan menggunakan trend logistik XabY 1 = , hitung ramalan banyaknya
pabrik yang dibangun pada tahun 1987?
7. PT ANGIN MOBAT MABIT menerapkan stategi promosi untuk meningkatkan pendapatan penjualan mesin jahit. Akan dilihat pengaruh iklan melalui televisi dan koran terhadap pendapatan. Berikut data mingguan yang tercatat:
Iklan TV (juta rupiah)
Iklan Koran (juta rupiah)
Pendapatan (juta rupiah)
1 2 4 6 7 9
2 4 5 7 8
10
1 3 6 8 9
11
Dengan menggunakan persamaan regresi linier berganda, berapakah ramalanpendapatan penjualan mesin jahit jika promosi dengan Iklan TV sebesar 10 juta rupiah dan promosi dengan Iklan koran sebesar 12 juta rupiah!
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
77
BAB V
ANALISIS KORELASI
1. Pendahuluan Jika data hasil pengamatan terdiri dari banyak variabel, maka hal yang perlu
diketahui berikutnya adalah seberapa kuat hubungan antara variabel-variabel
tersebut terjadi. Dengan kata lain, perlu ditentukan derajat hubungan antara
variabel-variabel. Studi yang membahas tentang derajat hubungan antara
variabel dikenal dengan nama analisis korelasi. Sedangkan ukuran yang
digunakan untuk mengetahui derajat hubungan, terutama untuk data
kuantitatif, dinamakan koefisien korelasi.
Adanya hubungan (korelasi) antara variabel yang satu dengan variabel lainnya
dapat dinyatakan dengan perubahan nilai variabel. Dalam bab ini hanya akan
dibahas mengenai hubungan linier antara dua variabel X dan Y .
Apabila dua variabel X dan Y mempunyai hubungan, maka nilai variabel X
yang sudah diketahui dapat digunakan untuk memperkirakan/menaksir atau
meramalkan Y. Ramalan pada dasarnya merupakan perkiraan/taksiran
mengenai terjadinya suatu kejadian (nilai suatu variabel) untuk waktu
mendatang, misalnya ramalan harga beras bulan depan, ramalan jumlah
penduduk 10 tahun mendatang, dan lain sebagainya.
Serupa dengan analisis regresi, variabel Y yang nilainya akan diramalkan
disebut variabel takbebas, sedangkan variabel X yang nilainya digunakan
untuk meramalkan nilai Y disebut variabel bebas atau variabel peramal
(predictor) atau sering disebut variabel yang menerangkan (explanatory).
2. Koefisien Korelasi
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
78
Hubungan dua variabel dapat merupakan hubungan positif maupun negatif.
Hubungan X dan Y dikatakan positif apabila kenaikan (penurunan) X pada
umumnya diikuti oleh kenaikan (penurunan) Y. Sebaliknya dikatakan negatif
jika kenaikan (penurunan) X pada umumnya diikuti oleh penurunan
(kenaikan) Y.
Jika antara variabel X dan Y ada hubungan, bentuk diagram pencarnya akan
mulus/teratur. Apabila terdapat hubungan positif, maka diagram pencar akan
bergerak dari kiri bawah ke kanan atas, sedangkan apabila terdapat hubungan
negatif, maka diagram pencar akan bergerak dari kiri atas ke kanan bawah.
Bila bentuk diagram pencar tidak teratur, artinya kenaikan/penurunan X pada
umumnya tidak diikuti oleh naik turunnya Y, dikatakan X dan Y tidak
berkorelasi. Atau dengan kata lain, X dan Y dikatakan saling bebas
(independent) jika naik dan turunnya varianel X tidak mempengaruhi Y atau
antara X dan Y tidak ada hubungan atau hubungnnya sangat lemah sehingga
dapat diabaikan.
Apabila hubungan X dan Y dapat dinyatakan dengan fungsi linier, maka kuat
hubungan antara X dan Y diukur dengan suatu nilai yang disebut Koefisien
Korelasi. Nilai koefisien korelasi.ini paling sedikit -1 dan paling besar 1. Jika
r adalah koefisien korelasi,maka nilai r dapat dinyatakan sebagai
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
79
11 r Jika
1=r , hubungan X dan Y sempurna dan positif (mendekati 1, hubungan sangat kuat dan positif)
1=r , hubungan X dan Y sempurna dan negatif (mendekati -1, hubungan sangat kuat dan negatif)
0=r , hubungan X dan Y lemah sekali atau tidak ada hubungan.
X dikatakan mempengaruhi Y, jika perubahan nilai X menyebabkan adanya
perubahan nilai Y, artinya naik turunnya nilai X akan mengakibatkan naik
turunnya nilai Y, sehingga nilai Y akan bervariasi. Namun, naik turunnya nilai
Y tidak hanya disebabkan oleh variabel X, karena masih ada faktor lain yang
menyebabkannya. Misalnya naik turunnya hasil panen padi (Y) dipengaruhi
oleh penggunaan pupuk ( 1X ), namun juga dapat dipengaruhi faktor-faktor
lain misalnya luas sawah, curah hujan dan lain-lain. Selanjutnya dapat
dihitung besar kontribusi dari X terhadap naik turunnya nilai Y dengan suatu
koefisien yang disebut koefisien penentuan/koefisien determinasi (coefficient
of determination).
Jika koefisien determinasi ditulis KD, maka untuk menghitung KD sebagai
berikut
2rKD = Besar koefisien determinasi menunjukkan besarnya sumbangan variabel bebas
terhadap variabel takbebas. Total nilai koefisien determinasi sebesar 100 %,
jika koefisien determinasi bernilai kurang dari 100 % maka sisanya
dipengaruhi oleh faktor lain.
Cara menghitung r adalah sebagai berikut
Rumus 1
==
==n
ii
n
ii
n
iii
yx
yxr
1
2
1
2
1
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
80
XXx ii = =
=n
iiXn
X1
1
YYy ii = =
=n
iiYn
Y1
1
atau
Rumus 2
= == =
===
=
n
i
n
iii
n
i
n
iii
n
ii
n
ii
n
iii
YYnXXn
YXYXnr
1
2
1
2
1
2
1
2
111
Contoh (Supranto)
Berikut data penjualan dari perusahaan makanan ringan
X : persentase kenaikan biaya iklan
Y : persentase kenaikan hasil penjualan
X 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Hitunglah r!
Penyelesaian
Untuk menghitung r, dibuat tabel berikut
Dengan rumus 1 X Y
( )xXX
( )yYY
2x 2y xy
1 2 - 5,25 - 5,75 27,5625 33,0625 30,1875
2 4 - 4,25 - 3,75 18,0625 14,0625 15,9375
4 5 - 2,25 - 2,75 5,0625 7,5625 6,1875
5 7 - 1,25 - 0,75 1,5625 0,5625 0,9375
7 8 0,75 0,25 0,5625 0,0625 0,1875
9 10 2,75 2,25 7,5625 5,0625 6,1875
10 12 3,75 4,25 14,0625 18,0625 15,9375
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
81
12 14 5,75 6,25 33,0625 39,0625 35,9375
= 50iX 25,6=X
= 62iY 75,7=Y
= 0ix
= 0iy
= 5,1072ix
= 5,1172iy
= 5,111ii yx
99,0389,1125,111
5,1175,1075,111
1
2
1
2
1 ====
==
=n
ii
n
ii
n
iii
yx
yxr
Hubungan antara X dan Y sebesar 0,99 yang menunjukkan hubungan yang
sangat kuat dan positif, artinya kenaikan biaya iklan pada umumnya
menaikkan hasil penjualan.
Koefisien determinasi %989801,02 === rKD artinya sumbangan iklan terhadap variasi Y (naik turunnya hasil penjualan) adalah 98 %, dan 2 %
sisanya disebabkan oleh faktor-faktor lainnya.
Dengan rumus 2
X Y 2X 2Y XY
1 2 1 4 2
2 4 4 16 8
4 5 16 25 20
5 7 25 49 35
7 8 49 64 56
9 10 81 100 90
10 12 100 144 120
12 14 144 196 168
= 50iX = 62iY = 4202iX = 5982iY = 499iiYX
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
82
= == =
===
=
8
1
28
1
28
1
28
1
2
8
1
8
1
8
1
88
8
i iii
i iii
ii
ii
iii
YYXX
YXYXr
( ) ( )( )( ) ( ) ( ) ( )22 625988504208
62504998
=r
99,0075,899
892940860
892 ===
3. Korelasi Rank (Peringkat) Misalkan ada dua orang Adi dan Bayu yang sama-sama minuman ringan
dalam kemasan. Kedua orang tersebut diminta untuk memberikan penilaian
terhadap 10 merk minuman ringan dalam kemasan. Minuman ringan yang
paling digemari diberi nilai 1 dan seterusnya sampai minuman ringan yang
tidak disenangi diberi nilai 10. Sehingga dalam hal ini Adi dan Bayu
memberikan rank (peringkat) terhadap merk minuman ringan tersebut.
Pemberian peringkat ini dapat juga dibalik, minuman ringan yang paling
digemari diberi nilai 10 dan seterusnya sampai yang tidak disenangi diberi
nilai 1. Diperoleh hasil pemberian rank sebagai berikut
No Merk Minuman Ringan Rank dari Adi Rank dari Bayu 1 Coca Cola 9 8 2 Fanta 5 3 3 Sprite 10 9 4 Frestea 1 2 5 Mizone 8 7 6 Pulpy Orange 7 10 7 Teh Sosro 3 4 8 Pepsi Blue 4 6 9 Fruittea 2 1
10 Tebs 6 5
Untuk menghitung koefisien korelasi antara rank dari Adi dan Bayu terhadap
10 merk minuman ringan dalam kemasan tersebut digunakan Koefisien
Korelasi Rank (Rank Spearman).
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
83
( )161 22
=nn
dr irank
dimana
id = selisih dari pasangan rank ke-i
n = banyaknya pasangan rank (dalam hal ini n = 10)
Contoh
Carilah koefisien korelasi rank antara rank Adi dan Bayu dalam menilai 10
merk minuman ringan.
Penyelesaian
Rank Adi 8 3 9 2 7 10 4 6 1 5
Rank Bayu 9 5 10 1 8 7 3 4 2 6
Selisih Rank (d) -1 -2 -1 1 -1 3 1 2 -1 -1 2d 1 4 1 1 1 9 1 4 1 1
Sehingga
( ) ( )( ) 85,08545,01455,01110010 114161161 22
===++++==
Knn
dr irank
Jadi, koefisien korelasi rank antara rank Adi dan Bayu dalam menilai 10 merk
minuman ringan sebesar 0,85.
Contoh (Supranto, 1992: 159)
Ada 10 calon sales yang diuji mengenai teknik penjualan. Setelah mereka
selesai diuji kemudian ditugaskan untuk melakukan penjualan. Diperoleh data
hasil ujian (X) dan hasil penjualan tahun pertama (Y). Nilai X dan Y dari 10
sales termasuk rank-nya adalah sebagai berikut.
Sales Nilai Ujian (X)
Rank Hasil Penjualan
(Y)
Rank Selisih Rank (d)
2d
A 48 3 312 2 1 1 B 32 6 164 8 -2 4 C 40 5 280 4 1 1 D 34 7 196 7 0 0
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
84
E 30 8 200 6 2 4 F 50 1,5 288 3 -1,5 2,25 G 26 9 146 10 -1 1 H 50 1,5 361 1 0,5 0,25 I 22 10 149 9 1 1 J 43 4 252 5 -1 1
Karena F dan H memiliki nilai yang sama maka rank mereka harus sama yaitu
5,12
21 =+ . Mula-mula F diberi nilai 1 dan H diberi nilai 2 (atau sebaliknya, kemudian dirata-rata). Apabila terdapat 3 objek yang memiliki nilai yang
sama, maka diurutkan dan dicari rata-ratanya.
Sehingga
( ) ( )( ) 9061,00939,01110010 114161161 22
==++++==
Knn
dr irank
Jadi, koefisien korelasi rank antara rank nilai ujian dan hasil penjualan sebesar
0,9061.
LATIHAN
1. Berikan contoh pasangan variabel yang memiliki hubungan positif dan
negatif.
2. Tentukan apakah hubungan variabel X dan Y berikut positif atau negatif.
Hitung nilai koefisien korelasi dan koefisien determinasi kemudian
interpretasikan hasilnya.
a. X 2 4 3 8 9 10 15 13
Y 1 2 5 7 8 11 13 14
b. X 1 3 4 7 9 11 13
Y 12 11 9 8 6 5 4
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
85
3. Berikut data nilai hasil ujian mahasiswa matematika Unnes
X : nilai hasil ujian Kalkulus mahasiswa matematika Unnes
Y : nilai hasil ujian Statistika mahasiswa matematika Unnes
X 7 6 8 9 10 5 4 9 7 3
Y 6 8 9 7 9 6 5 8 8 4
Hitung nilai koefisien korelasi dan koefisien determinasi kemudian
interpretasikan hasilnya.
4. Amat dan Budi diminta untuk memberikan rank berdasarkan suka dan
tidaknya terhadap merk rokok tertentu. Rokok yang paling disenangi diberi
nilai 10 dan yang paling tidak disenangi diberi nilai 1. Diperoleh hasil rank
sebagai berikut.
No Merk Rokok Rank dari Amat Rank dari Budi 1 AAA 2 9 2 BBB 10 4 3 CCC 8 3 4 DDD 3 6 5 EEE 4 5 6 FFF 1 7 7 GGG 5 8 8 HHH 2 6
Hitung koefisien korelasi rank berdasarkan data tersebut!
5. Tabel berikut menunjukkan nilai 10 mahasiswa yang telah berbentuk rank,
yang diperoleh dari hasil ujian kuliah Statistika dan Praktikum. Carilah
korelasi ranknya.
Praktikum 8 3 9 2 7 10 4 6 1 5
Statistika 9 5 10 1 8 7 3 4 2 6
Bahan ajar Statistika Inferensial
Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011
86
DAFTAR PUSTAKA
Hasan, I. 2001. Pokok-Pokok Materi Statistik 2 (Statistik Inferensif). Edisi Kedua.
Bumi Aksara. Jakarta.
Sudjana. 1996. Metoda Statistika Edisi ke 6. Penerbit Tarsito. Bandung.
Sugiyono. 2005. Statistik Untuk Penelitian. Penerbit Alfabeta. Bandung.
Supranto, J. 1992. Statistik Teori dan Aplikasi. Jilid 1. Erlangga. Jakarta.
Walpole, R & Myers, R. 1986. Ilmu Peluang dan Statistika Untuk Insinyur dan
Ilmuan. Terjemahan. Penerbit ITB. Bandung.