STATISTIKA INFERENSIAL 1

Bahan ajar Statistika Inferensial

Jurusan Matematika FMIPA Unnes Putriaji Hendikawati 2011

0

BAHAN AJAR

STATISTIKA INFERENSIAL

KODE MATA KULIAH MAT 201

ROMBEL 410140-03 410140-04 410140-05 410140-06 410140-07

Semester Gasal 2011/2012

Disusun Oleh Putriaji Hendikawati, S.Si., M.Pd., M.Sc.

Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Negeri Semarang 2011



1

DAFTAR ISI

BAB I PENAKSIRAN PARAMETER

1. Pengertian Penaksiran

2. Menaksir Rata-rata 3. Menaksir Proporsi 4. Menaksir Simpangan Baku 5. Menaksir Selisih Rata-Rata

6. Menaksir Selisih Proporsi

BAB II PENGUJIAN HIPOTESIS

1. Pendahuluan

2. Dua Macam Kekeliruan

3. Langkah Pengujian Hipotesis

4. Uji Hipotesis Rata-Rata

5. Uji Hipotesis Proporsi

6. Uji Hipotesis Varians

7. Uji Hipotesis Kesamaan Dua Rata-Rata

8. Uji Hipotesis Kesamaan Dua Proporsi

9. Uji Hipotesis Kesamaan Dua Varians

10. Uji Homogenitas Varians Populasi

BAB III ANALISIS VARIANS

BAB IV ANALISIS REGRESI

BAB V ANALISIS KORELASI



2

BAB I

PENAKSIRAN PARAMETER

1. Pengertian Penaksiran Statistika digunakan untuk menyimpulkan populasi.

Kelakuan populasi dipelajari berdasarkan data yang diambil baik secara

sampling maupun sensus. Namun, karena berbagai faktor untuk

menyimpulkan populasi diambil sebuah sampel yang representatif kemudian

berdasarkan hasil analisis terhadap data sampel, kesimpulan mengenai

populasi dibuat.

Kelakuan populasi yang akan diamati adalah mengenai parameter populasi

dan sampel yang digunakan adalah sampel acak. Data sampel dianalisis, nilai-

nilai yang perlu yaitu statistik dihitung dan berdasarkan nilai-nilai statistik

dapat disimpulkan bagaimana parameter bertingkah laku.

Cara pengambilan kesimpulan tentang parameter sehubungan dengan cara-

cara menaksir harga parameter. Harga parameter yang sebenarnya tetapi tidak

diketahui nilainya tersebut akan ditaksir berdasarkan statistik sampel yang

diambil dari populasi yang bersangkutan.

Parameter populasi yang akan ditaksir pada bab ini adalah rata-rata,

simpangan baku dan proporsi.

Secara umum parameter populasi akan diberi simbol (baca: theta). Jadi bisa merupakan rata-rata , simpangan baku , proporsi dan sebagainya. Jika tidak diketahui harganya, ditaksir oleh harga (baca: theta topi), maka dinamakan penaksir.

Sangat diharapkan = , yaitu penaksir dapat mengatakan harga parameter yang sebenarnya. Namun, keinginan ini dapat dikatakan terlalu ideal.

Kenyataan yang sering terjadi adalah:

a. menaksir oleh terlalu tinggi, atau



3

b. menaksir oleh terlalu rendah.

Kriteria untuk memperoleh penaksir yang baik yaitu: takbias, memiliki varians

minimum dan konsisten.

a. penaksir dikatakan penaksir takbias jika rata-rata semua harga yang mungkin akan sama dengan , ditulis ( ) =E . Penaksir yang tidak takbias disebut penaksir bias.

b. penaksir bervarians minimum ialah penaksir dengan varians terkecil

diantara semua penaksir untuk parameter yang sama. Jika 1 dan 2 dua penaksir untuk , jika varians 1 < varians 2 , maka 1 merupakan penaksir bervarians minimum.

c. Misalkan penaksir untuk yang dihitung berdasarkan sebuah sampel acak berukuran n. Jika ukuran sampel n makin besar mendekati ukuran

populasi menyebabkan mendekati , maka disebut penaksir konsisten.

d. Penaksir yang takbias dan bervariansi minimum dinamakan penaksir

terbaik.

Jika harga parameter ditaksir oleh tertentu, maka dinamakan penaksir atau tepatnya titik taksiran (estimasi titik).

Misalkan akan ditaksir rata-rata tinggi mahasiswa jurusan matematika Unnes.

Maka diambil sebuah sampel acak, kemudian data sampel dikumpulkan lalu

dihitung rata-ratanya. Misalkan diperoleh x = 160 cm. Jika 160 cm ini

digunakan untuk menaksir rata-rata tinggi mahasiswa jurusan matematika

Unnes, maka 160 adalah titik taksiran untuk rata-rata tinggi mahasiswa

matematika Unnes.

Secara umum x adalah penaksir atau titik taksiran untuk .



4

Titik taksiran untuk suatu parameter , harganya akan berlainan tergantung pada harga x yang diperoleh dari sampel yang diambil, sehingga hasilnya

kurang meyakinkan atau kurang dapat dipercaya. Untuk itu digunakan interval

taksiran atau selang taksiran, yaitu menaksir harga parameter di antara batas

dua harga.

Dalam prakteknya harus dicari interval taksiran yang sempit dengan derajat

kepercayaan yang memuaskan. Derajat kepercayaan menaksir, disebut

koefisien kepercayaan, merupakan pernyataan dalam bentuk peluang.

Jika koefisien kepercayaan dinyatakan dengan (baca: gamma), maka 10



5

2. Menaksir Rata-rata Misalkan dipunyai populasi berukuran N dengan rata-rata dan simpangan baku . Dari populasi ini akan ditaksir parameter rata-rata . Untuk itu ambil sebuah sampel acak berukuran n, hitung satatistik yang diperlukan yaitu

x dan s . Titik taksiran untuk rata-rata adalah x . Dengan kata lain, nilai ditaksir oleh harga x yang diperoleh dari sampel. Untuk memperoleh taksiran yang tinggi derajat kepercayaannya, digunakan

interval taksiran atau selang taksiran disertai nilai koefisien kepercayaan yang

dikehendaki.

a. Simpangan baku diketahui dan populasi berdistribusi normal Rumus (I.1) menjadi:

(I.2) =

+



6

Untuk interval kepercayaannya:

(I.5) nstx

nstx pp .. +



7

Penyelesaian

Diketahui x = 68,6

= 5,75 = 95% = 0,95

21 475,0= 475,0z = 1,96

a. Sampel n = 30 %51000

30 =Nn

n

zxn

zx .. 2121 +



8

3. Menaksir Proporsi Misalkan sebuah sampel acak berukuran n diambil dari populasi binomial

berukuran N dimana terdapat proporsi untuk peristiwa A yang ada dalam populasi tersebut. Jika terdapat x peristiwa A, sehingga proporsi sampel untuk

peristiwa A = nx . Jadi titik taksiran untuk adalah nx .

Digunakan pendekatan oleh distribusi normal kepada binomial untuk ukuran

sampel n cukup besar.

Rumus 100 % keyakinan untuk interval kepercayaan adalah

(I.8) npqzp

npqzp ..

21

21 +



9

( ) ( )( ) ( ) ( )( )100

4,06,0.96,16,0100

4,06,0.96,16,0 +



10

Contoh

Dari sebuah populasi yang berdistribusi normal, diambil sampel yang representatif

dan diperoleh simpangan baku sebesar 6 dengan ukuran sampel 31. Dengan

koefisien kepercayaan 99%, taksirlah interval dari simpangan baku populasi.

Penyelesaian

Diketahui n = 31

s = 6

= 99 % = 0,99 ( ) ( ) ( ) ( ) ( ) 7,53

230,995,0

2131,99,012

12

,121 === ++ dk

( ) ( ) ( ) ( ) ( ) 8,132

30,005,02

131,99,0121

2,12

1 === dk Interval kepercayaan simpangan baku populasi adalah

( )( )

( )( )

212

1

22

212

1

2 11

+



11

Akan ditaksir selisih rata-rata )( 21 . Titik taksiran untuk adalah )( 21 adalah )( 21 xx . Untuk menaksir selisih rata-rata dibedakan hal-hal berikut:

a. Dalam hal 21 = Jika kedua populasi normal dan memiliki == 21 yang besarnya diketahui, maka 100 % interval kepercayaan untuk )( 21 adalah

(I.11) 212

12121212

12111)(11)(nn

zxxnn

zxx ++



12

Dengan memisalkan 11 =s dan 22 =s untuk sampel-sampel acak berukuran cukup besar, dapat dilakukan pendekatan kepada distribusi normal.

Rumus interval kepercayaan ditentukan oleh:

(I.14) 2

22

1

21

212121

2

22

1

21

2121 )()( n

snszxx

ns

nszxx ++



13

dengan pt diperoleh dari daftar distribusi Student dengan ( )+= 121p dan ( )1= ndk .

Contoh (Sudjana)

Ada dua cara pengukuran untuk mengukur kelembaban suatu zat. Cara I

dilakukan 50 kali yang menghasilkan 1x = 60,2 dan 21s = 24,7. Cara II dilakukan

60 kali dengan 2x = 70,4 dan 22s = 37,2. Tentukan interval kepercayaan 95%

mengenai perbedaan rata-rata pengukuran dari kedua cara tersebut.

Penyelesaian

Diketahui 1x = 60,2 ; 21s = 24,7

2x = 70,4 ; 22s = 37,2

Dimisalkan hasil kedua cara pengukuran berdistribusi normal.

( ) ( ) 975,095,0121121 =+=+= p ; 10826050 =+=dk Karena kedua populasi normal dan memiliki == 21 tetapi besarnya tidak diketahui, maka varians gabungan dari sampel adalah

( ) ( ) ( )( ) ( )( ) 53,3126050

2,371607,241502

11

21

222

2112 =+

+=++=

nnsnsns

Maka interval kepercayaan

21

212121

2111.)(11.)(nn

stxxnn

stxx pp ++



14

diambil sebuah sampel acak berukuran 1n dan 2n . Proporsi untuk peristiwa

yang diperhatikan pada sampel tersebut adalah 1

11 n

xp = dan 2

22 n

xp = dengan

1x dan 2x menyatakan banyaknya peristiwa yang diperhatikan.

Akan ditentukan interval taksiran untuk ( )21 dengan menggunakan pendekatan oleh distribusi normal asalkan 1n dan 2n cukup besar.

Rumus untuk 100 % interval kepercayaan selisih ( )21 adalah (I.16)

( ) ( )2

22

1

11

212121

2

22

1

11

2121 n

qpnqp

zppn

qpnqp

zpp ++



15

( ) ( )2

22

1

11

212121

2

22

1

11

2121 n

qpnqp

zppn

qpnqp

zpp ++



16

c. simpangan baku kedua populasi diasumsikan tidak sama.

4. Dari populasi tanaman padi jenis A dan jenis B, diambil sampel tinggi

tanaman padi sbb:

Sampel I dari padi jenis A : 39,3 ; 45,5 ; 41,2 ; 53 ; 44,2 ; 42,5 ; 63,9.

Sampel II dari padi jenis B : 37 ; 42,4 ; 40,1 ; 52,2 ; 41,5 ; 40,8 ; 60,2.

Dengan observasi berpasangan tersebut dan interval kepercayaan 95 %,,

taksirlah selisih rata-ratanya.

5. Sebuah sampel berukuran 200 lampu yang dihasilkan oleh sebuah mesin

produksi menunjukkan 15 buah lampu rusak. Sebuah sampel lain berukuran

100 buah lampu yang dihasilkan oleh mesin kedua mengandung 12 buah

lampu yang rusak. Tentukan interval kepercayaan 99% untuk selisih kedua

perbandingan.



17

BAB II

PENGUJIAN HIPOTESIS

1. Pendahuluan Sebelumnya telah dipelajari cara-cara menaksir parameter untuk mengambil

kesimpulan tentang berapa besar harga parameter. Cara pengambilan

kesimpulan yang kedua akan dipelajari adalah melalui pengujian hipotesis.

Hipotesis adalah asumsi atau dugaan mengenai sesuatu hal yang dibuat untuk

menjelaskan hal tersebut yang sering dituntut untuk melakukan

pengecekannya.

Jika asumsi atau dugaan tersebut dikhususkan mengenai populasi, umumnya

mengenai nilai-nilai parameter populasi, maka hipotesis disebut hipotesis

statistik.

Contoh hipotesis

a. peluang lahirnya bayi berjenis kelamin laki-laki = 0,5.

b. 25 % masyarakat termasuk golongan A.

c. Rata-rata pendapatan keluarga di suatu daerah Rp 300.000,00 tiap bulan.

Setiap hipotesis bisa benar atau tidak benar, maka perlu diadakan penelitian

sebelum hipotesis itu diterima atau ditolak. Langkah atau prosedur untuk

menentukan apakah menerima atau menolak hipotesis dinamakan pengujian

hipotesis.

2. Dua Macam Kekeliruan Meskipun dalam penelitian hipotesis telah diterima atau ditolak, tidak berarti

bahwa telah dibuktikan kebenaran hipotesis. Yang diperlihatkan adalah hanya

menerima atau menolak hipotesis saja.

Dalam melakukan pengujian hipotesis, ada dua macam kekeliruan yang dapat

terjadi, yaitu:



18

a. Kekeliruan tipe I ialah menolak hipotesis yang seharusnya diterima,

b. Kekeliruan tipe II ialah menerima hipotesis yang seharusnya ditolak.

Tipe Kekeliruan Ketika Membuat Kesimpulan tentang Hipotesis

Keadaan Sebenarnya Kesimpulan Hipotesis Benar Hipotesis Salah Terima Hipotesis BENAR SALAH

(Kekeliruan tipe II) Tolak Hipotesis SALAH

(Kekeliruan tipe II) BENAR

Kedua tipe kekeliruan dinyatakan dalam bentuk peluang. Peluang membuat

kekeliruan tipe I biasa dinyatakan dengan (alpha) maka disebut pula kekeliruan dan peluang membuat kekeliruan tipe II dinyatakan dengan (beta) dikenal dengan kekeliruan . disebut taraf signifikan (level of significan) atau taraf arti atau sering disebut taraf nyata.

Jika diperkecil, maka menjadi besar dan demikian sebaliknya. Harga yang biasa digunakan adalah 01,0= atau 05,0= . Misalnya, dengan 05,0= atau sering disebut taraf nyata (taraf signifikansi) 5%, artinya kira-kira 5 dari tiap 100 kesimpulan bahwa akan menolak

hipotesis yang harusnya diterima. Dengan kata lain kira-kira 95% yakin

bahwa telah dibuat kesimpulan yang benar. Dalam hal demikian dikatakan

bahwa hipotesis telah ditolak pada taraf nyata 0,05 yang berarti mungkin salah

dengan peluang 0,05.

3. Langkah Pengujian Hipotesis Pengujian hipotesis akan membawa pada kesimpulan untuk menerima atau

menolak hipotesis. Sehingga terdapat dua pilihan, dimana digunakan

perumusan seperlunya agar lebih terperinci dan lebih mudah dalam penentuan

di antara dua pilihan tersebut.



19

Hipotesis yang biasa dinyatakan dengan H, perlu dirumuskan dengan singkat

dan jelas sesuai dengan persoalan yang dihadapi. Agar tampak adanya dua

pilihan, maka hipotesis H ini didampingi pernyataan lain yang isinya

berlawanan yang disebut dengan hipotesis tandingan (alternatif) yang

dinyatakan dengan A.

Pasangan hipotesis H dan A, tepatnya H melawan A, akan menentukan

kriteria pengujian yang terdiri dari daerah penerimaan dan daerah penolakan

hipotesis. Daerah penolakan hipotesis sering disebut dengan daerah kritis.

Bila menguji parameter ( dapat berupa rata-rata , proporsi , simpangan baku , dll), maka: a. Hipotesis mengandung pengertian sama

Pengujian sederhana lawan sederhana

1) H : 0 = A : 1 = dengan 10 , dua nilai berbeda yang diketahui.

Pengujian sederhana lawan komposit

2) H : 0 = A : 0

3) H : 0 = A : 0 >

4) H : 0 = A : 0 <

b. Hipotesis mengandung pengertian maksimum (pengujian komposit lawan

komposit)

H : 0 A : 0 >



20

c. Hipotesis mengandung pengertian minimum pengujian komposit lawan

komposit)

H : 0 A : 0 <

Berikut hanya akan dipelajari pengujian terhadap hipotesis yang

perumusannya mengandung pengertian sama atau tidak memiliki perbedaan,

disebut hipotesis nol 0H melawan hipotesis tandingannya 1H , yang

mengandung pengertian tidak sama, lebih besar atau lebih kecil. 1H harus

dipilih dan ditentukan peneliti sesuai dengan persoalan yang dihadapi.

Pasangan 0H dan 1H yang telah dirumuskan dituliskan dalam bentuk berikut.

=

01

00

: H : H

atau

>=

01

00

: H : H

atau

=

01

00

: H : H

2. Tentukan besarnya taraf signifikansi . 3. Kriteria pengujian.

Tolak 0H jika 5,0zz , selainnya 0H diterima. Dengan 5,0z diperoleh dari daftar distribusi normal baku dengan

peluang ( )5,0 . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

menggunakan statistik z yang sama dengan rumus (II.1).

5. Menarik kesimpulan berdasarkan hasil 3 dan 4.

b. Dalam hal tidak diketahui

Pada kenyataannya simpangan baku sering tidak diketahui, maka digunakan taksirannya yaitu simpangan baku s .



27

Langkah pengujian hipotesis:

1. Hipotesis pengujian

>=

01

00

: H : H


Tolak 0H jika 1tt , selainnya 0H diterima. Dengan 1t diperoleh dari daftar distribusi t (distribusi Student)

dengan peluang 1 dan 1= ndk . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

menggunakan statistik t yang sama dengan rumus (II.2).


Contoh

Proses pembuatan barang rata-rata menghasilkan 15,7 unit per jam. Hasil produksi

memiliki varians 2,3. metode baru diusulkan untuk mengganti metode lama jika

rata-ratanya per jam menghasilkan paling sedikit 16 buah. Untuk menentukan

apakah metode akan diganti atau tidak, metode baru dicoba 20 kali dan ternyata

rata-rata perjam menghasilkan 16,9 buah. Pengusaha bermaksud mengambil risiko

5% untuk menggunakan metode baru apabila metode ini rata-rata menghasilkan

labih dari 16 buah. Apakah keputusan yang akan diambil pengusaha?

Penyelesaian

Diketahui x = 16,9 ; n = 20 ; = 3,2 , 0 =16 Langkah pengujian hipotesis:


=

01

00

: H : H

yaitu

>=

16 : H 16 : H

1

0

2. Taraf signifikansi = 5%. 3. Kriteria pengujian.

Tolak 0H jika 5,0zz 64,105,05,05,0 == zz



28

4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

65,2

203,2169,160 ===

n

xz

5. Kesimpulan : karena 64,165,2 5,0 =>= zzhitung terletak pada daerah kritis maka 0H ditolak. Jadi, 16> . Sehingga dapat disimpulkan bahwa dengan risiko 5% metode baru dapat menggantikan metode lama.

Uji Pihak Kiri

a. Dalam hal diketahui Langkah pengujian hipotesis:


=81,0 : H

81,0 : H2

1

20


Tolak 0H jika 21

2 , selainnya terima 0H .

919,16205,0.2

1 = dengan 91101 === ndk 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.

( ) ( )( ) 0,1681,0

44,31110120

22 ===

sn

5. Kesimpulan : karena 919,1616 205,0.2

12 =



37

akan digunakan dasar distribusi sampling mengenai selisih statistik, misalnya

selisih rata-rata dan selisih proporsi.

Misalkan dipunyai dua buah populasi, keduanya berdistribusi normal dengan

rata-rata dan simpangan baku masing-masing 1 dan 1 untuk populasi pertama, 2 dan 2 untuk populasi kedua. Secara independen diambil sebuah sampel acak dengan ukuran 1n dan 2n dari masing-masing populasi. Rata-rata

dan simpangan baku dari sampel-sampel itu berturut-turut 1x , 1s dan 2x , 2s .

Akan diuji tentang rata-rata 1 dan 2 . a. Dalam hal == 21 dan diketahui


a. Hipotesis pengujian

=

211

210

: H : H

b. Tentukan besarnya taraf signifikansi . c. Kriteria pengujian.

Terima 0H jika ( ) ( )



38

3. Kriteria pengujian.

Terima 0H jika 211211



39


Terima 0H jika 211211



40

mt , diperoleh dari daftar distribusi Student dengan peluang dan mdk = .

4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.

(II.11)

2

22

1

21

21

ns

ns

xxt+=


Contoh (Sudjana)

Suatu barang dihasilkan dengan menggunakan dua proses. Ingin diketahui apakah

kedua proses itu menghasilkan barang yang sama kualitasnya ditinjau dari rata-

rata daya tekannya. Maka diadakan percobaan sebanyak 20 kali masing-masing

dari hasil proses pertama maupun kedua. Diperoleh informasi 1x = 9,25 kg ; 2x =

10,4 kg ; 1s = 2,24 kg ; 2s = 3,12 kg. Bila populasinya dianggap normal dengan

varians kedua populasi tidak sama, dengan taraf nyata 5%, ujilah bagaimana

hasilnya!

Penyelesaian

Diketahui 1x = 9,25 kg ; 2x = 10,4 kg ; 1s = 2,24 kg ; 2s = 3,12 kg.

Pada kasus ini populasi dianggap normal dan variansnya tidak diketahui namun

sama besar.

Langkah pengujian hipotesis dalam hal 21 dan keduanya tidak diketahui 1. Hipotesis pengujian

=

berbeda yang tekan daya rata-rata kualitasdengan barangan menghasilk proses kedua; : Hsama yang tekan daya rata-rata kualitasdengan barangan menghasilk proses kedua; : H

211

210


Terima 0H jika 21

2211

21

2211

wwtwtwt

wwtwtw

++



41

2509,0200176,5

1

21

1 === nsw ; 4867,0

207344,9

2

22

2 === nsw

( ) ( ) ( ) ( ) 09,219;975,0120,05,0.2111,2111 1 ===== tttt n

( ) ( ) ( ) ( ) 09,219;975,0120,05,0.2111,2112 2 ==== tttt n

Sehingga 21

2211

21

2211

wwtwtwt

wwtwtw

++



42

Dengan 211t diperoleh dari daftar distribusi t dengan peluang

211 dan 1= ndk . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil.

(II.12)

nsBt

B=


11. Uji Hipotesis Kesamaan Dua Rata-Rata: Uji Satu Pihak Serupa dengan uji dua pihak, pada uji satu pihak juga dimisalkan dipunyai dua

buah populasi, keduanya berdistribusi normal dengan rata-rata masing-masing

1 dan 2 dan simpangan baku 1 dan 2 . Uji Pihak Kanan

a. Dalam hal 21 = Langkah pengujian hipotesis:

1) Hipotesis pengujian

>=

211

210

: H : H

2) Tentukan besarnya taraf signifikansi . 3) Kriteria pengujian.

Terima 0H jika < 1tt , dan tolak 0H untuk harga t yang lain. Dengan 221 += nndk dan peluang ( )1 dari daftar distribusi t.

4) Statistik hitung berdasarkan data penelitian (sampel) yang diambil

menggunakan statistik t yang sama dengan rumus (II.9) dan (II.10).

5) Menarik kesimpulan berdasarkan hasil 3 dan 4.

b. Dalam hal 21

Pendekatan yang cukup memuaskan adalah dengan menggunakan statistik

t .



43


a) Hipotesis pengujian

>=

211

210

: H : H

b) Tentukan besarnya taraf signifikansi . c) Kriteria pengujian.

Tolak 0H jika 21

2211

wwtwtwt +

+ , dan terima 0H jika terjadi sebaliknya.

Dengan 1

21

1 nsw = ;

2

22

2 nsw =

( ) ( )1,2111 1= ntt dan ( ) ( )1,2112 2= ntt Peluang untuk penggunaan daftar distribusi t adalah ( )1 sedangkan derajat kebebasannya masing-masing ( )11 n dan ( )12 n .

d) Statistik hitung berdasarkan data penelitian (sampel) yang diambil

menggunakan statistik t yang sama dengan rumus (II.11). e) Menarik kesimpulan berdasarkan hasil 3 dan 4.

c. Observasi berpasangan



>=

0 : H0 : H

1

0

B

B


Tolak 0H jika 1tt , selainnya terima 0H . Dengan 1t diperoleh dari daftar distribusi t dengan peluang 1 dan 1= ndk .

4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

menggunakan statistik t yang sama dengan rumus (II.12).




44

Uji Pihak Kiri

a. Dalam hal 21 = dan keduanya tidak diketahui Langkah pengujian hipotesis:


=

: H : H

B1

B0

A

A


Tolak 0H jika 5,0zz dan Terima 0H jika < 5,0zz . 64,105,05,05,0 == zz

4. Statistik hitung berdasarkan data penelitian (sampel)

74,01001006880 =+

+=++=

BA

BA

nnxxp

26,074,011 === pq



49

( )( )94,1

1001

100126,074,0

10068

10080

11=

+=

+

=

BA

B

B

A

A

nnpq

nx

nx

z

5. Kesimpulan: karena 64,194,1 >=hitungz maka 0H ditolak. Jadi, B >A . Artinya, pada taraf 5%, pemberian obat dapat membantu penyembuhan penyakit.

Bagaimanakah bila penelitian ini diuji dengan taraf nyata 1%, apakah masih

memberikan hasil yang sama dengan kesimpulan di atas!

14. Uji Hipotesis Kesamaan Dua Varians: Uji Dua Pihak Ketika menaksir selisih rata-rata dan menguji kesamaan atau perbedaan dua

rata-rata ditekankan asumsi bahwa kedua populasi memiliki varians yang

sama agar menaksir dan menguji bisa dilakukan. Dalam hal varians yang

berbeda, hingga saat ini hanya digunakan cara pendekatan. Oleh karena itu,

maka perlu dilakukan pengujian mengenai kesamaan dua varians atau lebih.

Populasi-populasi dengan varians yang sama besar dinamakan populasi

dengan varians yang homogen. Bila populasi tersebut memiliki varians yang

berbeda disebut populasi dengan varians yang heterogen.

Berikut akan dilakukan pengujian kesamaan varians untuk dua populasi.

Misalkan dipunyai dua populasi normal dengan varians 21 dan 22 . Langkah pengujian hipotesis:


=

22

211

22

210

:: H

: H


Terima 0H jika ( ) ( ) ( )1,1211,1,211 2121



50

4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil jika

sampel dari populasi pertama berukuran 1n dengan variansi 21s dan sampel

dari populasi kedua berukuran 2n dengan variansi 22s .

(II.14) 22

21

ssF =

Statistik lain yang digunakan

(II.15) terkecilVariansterbesarVariansF =

Kriteria pengujian.

Tolak 0H jika ( )21 ,21 vvFF .

Dengan ( )21 ,21 vvF diperoleh dari daftar distribusi F dengan peluang 21 dan derajat kebebasan v1 dan v2.


Contoh

Dari dua populasi siswa diukur hasil prestasi belajar siswa. Dari populasi pertama

diukur 10 orang siswa ternyata 21s = 24,7. Dari populasi kedua diukur 13 siswa

ternyata 22s = 37,2. Dengan = 10%, ujilah apakah kedua populasi tersebut homogen.

Penyelesaian

Diketahui 21s = 24,7 n1 = 10

22s = 37,2 n2 = 13



=

22

211

22

210

:: H

: H




51

Terima 0H jika ( ) ( ) ( )1,1211,1,211 2121



52

15. Uji Hipotesis Kesamaan Dua Varians: Uji Satu Pihak

Uji Pihak Kanan



>=

22

211

22

210

:: H

: H


Tolak 0H jika ( )1,1 21 nnFF , selainnya terima 0H . 4. Statistik hitung berdasarkan data penelitian (sampel) yang diambil

menggunakan statistik yang sama dengan rumus (II.14)


Uji Pihak Kiri



k populasi yang berdistribusi normal.

Dasar pemikiran penggunaan analisis varians adalah bahwa varians total semua

subjek dalam suatu eksperimen dapat dianalisis dari dua sumber, yaitu variansi

antar kelompok dan variansi di dalam kelompok.

Asumsi dasar dari analisis varians adalah sebagai berikut:

Populasi yang diamati memiliki distribusi normal.

Pengambilan sampel dilakukan secara acak dan setiap sampel independen/tidak

terikat sampel yang lain.

Populasi-populasi dimana nilai sampel diperoleh memiliki varians populasi yang

sama atau dapat ditulis 22221 , k === K dengan k jumlah populasi.

Dikenal beberapa jenis varians sampel 2s , salah satunya dihitung dengan rumus

( )1

22

=

nxx

s i dan varians populasi adalah 2 . Varians untuk sekumpulan data ini melukiskan derajat perbedaan atau variansi

nilai data individu yang ada dalam kelompok atau kumpulan data tersebut.



56

Variansi ini dihitung dari nilai rata-rata kumpulan data. Selain itu dikenal pula

varians sampling berbagai statistik, untuk rata-rata diberi lambang 2x , untuk proporsi dengan lambang 2

nx , dan sebagainya.

Langkah-langkah Analisis varians adalah sebagai berikut:

1. Rumuskan hipotesis nol ( 0H ) dan hipotesis tandingannya ( 1H ).

0H : mean k populasi ( )2>k yang berdistribusi normal adalah sama. 1H : diantara k populasi ( )2>k terdapat mean populasi yang berbeda.

(minimum ada satu tanda sama dengan tidak berlaku)

Atau secara matematis

kH ==== K3210 :

k

k

kH

=====

KKK

321

321

3211 :

2. Ambil sampel acak dari k buah ( )2>k populasi sbb: Sampel I Sampel II Sampel III ... Sampel k

11x 12x 13x ... kx1

21x 22x 23x ... kx2

31x 32x 33x ... kx3 M M M ... M

1nx 2nx 3nx ... nkx

1x 2x 3x ... kx 3. Tentukan besarnya taraf signifikansi . 4. Gunakan statistik F (Fisher)

kelompokdalamiansmeansantarians

VDKVAMFhitung var

var==

( )1

1

2

22

====

k

xxnnSVAM

k

jj

x , 1= kdk



57

( )( )11 1

2

== =

nk

xxVDK

n

i

k

jjij

Dengan x mean dari semua mean sampel

jx mean sampel ke-j, j = 1, 2, ..., k

ijx nilai data observasi ke-i dari sampel ke-j


Terima 0H jika ( )( )1,1; nkkhitung FF . Tolak 0H jika ( )( )1,1; > nkkhitung FF .

6. Mengambil kesimpulan berdasarkan hasil 4 dan 5.

7. Jika 0H diterima maka pengujian berakhir.

Jika 0H ditolak, analisis dilanjutkan dengan Uji Lanjut salah satunya

dengan menggunakan Uji

21LSD (Least Significant Different).

( ) dnk StLSD .1,211211

=

ji

d ns

nsS

22

+= , VDKs =2

Kriteria pengujian Uji lanjut

211

LSD

Bandingkan antara ix dan jx : ji xx jika 211

>= LSDxxd jiij .

Contoh

Diterapkan model pembelajaran dengan 3 metode, kemudian dilakukan tes dan

diperoleh skor hasil tes sbb:

Sampel ke-

Metode I Metode II Metode III

1 25 22 22 2 29 25 21 3 28 24 26 4 30 25 23



58

a. Dengan anava selidikilah apakah ada perbedaan diantara tiga mean skor

hasil belajar dengan ketiga metode tersebut.

b. Bila terdapat perbedaan, dengan uji lanjut selidikilah model pembelajaran

yang manakah yang terbaik. Gunakan = 5%. Penyelesaian

Diketahui 1x = 28 2x = 24 3x = 23

x = 25

Langkah-langkah Analisis varians:

Merumuskan hipotesis uji

3210 : ==H 1H : paling sedikit ada satu tanda sama dengan tidak berlaku.

Sampel acak dari 3 buah populasi seperti tertera pada soal di atas.

Taraf signifikansi = 5%.. Gunakan statistik F (Fisher)

( ) ( ) ( ) ( ){ } 2813

25232524252841

2221

2

=++=

==

k

xxnVAM

k

jj

( )( )

( ) ( )( ) ( )

( ) ( )( ) ( )

( ) ( )( ) ( )

( )78,3

91

14328232826

28212822

28252824

28252822

28302828

28292825

1

22

22

22

22

22

22

1 1

2

==

++++

++++

+++

=

== =

nk

xxVDK

n

i

k

jjij

41,778,3

28 ===VDKVAMFhitung

Kriteria pengujian.

Terima 0H jika ( )( )1,1; nkkhitung FF Tolak 0H jika ( )( )1,1; > nkkhitung FF



59

( )( ) ( )( ) ( ) 26,49,2;05,0143,13;05,01,1; === FFF nkk Kesimpulan : karena ( )( ) 26,441,7 1,1; =>= nkkhitung FF maka 0H ditolak.

Artinya, ada perbedaan diantara ketiga mean skor hasil belajar dengan

ketiga metode tersebut.

Karena 0H ditolak, maka analisis dilanjutkan dengan Uji Lanjut menggunakan

Uji

211

LSD

3748,1478,3

478,322 =+=+=

jid n

snsS , 78,32 ==VDKs

( ) ( ) ( ) ( )( ) ( )( ) ( ) 11,33748,1.26,2

3748,1.

3748,1..

9,975,0

143,05,02111,2

11211

=====

t

tStLSD dnk

Kriteria pengujian Uji lanjut

211

LSD

Bandingkan antara ix dan jx : ji xx jika 211

>= LSDxxd jiij .

11,3424282112112

=>===

LSDxxd . Berarti 1x > 2x .

11,3523282113113

=>===

LSDxxd . Berarti 1x > 3x .

11,3123242113223

=



60

Jawa Madura Bali 341 360 302 323 300 304 356 296 286 289 223 245 343 250 235 335 296 216 361 284 287 298 200 296 300 208 264 P

rodu

ksi s

usu

(lite

r)

309 231 259 Dengan taraf signifikansi = 5%, selidiki apakah ada perbedaan perbandingan produksi susu sapi di 3 lokasi tersebut? Jika ada perbedaan

manakah yang paling berbeda!

2. Dilakukan pengamatan terhadap hasil tes UAN siswa SMA. Para siswa itu

dikelompokkan dalam 3 kategori (1) SMA Favorit, (2) SMA Negeri, dan (3)

SMA Swasta. Diperoleh data pengamatan sebagai berikut:

No SMA Nilai No SMA Nilai No SMA Nilai 1 favorit 4,25 8 negeri 4,00 15 swasta 4,00 2 favorit 5,00 9 negeri 3,00 16 swasta 3,50 3 favorit 4,75 10 negeri 3,50 17 swasta 3,75 4 favorit 3,75 11 negeri 3,75 18 swasta 3,00 5 favorit 4,50 12 negeri 3,50 19 swasta 3,25 6 favorit 4,25 13 negeri 3,25 20 swasta 3,50 7 favorit 4,00 14 negeri 4,25 21 swasta 2,75

Selidiki apakah ketiga kelompok tersebut memiliki nilai rata-rata UAN yang

sama dengan taraf signifikansi = 5%. 3. Dilakukan penelitian mengenai berat badan mahasiswa berdasarkan sarapan

yang dimakan dari 4 kelompok sampel dan diperoleh data berat badan (dalam

kg) sbb:

Sampel ke-

Mie instan

Nasi Roti Singkong

1 45 46 47 43 2 55 54 58 52 3 40 45 44 40 4 65 64 65 48 5 60 62 63 58 6 58 59 62 60 7 57 54 59 55



61

Dengan taraf signifikansi = 5%, selidiki sarapan manakah yang membuat berat badan mahasiswa lebih tinggi dari yang lain!



62

BAB IV

ANALISIS REGRESI

1. Pendahuluan Metode analisis yang telah dibahas sebelumnya adalah analisis terhadap data

mengenai sebuah karakteristik atau atribut (data kualitatif) dan mengenai

sebuah variabel, diskrit maupun kontinu (data kuantitatif). Namun, kenyataan

yang terjadi, banyak persoalan yang meliputi lebih dari sebuah variabel.

Misalkan, hasil belajar siswa tergantung pada waktu belajar, hasil produksi

padi tergantung pada cuaca serta penggunaan pupuk, dan lain sebagainya.

Oleh karena itu perlu untuk mempelajari analisis data yang terdiri atas banyak

variabel.

Jika dipunyai data yang terdiri atas dua atau lebih variabel, maka dapat

dipelajari bagaimana variabel-variabel tersebut berhubungan. Hubungan yang

diperoleh umumnya dinyatakan dalam bentuk persamaan matematik yang

menyatakan hubungan fungsional antara variabel. Studi yang mmempelajari

hubungan antar variabel ini dikenal dengan analisis regresi.

Tujuan dari bab ini adalah bagaimana menghitung suatu perkiraan atau

persamaan regresi yang akan menjelaskan hubungan antara dua variabel.

Yang akan dibahas adalah regresi garis sederhana, dimana akan dibahas

mengenai hubungan antara dua variabel yang biasanya cukup tepat dinyatakan

dalam suatu garis lurus. Selanjutnya tujuan dari penggunaan persamaan

regresi adalah memperkirakan nilai dari suatu variabel pada nilai tertentu dari

variabel lain dengan kata lain persamaan regresi digunakan untuk peramalan.

2. Hubungan Fungsional Antara Variabel Dalam analisis regresi, variabel akan dibedakan menjadi dua, yaitu variabel

bebas (variabel prediktor) dan variabel takbebas (variabel respon). Variabel

yang mudah diperoleh atau tersedia dapat digolongkan ke dalam variabel



63

bebas sedangkan variabel yang terjadi karena variabel bebas, merupakan

variabel takbebas. Dalam analisis regresi, variabel bebas akan dinyatakan

dengan kXXX ,,, 21 K ( )1k sedangkan variabel takbebas dinyatakan dengan Y.

Telah diketahui bahwa statistika bertujuan untuk menyimpulkan populasi

dengan menggunakan hasil analisis data sampel. Untuk analisis regresi juga

akan ditentukan hubungan fungsional yang diharapkan berlaku untuk populasi

berdasarkan data sampel yang diambil dari populasi yang bersangkutan.

Hubungan fungsional ini akan dituliskan dalam bentuk persamaan matematik

yang disebut dengan persamaan regresi yang akan bergantung pada

parameter-parameter.

Secara umum model atau persamaan regresi untuk populasi dapat ditulis

dalam bentuk

(IV.1) ( )mkxxxy XXXk ,,,,,, 2121,,,. 21 KKK = Dengan m ,,, 21 K parameter-parameter yang ada dalam regresi.

Model regresi sederhana untuk populasi dengan sebuah variabel bebas yang

biasa dikenal dengan regresi linier sederhana adalah

(IV.2) Xxy 21. += Dalam hal ini parameternya adalah 1 dan 2 . Berdasarkan sebuah sampel, akan ditentukan atau ditaksir persamaan regresi

populasi pada rumus (IV.1). Hal ini dapat dilakukan dengan jalan menaksir

parameter-parameter m ,,, 21 K . Untuk kasus regresi linier sederhana, perlu ditaksir parameter 1 dan 2 . Jika

1 dan 2 ditaksir oleh a dan b , maka persamaan regresi berdasarkan sampel adalah

(IV.3) bXaY +=



64

Regresi dengan X merupakan variabel bebas dan Y variabel takbebasnya

dinamakan regresi Y atas X.

Model regresi populasi pangkat dua atau parabola untuk sebuah variabel bebas

dengan parameter 1 , 2 dan 3 adalah (IV.4) 2321. 2 XXxxy ++= Dan berdasarkan sampel acak, parameter-parameter 1 , 2 dan 3 perlu ditaksir dengan persamaan berikut

(IV.5) 2 cXbXaY ++= Dengan a , b dan c masing-masing diperoleh dari perhitungan berdasarkan

data penelitian yang berturut-turut merupakan taksiran untuk 1 , 2 dan 3 .

Berikut cara menentukan persamaan regresi, apabila dimiliki data

pengamatan.

3. Metode Tangan Bebas Metode ini merupakan metode kira-kira dengan menggunakan diagram pencar

(scatter diagram) dengan data yang diperoleh berdasarkan hasil pengamatan.

Jika variabel yang diamati meliputi variabel bebas X dan variabel takbebas Y,

maka data pengamatan yang diperoleh digambarkan pada sebuah diagram

dengan X dinyatakan pada sumbu mendatar dan Y pada sumbu tegak sehingga

terbentuk diagram pencar yang menunjukkan titik-titik tertentu.

Ada dua manfaat dari penggunaan diagram pencar ini yaitu: (1) Membantu

menunjukkan apakah terdapat hubungan yang bermanfaat antara dua variabel,

(2) Membantu menetapkan tipe persamaan yang menunjukkan hubungan

antara kedua variabel tersebut. Seperti yang tertulis dalam manfaat yang

kedua, dari letak titik-titik pada diagram pencar, dapat diperkirakan bentuk

regresinya. Jika letak titik-titik yang terbentuk di sekitar garis lurus, maka

dapat diduga terjadi regresi linier. Namun, hubungan yang terbentuk tidak



65

selalu harus berupa garis lurus. Jika letak titik-titik yang terbentuk di sekitar

garis lengkung, maka dapat diduga terjadi regresi nonlinier.

Hubungan yang tergambar pada diagram pencar dapat berupa hubungan

positif (atau langsung) antar dua variabel yaitu jika variabel bebas meningkat

maka variabel takbebas juga meningkat. Namun, adapula kemungkinan pada

variabel tertentu terdapat hubungan yang negatif (atau berlawanan) yaitu jika

variabel bebas meningkat maka variabel takbebas akan menurun. Atau bahkan

tidak ada hubungan sama sekali antara variabel (titik-titik yang terbentuk pada

diagram pencar tidak menunjukkan pola tertentu).

4. Metode Kuadrat Terkecil Untuk Regresi Linier Metode ini berdasarkan pada kenyataan bahwa jumlah pangkat dua (kuadrat)

dari jarak antara titik-titik dengan garis regresi yang sedang dicari harus

sekecil mungkin.

Untuk pengamatan yang terdiri dari sebuah variabel bebas X dan variabel

takbebas Y di mana model regresi linier untuk populasi seperti rumus (IV.2)

telah dapat diduga, maka perlu ditaksir parameter-parameter regresi sehingga

diperoleh persamaan seperti rumus (IV.3). Jadi untuk populasi, model regresi

linier adalah

Xxy 21. += Harga parameter 1 dan 2 ditaksir oleh a dan b , sehingga persamaan regresi menggunakan data sampel adalah

bXaY +=

Koefisien-koefisien regresi a dan b untuk regresi linier dapat dihitung

dengan rumus



66

(IV.6)

( )( ) ( )( )( )

( )( )( )22

22

2

=

=

ii

iiii

ii

iiiii

XXn

YXYXnb

XXn

YXXXYa

Jika terlebih dahulu dihitung koefisien b , maka koefisien a dapat pula

ditentukan dengan rumus

(IV.7) XbYa = dengan X dan Y masing-masing adalah rata-rata untuk variabel X dan Y.

Dalam regresi linier, koefisien b berarti perubahan rata-rata Y untuk setiap

perubahan satu unit variabel X. Perubahan nilai Y bertambah apabila nilai b

bertanda positif dan berkurang untuk tanda b negatif.

Contoh (Supranto)

Berikut data penjualan dari perusahaan makanan ringan

X : persentase kenaikan biaya iklan

Y : persentase kenaikan hasil penjualan

X 1 2 4 5 7 9 10 12

Y 2 4 5 7 8 10 12 14

Berapakah besarnya ramalan presentase kenaikan penjualan apabila biaya

iklan dinaikkan menjadi 15 %.

Penyelesaian

X Y 2X XY

1 2 1 2

2 4 4 8

4 5 16 20

5 7 25 35

7 8 49 56

9 10 81 90



67

10 12 100 120

12 14 144 168

= 50iX 25,6=X

= 62iY 75,7=Y

= 4202iX = 499iiYX

Untuk menghitung ramalan presentase kenaikan penjualan, terlebih dahulu

dicari persamaan regresi dari data tersebut.

( )( )( )

( ) ( )( )( ) ( ) 04,1860

892504208

62504998222

===

= ii

iiii

XXn

YXYXnb

( ) 25,125,604,175,7 === XbYa Sehingga diperoleh persamaan XbXaY 04,125,1 +=+= Nilai koefisien 04,1=b artinya setiap ada kenaikan 1% biaya iklan, maka hasil penjualan akan naik sebesar 1,04 %.

Persamaan XbXaY 04,125,1 +=+= selanjutnya dapat digunakan untuk meramalkan presentase kenaikan penjualan apabila terjadi perubahan

(kenaikan atau pengurangan) biaya iklan.

Jika biaya iklan dinaikkan menjadi 15 %, maka ramalan presentase kenaikan

penjualan adalah

XY 04,125,1 += dengan X = 15 % diperoleh ( ) 85,161504,125,1 =+=Y . Jadi besarnya ramalan presentase kenaikan penjualan apabila biaya iklan

dinaikkan menjadi 15 % adalah 16,85.

5. Berbagai Varians Sehubungan dengan Regresi Linier Sederhana Untuk analisis selanjutnya tentang regresi linier sederhana, terdapat beberapa

asumsi yang harus diambil.

Asumsi pertama, mengenai kekeliruan prediksi atau galat prediksi atau

perbedaan YYe = yang terjadi, mengingat hasil pengamatan variabel takbebas Y belum tentu sama nilainya dengan harga yang diharapkan yaitu Y

yang diperoleh dari regresi hasil pengamatan (sampel). Dalam populasi, galat



68

prediksi dimisalkan berbentuk variabel acak yang mengikuti distribusi normal

dengan rata-rata nol dan varians 2 . Asumsi kedua, untuk setiap harga X yang diberikan, variabel takbebas Y

independen dan berdistribusi normal dengan rata-rata ( )X21 + dan varians 2

.XY . Varians 2.XY dimisalkan sama untuk setiap X maka dapat dinyatakn oleh varians kekeliruan taksiran ( )2 dan kekeliruan baku taksiran xy. .

5.1. Kesalahan Baku Regresi dan Koefisien Regresi Sederhana Kesalahan baku atau selisih taksir standar merupakan indeks yang

digunakan untuk mengukur tingkat ketepatan regresi dan koefisien regresi

atau mengukur variasi titik-titik observasi di sekitar garis regresi. Dengan

kesalahan baku, batasan seberapa jauh melesetnya perkiraan dalam

meramalkan data dapat diketahui (Hasan, 2010). Apabila semua titik

observasi berada tepat pada garis regresi maka kesalahan baku akan bernilai

sama dengan nol. Hal ini menunjukkan bahwa perkiraan yang dilakukan

pada data pengamatan sesuai dengan data yang sebenarnya.

Berikut rumus yang digunakan untuk menghitung kesalahan baku regresi

dan koefisien regresi.

a. Kesalahan baku untuk regresi

2

.2

=

nXYbYaY

Se

b. Kesalahan baku untuk koefisien regresi a (parameter a )

( )222

=

XXn

SXS ea

c. Kesalahan baku untuk koefisien regresi b (parameter b )

( )nX

X

SS eb 22

=



69

Coba Anda hitung kesalahan baku regresi, koefisien regresi a dan

koefisien regresi b dengan data dari contoh soal sebelumnya!

5.2. Pendugaan Interval Koefisien Regresi

6. Regresi Non Linier Seringkali regresi linier tidak dapat digunakan pada beberapa data karena

hipotesis kelinieran telah ditolak. Hal ini juga dapat dilihat dari bentuk

diagram pencar yang tidak menunjukkan bentuk garis lurus, sehingga model

regresi linier akan menyimpang dari letak titik-titik dalam diagram pencar.

Hal ini perlu diperbaiki dengan menggunakan regresi nonlinier.

Beberapa model regresi nonlinier yang mudah dan sering digunakan, antara

lain:

6.1. Model Parabola kuadratik

Persamaan umum model ini ditaksir oleh

(IV.8) 2 cXbXaY ++= Dengan koefisien-koefisien cba ,, harus ditentukan berdasarkan data

hasil pengamatan. Dengan menggunakan metode kuadrat terkecil, maka

cba ,, dapat dihitung dengan sistem persamaan:

++= 2iii XcXbnaY ++= 32 iiiii XcXbXaYX ++= 4322 iiiii XcXbXaYX

6.2. Model Parabola Kubik


(IV.9) 32 dXcXbXaY +++=



70

Dengan koefisien-koefisien dcba ,,, dihitung dari data pengamatan.

Sistem persamaan yang harus diselesaikan untuk menentukan dcba ,,,

adalah:

+++= 32 iiii XdXcXbnaY +++= 432 iiiiii XdXcXbXaYX +++= 54322 iiiiii XdXcXbXaYX +++= 65433 iiiiii XdXcXbXaYX

Semakin tinggi pangkat X dalam persamaan regresi, maka semakin

banyak pula sistem persamaan yang harus diselesaikan.

6.3. Model Eksponen


(IV.10) XbaY = Bentuk ini dapat dikembalikan kepada model linier apabila diambil

logaritmanya. Dalam logaritma persamaannya akan menjadi

(IV.11) ( )XbaY logloglog += Apabila diambil YY log = , aa log= , dan bb log= , maka diperoleh model XbaY += yang adalah model linier seperti pada rumus (IV.3). dengan rumus (IV.6), maka a dan b dapat dihitung, selanjutnya karena

aa log= dan bb log= , maka a dan b juga dapat dihitung. Dalam logaritma, maka a dan b dapat dicari dari rumus

(IV.12) ( )

=

nX

bn

Ya ii log

loglog

( ) ( )( )( )

= 22

logloglog

ii

iiii

XXn

YXYXnb



71

Model eksponensial dalam rumus XbaY = sering pula disebut model pertumbuhan karena sering digunakan dalam menganalisis data hasil

pengamatan yang berhubungan dengan fenomena yang sifatnya tumbuh.

Dalam hal ini, model persamaannya menjadi

(IV.13) bXeaY = dengan e adalah bilangan pokok logaritma asli.

6.4. Model Geometrik


(IV.14) bXaY = Bentuk ini dapat dikembalikan kepada model linier dan apabila diambil

logaritmanya, maka

(IV.15) XbaY logloglog += Bentuk ini merupakan model linier dalam Xlog dan Ylog . Koefisien a

dan b dapat dihitung dari:

(IV.16)

=

nX

bn

Ya ii

logloglog

( ) ( )( )( )

= 22 log)log(loglogloglog

ii

iiii

XXn

YXYXnb

6.5. Model Logistik

Model paling sederhana model logistik dapat ditaksir oleh

(IV.17) XabY 1 =

Untuk Y yang tidak sama dengan nol, maka bentuk di atas dapat pula

ditulis sebagai XabY

=1 .

Jika diambil logaritmanya, diperoleh



72

(IV.18) ( )XbaY

loglog1log +=

Yang merupakan model linier dalam variabel-variabel X dan

Y1log .

Koefisien-koefisien a dan b dapat dicari dengan menggunakan rumus

(IV.19) ( )

=

nX

bn

Ya ii log

loglog

( ) ( )( )( )

= 22

logloglog

ii

iiii

XXn

YXYXnb

Dengan Ylog diganti oleh

Y1log .

6.6. Model Hiperbola

Persamaan umum yang sederhana untuk model hiperbola dapat dituliskan

dalam bentuk

(IV.20) bXa

Y +=1

Atau jika tidak ada Y berharga nol dapat ditulis menjadi

(IV.21) bXaY

+=1

Yang merupakan bentuk linier dalam variabel-variabel X dan Y1 .

Koefisien-koefisien a dan b dapat dihitung dengan rumus

(IV.22) ( )( ) ( )( )

( )

= 22

2

)( ii

iiiii

XXn

YXXXYa

( ) ( )( )( )

= 22 )( iiiiii

XXn

YXYXnb

Apabila variabel Y diganti oleh Y1 .



73

7. Regresi Linier Ganda Sebelumnya telah dibahas hubungan linear dari dua variabel X dan Y dengan

menggunakan persamaan regresi linier bXaY += . Dalam kenyataan, banyak data pengamatan yang terjadi dengan melibatkan

lebih dari dua variabel. Misalnya hasil panen padi (Y) dipengaruhi oleh

penggunaan pupuk ( 1X ), luas sawah ( 2X ) dan curah hujan ( 3X ). Secara

umum, data hasil pengamatan Y dapat terjadi atau dipengaruhi oleh variabel-

variabel bebas kXXX ,,, 21 K .

Akan ditentukan hubungan antara Y dan kXXX ,,, 21 K sehingga diperoleh

regresi antara Y dan kXXX ,,, 21 K . Yang akan ditinjau hanyalah garis regresi

sederhana yang dikenal dengan nama regresi linier berganda. Model regresi

linier ganda atas kXXX ,,, 21 K akan ditaksir oleh

(IV.23) kk XbXbXbaY ++++= K2211 dengan kbbba ,,,, 21 K merupakan koefisien-koefisien yang harus ditentukan

berdasarkan data pengamatan. Perhatikan bahwa regresi linier bXaY += merupakan hal istimewa dari rumus (IV.23) untuk 021 ===== kbbba K .

Koefisien-koefisien kbbba ,,,, 21 K ditentukan dengan menggunakan metode

kuadrat terkecil (Least Square Method) yang menghasilkan persamaan normal

sebagai berikut

(IV.24) =++++ YXbXbXban kkK2211 =++++ YXXXbXXbXbXa kk 112122111 K =++++ YXXXbXbXXbXa kk 222221212 K

M

=++++ YXXbXXbXXbXa kkkkkk 22211 K Bila persamaan tersebut diselesaikan, maka akan diperoleh nilai

kbbba ,,,, 21 K . Kemudian dapat dibentuk persamaan regresi berganda.



74

Apabila persamaan regresi telah diperoleh, maka dapat diramalkan nilai Y

dengan syarat bila nilai kXXX ,,, 21 K sebagai variabel bebas sudah

diketahui.

Sama halnya dengan regresi linier, dalam regresi linier ganda perubahan rata-

rata Y memperhatikan nilai dan tanda koefisien dari masing-masing variabel

X. Pada rumus (IV.23) maka koefisien 1b menyatakan perubahan rata-rata Y

untuk setiap perubahan satu unit variabel 1X apabila kXXX ,,, 32 K

semuanya dianggap tetap. Koefisien 2b menyatakan perubahan rata-rata Y

untuk setiap perubahan satu unit variabel 2X apabila kXXX ,,, 31 K

semuanya dianggap tetap, demikian seterusnya. Jelas bahwa setiap koefisien

hanya memberikan gambaran parsial apa yang terjadi pada Y untuk perubahan

X yang berhubungan dengan koefisien yang bersesuaian. Oleh karena itu

koefisien-koefisien kbbba ,,,, 21 K disebut pula koefisien regresi parsial.

Contoh (Supranto)

Perhatikan file PDF

LATIHAN 1. Dengan menggunakan persamaan garis regresi bXaY += , hitunglah ramalan

nilai Y jika X = 16 dari kedua data berikut a.

X 2 4 3 8 9 10 15 13

Y 1 2 5 7 8 11 13 14

b. X 1 3 4 7 9 11 13

Y 12 11 9 8 6 5 4

2. Berikut data nilai hasil ujian mahasiswa matematika Unnes

X : nilai hasil ujian Kalkulus mahasiswa matematika Unnes



75

Y : nilai hasil ujian Statistika mahasiswa matematika Unnes

X 7 6 8 9 10 5 4 9 7 3

Y 6 8 9 7 9 6 5 8 8 4

a. Dengan menggunakan persamaan regresi, berapakah nilai ujian Statistika

jika nilai ujian Kalkulus yang diperoleh sebesar 8,5.

b. Tuliskan persamaan regresi linier sederhana, berapakah besarnya nilai

koefisien regresi? Jelaskan arti dari nilai-nilai tersebut!

c. Tentukan kesalahan baku regesi, koefisien regresi a dan koefisien regresi

b .

d. Dalam soal ini bolehkan variabel Y memiliki nilai negatif? Berikan alasan

Anda!

3. Dipunyai kumpulan data berikut

X ni XXXX ,,,,, 21 KK

Y ni YYYY ,,,,, 21 KK

Jika ( )( )

( )

= 2XX

YYXXb

i

ii dan XbYa =

dengan = iXnX 1 dan = iYnY 1 Tunjukkan bahwa:

a. ( )( )( )22

=ii

iiii

XXn

YXYXnb

b. ( )=

=n

ii XbaY

1

0

4. Sebuah perusahaan mencatat hasil penjualan dari tahun ketahun sebagai

berikut. Tahun 1980 1981 1982 1983 1984 1985 1986

Hasil Penjualan

(jutaan Rp)

83 60 54 21 22 13 13



76

Terlihat adanya kemunduran dalam hasil penjualan tersebut. Dengan menggunakan trend parabola 2 cXbXaY ++= , hitung berapa ramalan hasil penjualan untuk tahun 1987 dan 1988? Gambarkan grafik Y dan Y dalam satu gambar!

5. Perhatikan data berikut

X : harga barang perunit dalam ribuan rupiah

Y : hasil penjualan barang X dalam jutaan rupiah

X 20 35 60 100 150 300 500 800

Y 150 125 105 100 92 77 62 58

Dengan menggunakan trend eksponensial XbaY = , berapakah ramalan hasil penjualan jika X = 900!

6. Perkembangan jumlah pabrik pada suatu daerah selama 6 tahun adalah sebagai berikut.

Tahun 1981 1982 1983 1984 1985 1986

Banyaknya pabrik 4 8 12 18 18 20

Dengan menggunakan trend logistik XabY 1 = , hitung ramalan banyaknya

pabrik yang dibangun pada tahun 1987?

7. PT ANGIN MOBAT MABIT menerapkan stategi promosi untuk meningkatkan pendapatan penjualan mesin jahit. Akan dilihat pengaruh iklan melalui televisi dan koran terhadap pendapatan. Berikut data mingguan yang tercatat:

Iklan TV (juta rupiah)

Iklan Koran (juta rupiah)

Pendapatan (juta rupiah)

1 2 4 6 7 9

2 4 5 7 8

10

1 3 6 8 9

11

Dengan menggunakan persamaan regresi linier berganda, berapakah ramalanpendapatan penjualan mesin jahit jika promosi dengan Iklan TV sebesar 10 juta rupiah dan promosi dengan Iklan koran sebesar 12 juta rupiah!



77

BAB V

ANALISIS KORELASI

1. Pendahuluan Jika data hasil pengamatan terdiri dari banyak variabel, maka hal yang perlu

diketahui berikutnya adalah seberapa kuat hubungan antara variabel-variabel

tersebut terjadi. Dengan kata lain, perlu ditentukan derajat hubungan antara

variabel-variabel. Studi yang membahas tentang derajat hubungan antara

variabel dikenal dengan nama analisis korelasi. Sedangkan ukuran yang

digunakan untuk mengetahui derajat hubungan, terutama untuk data

kuantitatif, dinamakan koefisien korelasi.

Adanya hubungan (korelasi) antara variabel yang satu dengan variabel lainnya

dapat dinyatakan dengan perubahan nilai variabel. Dalam bab ini hanya akan

dibahas mengenai hubungan linier antara dua variabel X dan Y .

Apabila dua variabel X dan Y mempunyai hubungan, maka nilai variabel X

yang sudah diketahui dapat digunakan untuk memperkirakan/menaksir atau

meramalkan Y. Ramalan pada dasarnya merupakan perkiraan/taksiran

mengenai terjadinya suatu kejadian (nilai suatu variabel) untuk waktu

mendatang, misalnya ramalan harga beras bulan depan, ramalan jumlah

penduduk 10 tahun mendatang, dan lain sebagainya.

Serupa dengan analisis regresi, variabel Y yang nilainya akan diramalkan

disebut variabel takbebas, sedangkan variabel X yang nilainya digunakan

untuk meramalkan nilai Y disebut variabel bebas atau variabel peramal

(predictor) atau sering disebut variabel yang menerangkan (explanatory).

2. Koefisien Korelasi



78

Hubungan dua variabel dapat merupakan hubungan positif maupun negatif.

Hubungan X dan Y dikatakan positif apabila kenaikan (penurunan) X pada

umumnya diikuti oleh kenaikan (penurunan) Y. Sebaliknya dikatakan negatif

jika kenaikan (penurunan) X pada umumnya diikuti oleh penurunan

(kenaikan) Y.

Jika antara variabel X dan Y ada hubungan, bentuk diagram pencarnya akan

mulus/teratur. Apabila terdapat hubungan positif, maka diagram pencar akan

bergerak dari kiri bawah ke kanan atas, sedangkan apabila terdapat hubungan

negatif, maka diagram pencar akan bergerak dari kiri atas ke kanan bawah.

Bila bentuk diagram pencar tidak teratur, artinya kenaikan/penurunan X pada

umumnya tidak diikuti oleh naik turunnya Y, dikatakan X dan Y tidak

berkorelasi. Atau dengan kata lain, X dan Y dikatakan saling bebas

(independent) jika naik dan turunnya varianel X tidak mempengaruhi Y atau

antara X dan Y tidak ada hubungan atau hubungnnya sangat lemah sehingga

dapat diabaikan.

Apabila hubungan X dan Y dapat dinyatakan dengan fungsi linier, maka kuat

hubungan antara X dan Y diukur dengan suatu nilai yang disebut Koefisien

Korelasi. Nilai koefisien korelasi.ini paling sedikit -1 dan paling besar 1. Jika

r adalah koefisien korelasi,maka nilai r dapat dinyatakan sebagai



79

11 r Jika

1=r , hubungan X dan Y sempurna dan positif (mendekati 1, hubungan sangat kuat dan positif)

1=r , hubungan X dan Y sempurna dan negatif (mendekati -1, hubungan sangat kuat dan negatif)

0=r , hubungan X dan Y lemah sekali atau tidak ada hubungan.

X dikatakan mempengaruhi Y, jika perubahan nilai X menyebabkan adanya

perubahan nilai Y, artinya naik turunnya nilai X akan mengakibatkan naik

turunnya nilai Y, sehingga nilai Y akan bervariasi. Namun, naik turunnya nilai

Y tidak hanya disebabkan oleh variabel X, karena masih ada faktor lain yang

menyebabkannya. Misalnya naik turunnya hasil panen padi (Y) dipengaruhi

oleh penggunaan pupuk ( 1X ), namun juga dapat dipengaruhi faktor-faktor

lain misalnya luas sawah, curah hujan dan lain-lain. Selanjutnya dapat

dihitung besar kontribusi dari X terhadap naik turunnya nilai Y dengan suatu

koefisien yang disebut koefisien penentuan/koefisien determinasi (coefficient

of determination).

Jika koefisien determinasi ditulis KD, maka untuk menghitung KD sebagai

berikut

2rKD = Besar koefisien determinasi menunjukkan besarnya sumbangan variabel bebas

terhadap variabel takbebas. Total nilai koefisien determinasi sebesar 100 %,

jika koefisien determinasi bernilai kurang dari 100 % maka sisanya

dipengaruhi oleh faktor lain.

Cara menghitung r adalah sebagai berikut

Rumus 1

==

==n

ii

n

ii

n

iii

yx

yxr

1

2

1

2

1



80

XXx ii = =

=n

iiXn

X1

1

YYy ii = =

=n

iiYn

Y1

1

atau

Rumus 2

= == =

===

=

n

i

n

iii

n

i

n

iii

n

ii

n

ii

n

iii

YYnXXn

YXYXnr

1

2

1

2

1

2

1

2

111

Contoh (Supranto)

Berikut data penjualan dari perusahaan makanan ringan

X : persentase kenaikan biaya iklan

Y : persentase kenaikan hasil penjualan

X 1 2 4 5 7 9 10 12

Y 2 4 5 7 8 10 12 14

Hitunglah r!

Penyelesaian

Untuk menghitung r, dibuat tabel berikut

Dengan rumus 1 X Y

( )xXX

( )yYY

2x 2y xy

1 2 - 5,25 - 5,75 27,5625 33,0625 30,1875

2 4 - 4,25 - 3,75 18,0625 14,0625 15,9375

4 5 - 2,25 - 2,75 5,0625 7,5625 6,1875

5 7 - 1,25 - 0,75 1,5625 0,5625 0,9375

7 8 0,75 0,25 0,5625 0,0625 0,1875

9 10 2,75 2,25 7,5625 5,0625 6,1875

10 12 3,75 4,25 14,0625 18,0625 15,9375



81

12 14 5,75 6,25 33,0625 39,0625 35,9375

= 50iX 25,6=X

= 62iY 75,7=Y

= 0ix

= 0iy

= 5,1072ix

= 5,1172iy

= 5,111ii yx

99,0389,1125,111

5,1175,1075,111

1

2

1

2

1 ====

==

=n

ii

n

ii

n

iii

yx

yxr

Hubungan antara X dan Y sebesar 0,99 yang menunjukkan hubungan yang

sangat kuat dan positif, artinya kenaikan biaya iklan pada umumnya

menaikkan hasil penjualan.

Koefisien determinasi %989801,02 === rKD artinya sumbangan iklan terhadap variasi Y (naik turunnya hasil penjualan) adalah 98 %, dan 2 %

sisanya disebabkan oleh faktor-faktor lainnya.

Dengan rumus 2

X Y 2X 2Y XY

1 2 1 4 2

2 4 4 16 8

4 5 16 25 20

5 7 25 49 35

7 8 49 64 56

9 10 81 100 90

10 12 100 144 120

12 14 144 196 168

= 50iX = 62iY = 4202iX = 5982iY = 499iiYX



82

= == =

===

=

8

1

28

1

28

1

28

1

2

8

1

8

1

8

1

88

8

i iii

i iii

ii

ii

iii

YYXX

YXYXr

( ) ( )( )( ) ( ) ( ) ( )22 625988504208

62504998

=r

99,0075,899

892940860

892 ===

3. Korelasi Rank (Peringkat) Misalkan ada dua orang Adi dan Bayu yang sama-sama minuman ringan

dalam kemasan. Kedua orang tersebut diminta untuk memberikan penilaian

terhadap 10 merk minuman ringan dalam kemasan. Minuman ringan yang

paling digemari diberi nilai 1 dan seterusnya sampai minuman ringan yang

tidak disenangi diberi nilai 10. Sehingga dalam hal ini Adi dan Bayu

memberikan rank (peringkat) terhadap merk minuman ringan tersebut.

Pemberian peringkat ini dapat juga dibalik, minuman ringan yang paling

digemari diberi nilai 10 dan seterusnya sampai yang tidak disenangi diberi

nilai 1. Diperoleh hasil pemberian rank sebagai berikut

No Merk Minuman Ringan Rank dari Adi Rank dari Bayu 1 Coca Cola 9 8 2 Fanta 5 3 3 Sprite 10 9 4 Frestea 1 2 5 Mizone 8 7 6 Pulpy Orange 7 10 7 Teh Sosro 3 4 8 Pepsi Blue 4 6 9 Fruittea 2 1

10 Tebs 6 5

Untuk menghitung koefisien korelasi antara rank dari Adi dan Bayu terhadap

10 merk minuman ringan dalam kemasan tersebut digunakan Koefisien

Korelasi Rank (Rank Spearman).



83

( )161 22

=nn

dr irank

dimana

id = selisih dari pasangan rank ke-i

n = banyaknya pasangan rank (dalam hal ini n = 10)

Contoh

Carilah koefisien korelasi rank antara rank Adi dan Bayu dalam menilai 10

merk minuman ringan.

Penyelesaian

Rank Adi 8 3 9 2 7 10 4 6 1 5

Rank Bayu 9 5 10 1 8 7 3 4 2 6

Selisih Rank (d) -1 -2 -1 1 -1 3 1 2 -1 -1 2d 1 4 1 1 1 9 1 4 1 1

Sehingga

( ) ( )( ) 85,08545,01455,01110010 114161161 22

===++++==

Knn

dr irank

Jadi, koefisien korelasi rank antara rank Adi dan Bayu dalam menilai 10 merk

minuman ringan sebesar 0,85.

Contoh (Supranto, 1992: 159)

Ada 10 calon sales yang diuji mengenai teknik penjualan. Setelah mereka

selesai diuji kemudian ditugaskan untuk melakukan penjualan. Diperoleh data

hasil ujian (X) dan hasil penjualan tahun pertama (Y). Nilai X dan Y dari 10

sales termasuk rank-nya adalah sebagai berikut.

Sales Nilai Ujian (X)

Rank Hasil Penjualan

(Y)

Rank Selisih Rank (d)

2d

A 48 3 312 2 1 1 B 32 6 164 8 -2 4 C 40 5 280 4 1 1 D 34 7 196 7 0 0



84

E 30 8 200 6 2 4 F 50 1,5 288 3 -1,5 2,25 G 26 9 146 10 -1 1 H 50 1,5 361 1 0,5 0,25 I 22 10 149 9 1 1 J 43 4 252 5 -1 1

Karena F dan H memiliki nilai yang sama maka rank mereka harus sama yaitu

5,12

21 =+ . Mula-mula F diberi nilai 1 dan H diberi nilai 2 (atau sebaliknya, kemudian dirata-rata). Apabila terdapat 3 objek yang memiliki nilai yang

sama, maka diurutkan dan dicari rata-ratanya.

Sehingga

( ) ( )( ) 9061,00939,01110010 114161161 22

==++++==

Knn

dr irank

Jadi, koefisien korelasi rank antara rank nilai ujian dan hasil penjualan sebesar

0,9061.

LATIHAN

1. Berikan contoh pasangan variabel yang memiliki hubungan positif dan

negatif.

2. Tentukan apakah hubungan variabel X dan Y berikut positif atau negatif.

Hitung nilai koefisien korelasi dan koefisien determinasi kemudian

interpretasikan hasilnya.

a. X 2 4 3 8 9 10 15 13

Y 1 2 5 7 8 11 13 14

b. X 1 3 4 7 9 11 13

Y 12 11 9 8 6 5 4



85

3. Berikut data nilai hasil ujian mahasiswa matematika Unnes

X : nilai hasil ujian Kalkulus mahasiswa matematika Unnes

Y : nilai hasil ujian Statistika mahasiswa matematika Unnes

X 7 6 8 9 10 5 4 9 7 3

Y 6 8 9 7 9 6 5 8 8 4

Hitung nilai koefisien korelasi dan koefisien determinasi kemudian

interpretasikan hasilnya.

4. Amat dan Budi diminta untuk memberikan rank berdasarkan suka dan

tidaknya terhadap merk rokok tertentu. Rokok yang paling disenangi diberi

nilai 10 dan yang paling tidak disenangi diberi nilai 1. Diperoleh hasil rank

sebagai berikut.

No Merk Rokok Rank dari Amat Rank dari Budi 1 AAA 2 9 2 BBB 10 4 3 CCC 8 3 4 DDD 3 6 5 EEE 4 5 6 FFF 1 7 7 GGG 5 8 8 HHH 2 6

Hitung koefisien korelasi rank berdasarkan data tersebut!

5. Tabel berikut menunjukkan nilai 10 mahasiswa yang telah berbentuk rank,

yang diperoleh dari hasil ujian kuliah Statistika dan Praktikum. Carilah

korelasi ranknya.

Praktikum 8 3 9 2 7 10 4 6 1 5

Statistika 9 5 10 1 8 7 3 4 2 6



86

DAFTAR PUSTAKA

Hasan, I. 2001. Pokok-Pokok Materi Statistik 2 (Statistik Inferensif). Edisi Kedua.

Bumi Aksara. Jakarta.

Sudjana. 1996. Metoda Statistika Edisi ke 6. Penerbit Tarsito. Bandung.

Sugiyono. 2005. Statistik Untuk Penelitian. Penerbit Alfabeta. Bandung.

Supranto, J. 1992. Statistik Teori dan Aplikasi. Jilid 1. Erlangga. Jakarta.

Walpole, R & Myers, R. 1986. Ilmu Peluang dan Statistika Untuk Insinyur dan

Ilmuan. Terjemahan. Penerbit ITB. Bandung.

Documents

STATISTIKA INFERENSIAL 1