6
08/11/2013 1 STATISTIKA INDUSTRI 2 TIN 4004 Pertemuan 8 Outline: Regresi Linier Sederhana dan Korelasi (Simple Linier Regression and Correlation) Referensi: Montgomery, D.C., Runger, G.C., Applied Statistic and Probability for Engineers, 5 th Ed. John Wiley & Sons, Inc., 2011. Walpole, R.E., Myers, R.H., Myers, S.L., Ye, K., Probability & Statistics for Engineers & Scientists , 9 th Ed. Prentice Hall, 2012. Introduction to Linier Regression Dasar: studi mengenai hubungan dua atau lebih variabel Deterministik linier: Single variable: = + Multiple variable: = + + : Dependent Variable / responses : Independent Variable / regressors 0 = 1 = Introduction to Linier Regression Introduction to Linier Regression Kondisi nyata: sangat jarang terjadi deterministik linier Contoh: Konsumsi energi rumah tangga, dipengaruhi oleh ukuran rumah Pemakaian BBM, dipengaruhi berat muatan ANALISA REGRESI: Pertama kali digunakan oleh Sir Francis Galton, untuk studi keterkaitan tinggi seorang ayah dan anak laki-laki-nya. Tool statistik yang digunakan untuk memodelkan dan mengeksplorasi hubungan antara variabel yang nondeterministik Digunakan untuk melakukan peramalan / prediksi, optimasi Simple Linear Regression (SLR) Model

STATISTIKA INDUSTRI 2 - · PDF fileContoh Soal • Berdasarkan data ... oleh variabel X •Nilai korelasi 0.6, ... –Regresi linier berganda dan korelasi –Regresi nonlinier

Embed Size (px)

Citation preview

Page 1: STATISTIKA INDUSTRI 2 -  · PDF fileContoh Soal • Berdasarkan data ... oleh variabel X •Nilai korelasi 0.6, ... –Regresi linier berganda dan korelasi –Regresi nonlinier

08/11/2013

1

STATISTIKA INDUSTRI 2

TIN 4004

Pertemuan 8

• Outline: – Regresi Linier Sederhana dan Korelasi (Simple

Linier Regression and Correlation)

• Referensi: – Montgomery, D.C., Runger, G.C., Applied Statistic

and Probability for Engineers, 5th Ed. John Wiley & Sons, Inc., 2011.

– Walpole, R.E., Myers, R.H., Myers, S.L., Ye, K., Probability & Statistics for Engineers & Scientists , 9th Ed. Prentice Hall, 2012.

Introduction to Linier Regression

• Dasar:

– studi mengenai hubungan dua atau lebih variabel

– Deterministik linier:

• Single variable: 𝒀 = 𝜷𝟎 + 𝜷𝟏𝒙

• Multiple variable: 𝒀 = 𝜷𝟎 + 𝜷𝟏𝒙𝟏 + 𝜷𝟐𝒙𝟐

• 𝑌 : Dependent Variable / responses

• 𝑥 : Independent Variable / regressors

• 𝛽0 = 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡

• 𝛽1 = 𝑠𝑙𝑜𝑝𝑒

Introduction to Linier Regression

Introduction to Linier Regression

• Kondisi nyata: sangat jarang terjadi deterministik linier – Contoh:

• Konsumsi energi rumah tangga, dipengaruhi oleh ukuran rumah

• Pemakaian BBM, dipengaruhi berat muatan

• ANALISA REGRESI: – Pertama kali digunakan oleh Sir Francis Galton, untuk studi

keterkaitan tinggi seorang ayah dan anak laki-laki-nya.

– Tool statistik yang digunakan untuk memodelkan dan mengeksplorasi hubungan antara variabel yang nondeterministik

– Digunakan untuk melakukan peramalan / prediksi, optimasi

Simple Linear Regression (SLR) Model

Page 2: STATISTIKA INDUSTRI 2 -  · PDF fileContoh Soal • Berdasarkan data ... oleh variabel X •Nilai korelasi 0.6, ... –Regresi linier berganda dan korelasi –Regresi nonlinier

08/11/2013

2

Simple Linear Regression (SLR) Model

ϵ : random error; dengan mean = 0, 𝜎2 tidak diketahui

n : jumlah observasi

Simple Linear Regression (SLR) Model

• Karl Gauss: mengusulkan cara estimasi 𝛽0 dan 𝛽1, sehingga meminimasi sum of square deviasi vertikal

• Estimasi 𝛽0 dan 𝛽1 pada SLR:

Simple Linear Regression (SLR) Model

Simple Linear Regression (SLR) Model

• Variansi (σ2) titik observasi: variasi error pada persamaan regresi linier

• σ2 diestimasikan dengan s2

Contoh Soal

• Berdasarkan data tabel di atas (pengaruh hydrocarbon terhadap purity / kemurnian udara):

Contoh Soal

Hitung s2 nya!

Page 3: STATISTIKA INDUSTRI 2 -  · PDF fileContoh Soal • Berdasarkan data ... oleh variabel X •Nilai korelasi 0.6, ... –Regresi linier berganda dan korelasi –Regresi nonlinier

08/11/2013

3

Latihan Soal • Estimasikan persamaan garis regresi untuk data pada tabel di

bawah ini (hitung pula estimasi variansi errornya).

Latihan Soal • Misalnya X adalah persentase kenaikan biaya periklanan dan Y

adalah persentase kenaikan hasil penjualan. Berapakah besarnya ramalan persentase kenaikan penjualan jika biaya iklan dinaikkan menjadi 15%? Tentukan variansi (kesalahan baku) regresi linier yang terbentuk.

X (%) Y (%)

1 2

2 4

4 5

5 7

7 8

9 10

10 12

Uji Hipotesa pada SLR

• Menggunakan Uji-t

• Dilakukan untuk menduga nilai parameter model regresi dan membentuk confidence intervals

• Asumsi ϵ berdistribusi normal

• Pengujian yang dilakukan:

𝐻0: 𝛽0 = 𝛽00

𝐻1: 𝛽0 ≠ 𝛽00

𝛽00 : konstanta

𝐻0: 𝛽1 = 0

𝐻1: 𝛽1 ≠ 0

𝐻0: 𝛽1 = 𝛽10

𝐻1:𝛽1 ≠ 𝛽10 𝐻1: 𝛽1 > 𝛽10 𝐻1: 𝛽1 < 𝛽10

𝛽10 : konstanta

𝑠2

• T hitung:

• Daerah penolakan:

Uji Hipotesa pada SLR

Degree of freedom = n – 2

𝐻0: 𝛽1 = 𝛽10 𝐻1: 𝛽1 ≠ 𝛽10 𝐻1: 𝛽1 > 𝛽10 𝐻1: 𝛽1 < 𝛽10

vs

𝑡0 > 𝑡α,𝑛−2 𝑡0 < −𝑡α,𝑛−2

• T hitung:

• Daerah penolakan:

Uji Hipotesa pada SLR

𝐻0: 𝛽1 = 0 𝐻1: 𝛽1 ≠ 0 vs

𝑇0 =𝛽 1

𝑠2 𝑆𝑥𝑥

Degree of freedom = n – 2

• T hitung:

• Daerah penolakan:

Uji Hipotesa pada SLR

𝐻0: 𝛽0 = 𝛽00 𝐻1: 𝛽0 ≠ 𝛽00 𝐻1: 𝛽0 > 𝛽00 𝐻1: 𝛽0 < 𝛽00

vs

Degree of freedom = n – 2

𝑡0 > 𝑡α,𝑛−2 𝑡0 < −𝑡α,𝑛−2

𝑇0 =𝛽 0 − 𝛽00

𝑠2 𝑥𝑖2 (𝑛𝑆𝑥𝑥 )𝑛

1

Page 4: STATISTIKA INDUSTRI 2 -  · PDF fileContoh Soal • Berdasarkan data ... oleh variabel X •Nilai korelasi 0.6, ... –Regresi linier berganda dan korelasi –Regresi nonlinier

08/11/2013

4

Uji Hipotesa pada SLR

• Jika 𝐻0 diterima, artinya tidak ada hubungan linier antara x dan Y.

• Jika 𝐻0 diterima, artinya x sedikit mempengaruhi variasi nilai Y, dengan estimator terbaik untuk Y oleh setiap nilai x adalah 𝑦 = 𝑌. (gambar a)

• Jika 𝐻0 diterima, memang benar antara x dan Y tidak ada hubungan linier. (gambar b)

𝐻0: 𝛽1 = 0 𝐻1: 𝛽1 ≠ 0 vs

Uji Hipotesa pada SLR

• Jika 𝐻0 ditolak, artinya x memilik pengaruh pada variabilitas nilia Y.

• Jika 𝐻0 ditolak, artinya terdapat cukup hubungan linier antara x dan Y . (gambar a)

• Jika 𝐻0 ditolak, artinya terdapat hubungan linier antara x dan Y, namun lebih tepat digambarkan dengan hubungan polynomial yang lain (gambar b).

𝐻0: 𝛽1 = 0 𝐻1: 𝛽1 ≠ 0 vs

• Lakukan uji hipotesa pada parameter slope tidak sama dengan nol untuk model regresi linier pengaruh hydrocarbon terhadap purity / kemurnian udara di atas (diketahui 𝛼 = 0,01).

Uji Hipotesa pada SLR: Latihan Soal

Pendugaan Interval Koefisien Regresi (Slope & Intercept)

Contoh Soal • Berdasarkan data tabel pengaruh hydrocarbon terhadap

purity / kemurnian udara, carilah dugaan interval slope-nya:

– Jika menggunakan confidence interval (tingkat kepercayaan) 95%, maka:

𝜎 2 = 𝑠2 =

(𝑦𝑖 − 𝑦 )2−𝛽 1𝑛𝑖=1 𝑆𝑥𝑦

𝑛 − 2= 1,18

Latihan Soal Confidence Interval

• Tentukan interval dari parameter intercept dan slope pada biaya periklanan dan kenaikan penjualan berikut, dengan α = 5% atau tingkat keyakinan 95% dan jelaskan artinya!

X (%) Y (%)

1 2

2 4

4 5

5 7

7 8

9 10

10 12

Page 5: STATISTIKA INDUSTRI 2 -  · PDF fileContoh Soal • Berdasarkan data ... oleh variabel X •Nilai korelasi 0.6, ... –Regresi linier berganda dan korelasi –Regresi nonlinier

08/11/2013

5

Peramalan (Prediction) Terhadap Rata-rata Respon (Y) • Berdasarkan data tabel pengaruh hydrocarbon terhadap

purity / kemurnian udara, carilah interval prediksi untuk Y, dengan 𝑥0 = 1,00%

– Sebelumnya telah diperoleh persamaan regresi

– Sehingga = 89,23

– Interval prediksi Y:

Contoh Soal

Peramalan (Prediction) terhadap Single Respon (Y)

To reflect error of precdict future observed response

• Berdasarkan data tabel pengaruh hydrocarbon terhadap purity / kemurnian udara, carilah interval prediksi untuk Y, dengan 𝑥0 = 1,00%

– Sebelumnya telah diperoleh persamaan regresi

– Sehingga 𝑦0 = 89,23

– Interval prediksi Y:

Contoh Soal

Latihan Soal Prediction

Dengan menggunakan data dari tabel biaya iklan dan kenaikan penjualan (di atas),

Buatlah:

a. Ramalan interval untuk individu Y, jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%!

b. Ramalan interval untuk rata-rata E(Y), jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%!

Correlation

• Analisa korelasi: – Menggambarkan hubungan antara variable 𝑋 dan 𝑌

• Jika nilai 𝑋 besar maka nilai 𝑌 besar, dan sebaliknya. Contoh: 𝑋 = fasilitas belajar, 𝑌 = prestasi siswa.

• Jika nilai 𝑋 besar maka nilai 𝑌 kecil, dan sebaliknya. Contoh: 𝑋 = usia pakai mobil, 𝑌 = nilai jual mobil.

– Note: • Korelasi tidak secara otomatis menunjukkan adanya hubungan

kausalitas / sebab akibat atau timbal balik • Contoh:

– tinggi badan menyebabkan berat badanya bertambah, tetapi berat badannya bertambah belum tentu menyebabkan tinggi badannya bertambah.

– kemiskinan dengan kebodohan – kebersihan dengan kesehatan

Page 6: STATISTIKA INDUSTRI 2 -  · PDF fileContoh Soal • Berdasarkan data ... oleh variabel X •Nilai korelasi 0.6, ... –Regresi linier berganda dan korelasi –Regresi nonlinier

08/11/2013

6

Scatter Diagram of Correlation

31

• Analisa korelasi: – Population coefficient correlation = ρ

– Menggunakan sample coefficient correlation

– Disebut juga Pearson product-moment correlation coefficient.

– 𝑟 bernilai antara -1 dan +1.

– Hati-hati dalam mengintrepertasikan nilai 𝑟. Nilai 𝑟 = 0.3 dan 𝑟 = 0.6, bukan berarti hubungan X dan Y kedua 2x lipat X dan Y pertama.

Correlation

Correlation

– Sample coefficient of determination

– Menunjukkan proporsi total variasi pada nilai variabel Y yang dapat digambarkan secara linier oleh variabel X • Nilai korelasi 0.6, berarti terdapat 36% variasi nilai Y

dalam sample yang dipengaruhi secara linier oleh nilai X

Latihan Soal

• Hitung koefisien korelasi-nya dan intrepertasikan.

Pertemuan 9 - Persiapan

• Materi

–Regresi linier berganda dan korelasi

–Regresi nonlinier