Upload
others
View
16
Download
0
Embed Size (px)
Citation preview
PENDUGAAN MODEL FUNGSI SURVIVOR
Skripsi
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Sains
Program Studi Matematika
Oleh :
Agus Galihpurbajati
NIM : 023114016
PROGRAM STUDI MATEMATIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2007
ii
iii
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini
tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan
dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta,……………2007
Penulis
Agus Galihpurbajati
iv
HALAMAN PERSEMBAHAN
Poma-poma wekas mami
Anak putu aja lena
Aja ketungkul uripe
Lan aja duwe kareman
Marang pepaes donya
Siyang dalu dipun emut
Urip cadhangan antaka
( Surat Wulang Reh, Paku Buwono IV )
KUPERSEMBAHKAN KARYA YANG SEDERHANA INI
KEPADA TUHAN YESUS DAN BUNDA MARIA
YANG SELALU MELINDUNGIKU
BAPAK DAN IBUKU YANG SELALU MELIMPAHKAN
SELURUH KASIH SAYANGNYA KEPADAKU
SERTA Ndo’ YANG SELALU DI SAMPINGKU
v
ABSTRAK
Setiap item memiliki waktu hidup, yaitu masa dari awal item tersebut diciptakan hingga item tersebut mengalami kerusakan atau kegagalan. Dalam waktu hidupnya, suatu item memiliki waktu dimana item tersebut akan bertahan hidup sebelum akhirnya akan mengalami kegagalan. Data yang diambil dari waktu bertahan hidup suatu item sebelum item tersebut mengalami kegagalan disebut data survival atau data survivor. Model matematis waktu survival dapat diduga dari data waktu bertahan hidup n item yang diamati. Untuk menduga model survivor lebih lanjut, diperlukan distribusi probabilistik yang sesuai. Untuk setiap n item, bertahan ke waktu t dapat dianggap sebagai percobaan Bernoulli, jadi jumlah item yang bertahan ke waktu t, (n(t)), mempunyai distribusi Binomial dengan parameter n dan probabilitas suksesnya S(t), di mana sukses menunjukkan bahwa item dapat bertahan hingga ke waktu t. Tulisan ini membahas Metode Non parametrik untuk menduga model fungsi survivor. Pendekatan distribusi normal untuk binomial digunakan untuk menentukan selang kepercayaan parameter fungsi survivor.
vi
ABSTRACT
Each item has a lifetime, i.e. a time from the item was created until the item failed. In the lifetime, an item has a time to survive before finally the item will fail. Survival data is taken from the survival times of an item before the item fails. The Survival time mathematical model can be estimated from the survival time data of the n studied-item. An appropriate probabilistic distribution is needed to estimate the survivor model in further. For each of the n item that survives to time t can be considered as a Bernoulli trial. Thus the number of items that survives to time t, n(t), has a Binomial distribution with parameter n and probability of success S(t), where the success shows that the item can survive to time t. This writing discusses about Nonparametrical method to estimate the survivor function model. The normal approximation to the binomial distribution is used to determine the parameter confidence interval of the survivor function.
vii
KATA PENGANTAR
Puji dan syukur kepada Allah Bapa yang penuh kasih, karena dengan terang-
Nya skripsi yang berjudul Pendugaan Model Fungsi Survivor ini dapat diselesaikan
dengan baik. Skripsi ini disusun dalam rangka memenuhi salah satu syarat
memperoleh gelar sarjana sains.
Penulis menyadari bahwa skripsi ini dapat diselesaikan karena bantuan dari
berbagai pihak, oleh karena itu penulis ingin mengucapkan terima kasih kepada :
1. Bapak Ir. Ig. Aris Dwiatmoko, M.Sc. sebagai dekan Fakultas MIPA
Universitas Sanata Dharma dan juga sebagai dosen pembimbing akademik
sekaligus pembimbing skripsi yang dengan sabar membimbing dan
memberikan masukan-masukan yang sangat berarti selama penulis
menempuh studi dan dalam proses penyusunan skripsi ini.
2. Bapak YG. Hartono, S.Si., M.Sc. sebagai Ketua Program Studi Matematika,
Fakultas MIPA, Universitas Sanata Dharma.
3. Ibu Ch. Enny Murwaningtyas, S.Si, M.Si dan ibu Lusia Krismiyati
Budiasih, S.Si, M.Si selaku dosen penguji.
4. Bapak dan Ibu dosen FMIPA khususnya Program Studi Matematika yang
telah banyak memberikan banyak ilmu kepada penulis.
5. Ibu Warni, Mas Tukijo dan Ibu Linda atas semua bantuannya.
6. Perpustakaan USD dan staff atas fasilitas dan pelayanannya.
7. Kedua orangtuaku, Bapak P. Purwiyono dan Ibu Ch. Sukiyem, yang selalu
memberi dukungan kepada penulis, “ Aku sangat menyayangi kalian “
viii
8. Mas Poyo, Le’ Wakini, Mita dan calon adiknya, terima kasih semuanya
mbah Pacitan, Le’ Mistam, Le’ Parni, Le’ Gum, Pita, Wawan, Nurul, mbah
Muntilan (Alm.), mba Venti, Pakdhe, Budhe, Bulik dan Om, terima kasih
atas doa-doanya. Tak lupa juga Pakde Bagyo, Bude Kat, Mas Nug, Mba
Tiwik, Mbak Nia.
9. Katarina Kartika, seorang yang selalu ada untukku, selalu mengasihi,
menyayangi dan mendukungku (MsbmA).
10. Pak Sardjono dan Ibu atas doa restunya, juga Mbak Kus dan Mas UQ.
11. Sahabat-sahabatku: Bani, Aan, Ijoep, Taim, Markus, Tato, Priska yang
selalu penuh keceriaan, terima kasih untuk semuanya.
12. Teman-teman angkatan 2002, kapan kita makrab lagi (10-10-10 ? )
13. Anak-anak kos PJ’S : Andi untuk komputer dan segala pengalaman hidup.
Koencoeng untuk motornya ☺. Doni untuk kebaikanya serta Ari untuk
cerita-ceritanya. Poeji, Eli, Angga, Danang, mBah Jo, Putu, terima kasih
atas kebersamaan yang telah kita lewati. Mas Disiplin untuk tukar
pikirannya. Tak lupa Pak Djan dan Bu Djan atas kos-kosannya yang telah
memberi banyak keceriaan kepada penulis.
14. Kodok Ijo Comunity : Gondrong, Tsu Min, Didit, Topan, Felix untuk
semuanya.
15. Mas Mbong untuk falsafah hidup dan cerita-cerita serunya.
16. Pak Aris untuk pelajaran dekorasinya.
ix
17. PSM CF dan anak-anaknya yang selalu kocak: Bayu, Beni, Elen dan
semuanya, terima kasih untuk warna yang indah selam kita bersama.
‘Banyak yang telah aku dapat di sini’
18. Teman-teman KKN XXXI kelompok 10: Yosep, Cahyo, Siska, Agnes, Via,
Sinta, Watik, Seli dan Neni.
19. Teman sekampungku :mBak Sari, D’Lina-D’Leni, D’Nopi, Songglon, Rino,
Tekek, Joni, Dedi.
20. Semua pihak yang namanya belum tercantum di tulisan ini.
Skripsi ini bukanlah sebuah karya yang sempurna, masih ada kekurangan-
kekurangan dalam skripsi ini yang perlu diperbaiki. Oleh karena itu penulis
mengharapkan saran dan kritikan yang membangun. Akhir kata, semoga skripsi ini
dapat bermanfaat bagi para pembaca.
Yogyakarta, Juni 2007
Penulis
x
DAFTAR ISI
HALAMAN JUDUL.............................................................................................i
HALAMAN PERSETUJUAN PEMBIMBING.................................................. ii
HALAMAN PENGESAHAN............................................................................ iii
PERNYATAAN KEASLIAN KARYA...............................................................iv
HALAMAN PERSEMBAHAN......................................................................... v
ABSTRAK......................................................................................................... vi
ABSTRACT....................................................................................................... vii
KATA PENGANTAR...................................................................................... viii
DAFTAR ISI....................................................................................................... xi
BAB I. PENDAHULUAN................................................................................... 1
1.1 Latar belakang Masalah............................................................................ 1
1.2 Perumusan Masalah................................................................................. 3
1.3 Pembatasan Masalah................................................................................ 3
1.4 Tujuan Penulisan..................................................................................... 3
1.5 Metode Penulisan..................................................................................... 3
1.6 Manfaat Penulisan................................................................................... 4
1.7 Sistematika Penulisan............................................................................. 4
BAB II. PENGANTAR TEORI PROBABILITAS
DAN RELIABILITAS.......................................................................... 6
2.1 Variabel Random.................................................................................... 6
xi
2.2 Distribusi Probabilitas Kontinu Bersama................................................ 6
2.3 Penjumlahan Variabel Random............................................................... 9
2.4 Reliabilitas............................................................................................. 12
2.4.1 Pengertian Reliabilitas................................................................. 12
2.4.2 Kaitan Reliabilitas dengan Kualitas............................................. 14
2.4.3 reliabilitas Bergantung Waktu....................................................... 15
2.4.4 Reliabilitas Sistem........................................................................ 23
2.5 Distribusi Bernoulli............................................................................... 32
2.6 Distribusi Binomial................................................................................ 33
2.7 Teorema Limit Pusat............................................................................. 36
2.8 Pendekatan Normal untuk Distribui Binomial...................................... 40
2.9 Penduga Parameter................................................................................ 42
2.9.1 Penduga Titik................................................................................ 43
2.9.2 Penduga Interval ( selang kepercayaan )...................................... 43
2.9.2.1 Metode Pivot........................................................................ 44
2.10 Teori Likelihood.................................................................................. 46
BAB III. PENDUGA FUNGSI SURVIVOR.................................................... 52
3.1 Fungsi Survivor..................................................................................... 52
3.2 Penyensoran Data…………………………………………………...... 54
3.2.1 Penyensoran Tipe II…………………………………………….. 56
3.2.2 Penynsoran Tipe I......................................................................... 57
3.2.3 Penyensoran Random.................................................................... 57
xii
3.3 Penduga Fungsi Survivor....................................................................... 62
3.4 Tabel Hidup............................................................................................ 76
3.4.1 Tabel Hidup generasional.............................................................. 79
3.4.2 Tabel Hidup Searah...................................................................... 79
3.5 Uji Kolmogorov-Smirnov.................................................................... 81
3.5.1 Langkah-langkah Uji Kolmogorov-Smirnov............................... 82
3.5.2 Statistik Uji Kolmogorov-Smirnov
untuk Distribusi Waktu Hidup.................................................... 84
3.6 Sensor Kanan Himpunan Data.............................................................. 91
BAB IV. APLIKASI PENDUGA FUNGSI SURVIVOR................................ 93
BAB V. PENUTUP......................................................................................... 101
5.1 Kesimpulan.......................................................................................... 101
5.2 Saran.................................................................................................... 102
DAFTAR PUSTAKA...................................................................................... 103
xiii
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Fungsi survivor memegang peranan penting dalam distribusi waktu hidup.
Fungsi ini berguna untuk menganalisa data-data survival, yaitu data yang diambil
dari waktu bertahan hidup suatu item sebelum item tersebut mengalami kegagalan
atau kematian. Sebagai contoh adalah suatu produk yang dikeluarkan oleh sebuah
perusahaan. Data-data survival akan diambil dari beberapa item produk tersebut
yang digunakan sebagai sampel yang kemudian dengan fungsi survivor dapat
dianalisa hingga diketahui daya tahan produk tersebut. Dengan demikian,
perusahaan akan mengetahui apakah produk yang mereka keluarkan memiliki
waktu hidup yang panjang atau tidak dan kemudian dapat dijadikan pertimbangan
untuk produksi selanjutnya.
Dari data-data yang didapat, akan menghasilkan suatu model yang
merepresentasikan data-data survial tersebut. Namun untuk menyelesaikan model
yang diperoleh tersebut tidaklah mudah, karena model tersebut berhubungan
dengan waktu, sehingga masih sulit untuk mendapat kepastian kapan suatu item
yang diamati tersebut akan mengalami kegagalan karena nilai-nilai data dapat
berubah seiring berjalannya waktu dan kalaupun bisa, tentu akan memerlukan
waktu yang lama untuk mengamatinya karena belum tentu semua item memiliki
waktu hidup yang sama. Oleh karena itu, pendugaan model sangat diperlukan
untuk mempermudah pengolahan data-data tersebut. Namun persoalan belum
1
2
selesai sampai di situ, karena data-data survival sering sedikit melenceng atau
bahkan jauh dari distribusi normal (B.S. Everitt,1994). Dalam statistika
parametrik, persoalan tersebut dapat diselesaikan dengan menerapkan Teorema
Limit Pusat yang sering digunakan sebagai pendekatan empiris untuk menjamin
ketepatan asumsi normalitas. Namun hal itu hanya dapat digunakan pada sampel
yang besar, sedangkan seringkali terdapat situasi di mana sampel terlalu kecil
sehingga sulit untuk menentukan normalitasnya. Untuk mengatasi masalah
tersebut, cabang statistika memiliki prosedur alternatif yang tidak memerlukan
ukuran sampel untuk menentukan normalitasnya. Prosedur ini disebut sebagai
statistika nonparametrik. Prosedur ini juga dapat mengatasi masalah penyensoran
yang sering terdapat pula dalam data-data survival.
Oleh karena itu, dalam skripsi ini hanya akan membahas penduga fungsi
survivor dengan metode nonparametrik yang kemudian akan digunakan untuk
memperoleh selang kepercayaan bagi penduga fungsi survivor tersebut. Penduga
model fungsi survivor akan diasumsikan bahwa penduga nonparametrik fungsi
survivor S(t) adalah sama dengan jumlah sampel yang rusak selama selang waktu
t dibagi dengan jumlah sampel yang digunakan. Secara matematis penduga model
tersebut dapat dituliskan sebagai berikut
ntntS )()(ˆ = ,
dimana adalah penduga dari fungsi survivor S(t). )(ˆ tS
3
1.2 Perumusan Masalah
Permasalahan yang dibahas dalam skripsi ini dapat dirumuskan sebagai
berikut :
1. Bagaimana menentukan penduga dan selang kepercayaan penduga
fungsi survivor ?
2. Bagaimana aplikasi penduga fungsi survivor pada ketahanan hidup
suatu item ?
1.3 Pembatasan Masalah
Dalam skripsi ini dibatasi oleh beberapa hal sebagai berikut :
1. Skripsi ini hanya membahas metode nonparametrik.
2. Teorema Ketunggalan tidak dibuktikan
3. Tipe penyensoran yang digunakan adalah penyensoran Tipe II
1.4 Tujuan Penulisan
Skripsi ini bertujuan untuk memenuhi salah satu persyaratan untuk mem-
peroleh gelar Sarjana Sains dalam bidang Matematika. Selain itu skripsi ini ber-
tujuan untuk memperdalam pengetahuan tentang fungsi survivor, penduga fungsi
survivor serta selang kepercayaan penduga fungsi survivor dan aplikasi-
aplikasinya.
1.5 Metode Penulisan
Metode yang digunakan dalam penulisan skripsi ini adalah metode studi
pustaka, yaitu dengan mempelajari dan memahami buku-buku dan literatur-
4
literatur yang terkait dan sudah dipublikasikan, sehingga tidak ditemukan hal
baru.
1.6 Manfaat Penulisan
Manfaat yang diharapkan dari penulisan skripsi ini adalah :
1. Dapat lebih memahami mengenai penduga fungsi survivor dengan
metode nonparametrik agar dapat dikembangkan lebih lanjut demi
perkembangan ilmu matematika khususnya dalam bidang statistik
2. Mengetahui lebih jauh aplikasi-aplikasi penduga fungsi survivor ke-
hidupan sehari-hari.
1.7 Sistematika Penulisan
Bab I. Pendahuluan. Pada bagian ini akan dibahas tentang latar belakang
masalah, perumusan masalah, pembatasan masalah, tujuan penulisan, metode
penulisan, manfaat penulisan, dan sistematika penulisan.
Bab II. Landasan Teori. Pada bagian ini akan dibahas tentang variabel
random, distribusi probabilitas kontinu bersama, penjumlahan variabel random,
reliabilitas, distribusi bernoulli, distribusi binomial, teorema limit pusat,
pendekatan normal untuk distribusi binomial, enduga parameter dan teori
likelihood.
Bab III. Penduga Fungsi Survivor. Dalam bagian ini akan dibahas tentang
penyensoran data dan penetuan selang kepercayaan, namun sebelumnya akan
dibahas terlebih dahulu mengenai fungsi survivor itu sendiri. Akan dibahas pula
5
penggunaan tabel hidup (life table) sebagai metode lain untuk menentukan selang
kepercayaan untuk penduga fungsi survivor dalam statistik nonparametrik serta uji
Kolmogorov-Smirnov untuk menentukan normalitas data.
Bab IV. Aplikasi Penduga Fungsi Survivor. Dalam bagian ini akan dibahas
penyelesaian masalah tentang penentuan penduga fungsi survivor dan selang
kepercayaannya untuk data penderita leukemia.
Bab V. Penutup. Bab ini berisi kesimpulan dan saran.
BAB II
PENGANTAR TEORI PROBABILITAS DAN RELIABILITAS
2.1 Variabel Radom
Variabel random, misalnya X, adalah fungsi yang didefinisikan pada ruang
sampel S, yang memetakan setiap elemen Sa∈ ke bilangan real yang dinotasikan
sebagai berikut :
.Rx,Sa,x)a(X ∈∈=
Huruf kapital seperti X, Y, Z akan digunakan sebagai lambang variabel random
sedangkan huruf-huruf kecil yang bersesuaian x, y, z melambangkan nilai
variabel random yang mungkin. Konsep variabel random dapat dipahami sebagai
sebuah pemetaan dari himpunan S ke himpunan bilangan real.
Variabel random yang nilainya berhingga atau tak berhingga terbilang disebut
variabel random diskret, sedangkan jika tidak demikian disebut variabel random
kontinu.
2.2 Distribusi Probabilitas Kontinu Bersama
Definisi 2.2.1 Fungsi Densitas Bersama
Variabel random X dan Y dikatakan kontinu bersama-sama jika terdapat fungsi
f(x,y) yang terdefinisi untuk semua nilai x dan y, yang merupakan bilangan real
dalam setiap himpunan C ⊂ 2R , sehingga peluang
(2.1) ∫∫∈
=∈C)Y,X(
dydx)y,x(f)C)Y,X((P
Fungsi f(x,y) disebut fungsi densitas bersama dari X dan Y.
6
7
Jika A dan B adalah dua buah himpunan bilangan real dan
{ By,Ax:)y,x(C ∈ }∈= , dari persamaan (2.1) dapat dilihat
(2.2) ∫ ∫=∈∈B A
dydx)y,x(f)BY,AX(P
Karena fungsi distribusi kumulatif bersama
,dydx)y,x(f
)]b,(Y],a,(X(P)b,a(Fb a
∫ ∫∞− ∞−=
−∞∈−∞∈= (2.3)
maka fungsi densitas bersama dapat diperoleh melalui diferensiasi, yaitu
(2.4) )b,a(Fba
)b,a(f2
∂∂∂
=
Jika turunan parsialnya ada.
Interpretasi lain dari fungsi densitas bersama berdasarkan persamaan (2.2), adalah
dbda)b,a(f
dydx)y,x(f)dbbYb,daaXa(Pdaa
a
dbb
b
≈
=+<<+<< ∫∫++
(2.5)
Di mana da dan db kecil dan f(x,y) kontinu di a,b.
Definisi 2.2.2
Jika X dan Y adalah kontinu bersama-sama, maka secara individu adalah juga
kontinu, sehingga fungsi distribusi probabilitasnya adalah
∫∫ ∫
=
=
∞−∞∈∈=∈∞
∞−
A X
A
dx)x(f
dxdy)y,x(f
)),(Y,AX(P)AX(P
(2.6)
di mana ∫∞
∞−= dy)y,x(f)x(f X (2.7)
8
dan disebut fungsi densitas marginal untuk X. Dengan cara yang sama pula,
fungsi densitas marginal untuk Y adalah
(2.8)∫∞
∞−= dxyxfyfY ),()(
Contoh 2.1
Fungsi densitas untuk X dan Y diberikan dengan
⎩⎨⎧ ∞<<∞<<
=−−
selainnya,0y0;x0,ee2
)y,x(fy2x
)1( 210
−− −= ee
2
12
2)1,1(
1 21
1
0
2
1
0 1
2
−−
−−
∞ −−
=
⎟⎟⎠
⎞⎜⎜⎝
⎛ ∞−=
=<>
∫
∫
∫ ∫
dyee
dyee
dydxeeYX
y
xy
yxP
31
321
220 0
32 −= ∫ ∫ −− dyedye yy
)1(2
2
2)(
0
2
0 0
2
:),(
2
=
−=
−=
=
=<
∫∫ ∫
∫∫
∞ ∞
∞ −−
∞ −−
<
−−
dyee
dydxee
dydxeeYX
yy
y yx
YXYx
yx
<>
X(
Hitung a) P )1Y,1X(
b) YP < )
c) P < )aX(
Penyelesaian
a.)
Pb.)
9
a
a x
a xy
e
dxe
dxdyeeaxP
−
−
∞ −−
−=
=
=<
∫∫ ∫
1
2)(
0
0 0
2c.)
2.3 Penjumlahan Variabel Random
Penentuan distribusi untuk X+Y dari distribusi X dan Y, dimana X dan Y
saling bebas adalah hal yang penting. Anggap X dan Y adalah saling bebas, dan
merupakan variabel random kontinu yang mempunyai fungsi densitas dan .
Fungsi distribusi kumulatif dari X+Y dapat didefinisikan dengan
Xf Yf
dy)y(f)yz(F
dy)y(fdx)x(f
dydx)y(f)x(f
dydx)y(f)x(f
)zYX(P)z(F
YX
yz
YX
yz
YX
zYXYX
YX
∫∫ ∫∫ ∫
∫∫
∞
∞−
∞
∞−
−
∞−
∞
∞−
−
∞−
≤+
+
−=
=
=
=
≤+=
(2.9)
atau
dx)xz(f)x(F
dx)x(fdy)y(f
dxdy)x(f)y(f
dydx)y(f)x(f
)zYX(P)z(F
YX
xz
XY
xz
XY
zYXYX
YX
−=
=
=
=
≤+=
∫∫ ∫∫ ∫
∫∫
∞
∞−
∞
∞−
−
∞−
∞
∞−
−
∞−
≤+
+
(2.10)
10
Fungsi distribusi kumulatif disebut konvolusi dari distribusi dan YXF + XF YF
Dengan menurunkan persamaan (2.9) akan didapat fungsi densitas dari X+Y
dan diberikan dengan
YXf +
∫
∫
∫
∞
∞−
∞
∞−
∞
∞−+
−=
−=
−=
dy)y(f)yz(f
dy)y(f)yz(Fdzd
dy)y(f)yz(Fdzd)z(f
YX
YX
YXYX
(2.11)
Contoh 2.2
Jika X dan Y adalah variabel random saling bebas, keduanya berdistribusi
seragam pada (0,1), tentukan fungsi densitas dari X+Y.
Penyelesaian
Dari persamaan (2.11)
⎩⎨⎧ <<
==selainnya,0
1z0,1)z(f)z(f YX
didapat
∫ −=+
1
0 XYX dy)yz(f)z(f
Untuk , hasilnya adalah 1z0 ≤≤
zdy)z(f1
0YX == ∫+
Untuk , didapat 2z1 <<
z2)z(f YX −=+
Oleh karena itu
11
selainnya,2z1,1z0,
0z2
z)z(f YX <<
≤≤
⎪⎩
⎪⎨
⎧−=+
Contoh 2.3
Andaikan X dan Y adalah dua variabel random exponensial saling bebas, yaitu
0t,e)t(f)t(f tYX >== −
Tentukan dima Z=X+Y. )z(f Z
Penyelesaian
z
z
0
z
z
0
)xz(x
YXZ
ze
e
dxee
dx)xz(f)x(f)z(f
−
−
−−−
∞
∞−
=
=
=
−=
∫∫∫
Contoh 2.4
Jika X dan Y mempunyai fungsi densitas bersama
)yx(2)y,x(f XY +=
Tentukan dimana Z=X+Y )z(f Z
Penyelesaian
3
z
0
2
z
0
Z
z34
dxz4
dxz2.z2
dx))xz(x(2)).xz(x(2)z(f
=
=
=
−+−+=
∫∫∫∞
∞−
12
2.4 Reliabilitas
2.4.1 Pengertian Reliabilitas
Reliabilitas adalah terjemahan dari kata reliability yang berasal dari kata rely
dan ability. Menurut Kamus Inggris Indonesia ( J.M. Echols dan Hassan S,
1975), kata ‘rely’ mempunyai arti mempercayakan, mengandalkan, sedangkan
kata ‘ability’ berarti kecakapan, kemampuan. Jadi, menurut asal katanya, relia-
bilitas adalah kemampuan untuk dapat diandalkan atau dipercayakan atau dapat
juga disebut keterpercayaan, keterhandalan, keajegan, kestabilan dan sebagainya.
Reliabilitas juga dapat didefinisikan seperti probabilitas, dalam artian perhi-
tungan-perhitungan dalam reliabilitas menggunakan aksioma-aksioma yang
terdapat dalam teori probabilitas. Dalam hal khusus, ini berarti bahwa semua relia-
bilitas harus berada dalam selang 0 sampai 1.
Definisi 2.4.1. Reliabilitas
Reliabilitas didefinisikan sebagai probabilitas suatu barang dapat berfungsi
dengan baik untuk suatu waktu dan kondisi tertentu.
Dari definisi di atas waktu menempati bagian penting dalam reliabilitas dan
secara tidak langsung berkaitan dengan beberapa konsekuensi. Pertama, pembuat
model harus menentukan satuan waktu, misalnya detik, jam, tahun dan
sebagainya, untuk menganalisa. Kedua, model-model waktu hidup banyak
menggunakan variabel random T ( daripada X yang lebih banyak digunakan
13
dalam statistika klasik ) untuk menggambarkan waktu kerusakan dari suatu
barang. Ketiga, waktu tidak harus diartikan secara harafiah, misalnya untuk
menentukan daya tahan suatu ban dapat juga menggunakan satuan mil sebagai
representasi waktu. Keempat, harus menentukan durasi waktu yang terkait dengan
reliabilitas. Maksudnya, harus ditentukan bila suatu barang dikatakan memiliki
reliabilitas 0.8, maka kalimat itu belum memiliki arti. Reliabilitas sebuah barang
menunjuk pada sebuah nilai dalam suatu waktu, misalnya 1000 jam. Terakhir,
ukuran untuk menentukan waktu hidup harus ditentukan karena umur suatu
barang tidak pasti. Untuk mendapat ukuran yang tepat, perlu diperhatikan cara
pengukurannya, misalnya akan dilihat waktu hidup sebuah bola lampu. Waktu
hidup suatu bola lampu bisa sama dengan lama bola lampu itu dapat menyala.
Cara yang harus dilakukan dalam pengukuran adalah bola lampu itu harus
dinyalakan secara kontinu atau terus menerus, sehingga dapat diketahui jumlah
jam sebagai representasi waktu hidup bola lampu tersebut. Bila bola lampu
tersebut dihidup matikan, maka penggambaran waktu hidupnya tidaklah tepat
karena selain awal penghitungan jumlah jam sebagai representasi waktu hidupnya
akan berubah-ubah, kejutan saat penyalaan dan pematian dapat mengurangi waktu
hidup suatu bola lampu.
Aspek terakhir dari definisi reliabilitas adalah kondisi lingkungan harus
dispesifikasikan. Kondisi seperti temperatur, kelembaban ataupun kecepatan
perubahan, semua berpengaruh terhadap waktu hidup suatu barang. Misalnya
mobil yang memiliki reliabilitas 20000 mil, akan memiliki perbedaan jika mobil
tersebut digunakan di daerah pegunungan dengan digunakan di kota.
14
2.4.2 Kaitan Reliabilitas dengan Kualitas
Reliabilitas sering disamakan dengan kualitas. Perbedaan utama antara
keduanya yaitu reliabilitas berkaitan dengan waktu sedangkan kualitas tidak,
karena bersifat statis. Misalnya terdapat dua buah transistor yang memiliki
kualitas yang sama. Salah satu transistor digunakan pada sebuah televisi
sedangkan yang lain ditempatkan pada alat peluncur roket. Kedua transistor
tersebut memang memiliki kualitas yang identik, namun salah satu diantaranya
memiliki reliabilitas yang lebih besar karena ditempatkan pada lingkungan yang
memiliki tekanan lebih rendah.
Reliabilitas yang tinggi dapat berarti pula kualitas tinggi, namun tidak
sebaliknya. Sebagai contoh, terdapat dua buah ban yang memiliki kualitas yang
sama-sama tinggi. Salah satu ban diproduksi tahun 1957 dan yang lain diproduksi
tahun 1995. Meskipun keduanya diproduksi melalui tahap pengontrolan kualitas
yang ketat, namun reliabilitasnya berbeda karena terdapat perubahan teknologi
yang terjadi antara tahun 1957 sampai 1995. 60000 mil reliabilitas ban yang
diproduksi pada tahun 1995 akan lebih besar dibanding reliabilitas ban yang
diproduksi pada tahun 1957. Kemajuan teknologi selama 38 tahun mungkin
membawa perubahan pada model ( misalnya motif grit/kembangan ban ),
komponen ( misalnya karet), atau proses ( misal kemajuan dalam pembuatan ).
Beberapa perubahan tersebut ( misalnya motif grit ban ), dapat memperbaiki
reliabilitas, namun yang lain ( misalnya motif sisi ban ) tidak.
15
2.4.3 Reliabilitas Bergantung Waktu
Misalkan T adalah variabel random yang menggambarkan daya tahan hidup
dari suatu barang atau sistem. F(t) adalah fungsi distribusi kumulatif yang
didefinisikan sebagai probabilitas suatu barang hidup paling lama t dan ditulis
sebagai berikut :
(2.12))tT(P)t(F ≤=
R(t) adalah fungsi reliabilitas yang merupakan probabilitas suatu barang dapat
berfungsi dengan baik lebih dari waktu t yang telah ditentukan. Jadi R(t) dapat
didefinisikan sebagai
)t(F1)tT(P1
)tT(P)t(R
−=≤−=
>=
(2.13)
Waktu rata-rata sistem tidak befungsi ( failure ), yaitu nilai harapan untuk waktu
sistem tidak berfungsi ( untuk selanjutnya, sistem tidak berfungsi akan disebut
kegagalan ). Andaikan fungsi densitas waktu kegagalan didefinisikan dengan f(t)
yaitu
dt)t(dF
)t('F)t(f
=
= (2.14)
dimana dan 0)t(f ≥ ∫∞
=0
1dt)t(f
atau dt
)t(dR)t(f −=
sehingga rata-rata waktu kegagalan adalah
16
∫∞
=0
dt)t(tf)T(E (2.15)
dimana batas bawah adalah nol karena waktu kegagalan tidak mungkin kurang
dari nol. Dengan mensubstitusikan beberapa persamaan diatas didapat
∫
∫
∫
∫
∞
∞
∞
∞
=
−=
=
=
0
0
0
0
dt)t(R
dtdt
)t(dRt
dtdt
)t(dFt
dt)t(tf)T(E
(2.16)
persamaan akhir didapat dengan menggunakan integral parsial dengan
dtdt
)t(dRdv,tu ==
Contoh 2.5
Fungsi densitas kegagalan sebuah alat diberikan sebagai berikut :
(2.17)0t,e)t(f t ≥= ⋅λλ
tentukan :
a. F(t)
b. Reliabilitas
c. Rata-rata waktu kesalahan
Penyelesaian :
17
a.
b. c. Probabilitas bahwa sebuah sistem dapat berfungsi dalam waktu t akan gagal pada
waktu T yang merupakan fungsi densitas kumulatif bersyarat.
)tT(P)tT,xT(P)tT|x(F
>>≤
=>
jika tx < , probabilitasnya adalah nol. Dengan menggunakan definisi F(t) didapat
)t(F)x(F)tT,xT(P −=>≤
dengan mensubtitusikan persamaan (2.22) dan (2.13) ke persamaan(2.21), maka
didapat
tx,)t(R
)t(F)x(F
tx,)t(F1
)t(F)x(F)tT|x(F
>−
=
>−−
=>
]0t,e1
de
dt)t(f)t(
t
t
0
0
t
0
e≥−=
−=
=
=
−
∞−
−
∫
∫
λ
ζλ
ζλ
ζλ
F
(2.18)
R
t
t
e)e1(1
)t(F1)t(
λ
λ
−
−
=
−−=
−= (2.19)
λ
λ
1
dte
dt)t(R)T(E
0
t
0
=
=
=
∫
∫∞
−
∞
(2.20)
(2.21)
(2.22)
(2.23)
18
Didapat fungsi distribusi probabilitas bersyarat dengan menurunkan persamaan
terhadap x
(2.24)tx,)t(R)x(f
)t(F1)x(f)tT|x(f >=
−=>
Andaikan
Pdx)tT|x(f => [ kegagalan sistem dalam interval waktu (x,x+dx) jika diketa-
hui telah beroperasi selama waktu t] (2.25)
yaitu, fungsi distribusi probabilitas bersyarat waktu kegagalan meningkat dalam
variabel bebas adalah probabilitas bahwa suatu barang atau sistem dapat bertahan
sampai waktu t tetapi akan gagal dalam penambahan waktu (x,x+dx).
Contoh 2.6
Tentukan fungsi distribusi probabilitas bersyarat kegagalan sebuah alat dari soal
pada contoh 2.5
Penyelesaian :
Dari persamaan (2.24)
tx,eee
)t(F1)x(f)tT|x(f
)tx(
t
x
>=
=
−=>
−−
−
−
λ
λ
λ
λ
λ
Untuk fungsi eksponensial, terlihat bahwa fungsi distribusi probabilitas bersyarat
kegagalan jika diketahui waktu kegagalan lebih besar dari suatu waktu t adalah
sama dengan fungsi distribusi probabilitas tak bersyarat kegagalan dengan meru-
bah x = t.
(2.26)
19
Konsep lain yang digunakan dalam teori reliabilitas yang terkait dengan
variasi waktu adalah tingkat kegagalan ( failure rate ). Andaikan n(t) adalah bany-
aknya peralatan yang beroperasi pada waktu t, dan andaikan sejumlah kegagalan
pada interval ( t, t + dt ) adalan dn. Rasio semua kegagalan terhadap total waktu t
adalah
)t(ndnFf = (2.27)
Akan tetapi, ini adalah kuantitas yang sama yang dengan persamaan (2.14) dengan
x = t, maka persamaan ( 2.27 ) dan ( 2.25 ) disamakan sehingga diperoleh
)t(ndndt)tT|t(f => (2.28a)
atau dengan membagi dengan dt, akan didapat
)t(R)t(f
dtdn
)t(n1)tT|t(f)t(h ==>= (2.28b)
dimana persamaan (2.28b) itu adalah tingkat kegagalan. Contoh 2.7
Dari substitusi persamaan (2.17) dan (2.19) ke (2.28b) terlihat bahwa tingkat
kegagalan untuk sebuah alat yang memiliki fungsi distribusi probabilitas
kegagalan berupa fungsi eksponensial adalah λ alat per detik. Andaikan bola
lampu pada suatu masa produksi tertentu mempunyai tingkat kegagalan λ = 0.001
per tahun, berapakah reliabilitasnya?
20
Penyelesaian :
Substitusi persamaan (2.17) dan (2.19) ke (2.28b) menghasilkan :
λ
λλ
λ
=
=
=
−
−
t
t
ee)t(R)t(f)t(h
Karena λ = 0.001, dari persamaan (2.19) didapat :
(2.29)0t,ee)t(R t001.0t >== −−λ
Tingkat kegagalan yang berupa konstanta secara umum merupakan suatu
pengecualian daripada suatu aturan yang berlaku. Sebuah peralatan sebenarnya
memiliki tingkat kegagalan yang tinggi pada awal waktu hidupnya karena keti-
daksempurnaan dalam proses pembuatannya yang lolos dari pemeriksaan. Dalam
kasus manusia, tingkat kegagalan analog dengan istilah tingkat kematian bayi.
Selanjutnya, secara normal tingkat kegagalan bersifat stabil pada suatu nilai ren-
dah yang dapat diterima. Selanjutnya, setelah sebuah alat telah mencapai umur
yang telah ditentukan, tingkat kegagalan mulai beranjak karena keausan. Dikait-
kan dengan waktu penggunaan, terdapat tiga bagian dalam tingkat kegagalan yaitu
awal penggunaan, masa stabil, dan masa aus yang digambarkan dalam grafik 2.1.
21
9 8 7 6 5 awal pemakaian 4 3 2 stabil masa aus 1 0 1 2 3 4 5 6 7 8 9 10
grafik 2.1 kurva tingkat kegagalan alat
Dengan menurunkan persamaan (2.13) dan menggunakan persamaan (2.14)
)t(fdt
)t(dFdt
)t(dR−=−= (2.30)
kemudian disubtitusikan ke dalam persamaan (2.28b) didapat
)t(Rlndtd
)t(Rdt
)t(dR
)t(h −=−= (2.31)
dengan pengintegralan didapat
(2.32)⎥⎦
⎤⎢⎣
⎡−= ∫
t
0
d)(hexp)t(R λλ
dengan catatan, jika tingkat kegagalan adalah konstan, reliabilitas dari persamaan
(2.32) adalah
22
(2.33)kte)t(R −=
Contoh 2.8
Anggap fungsi distribusi probabilitas seragam kegagalan sebuah alat diberikan
dengan
⎪⎪
⎩
⎪⎪
⎨
⎧ ≤≤
=
selainnya,0
Tt0,T1
)t(f (2.34)
tentukan reliabilitas dan tingkat kegagalannya!
Penyelesaian :
Fungsi densitas kumulatif kegagalan didapat dengan mengintegralkan persamaan
(2.34), adalah
∫
∫
≤≤=
=
t
0
t
0
Tt0,dT1
d)(f)t(F
τ
ττ
(2.35)
Maka reliabilitasnya adalah
(2.36)Tt0,T11)t(R ≤≤−=
dari persamaan (2.28b) tingkat kegagalannya adalah
Tt0,
T11
T1
)t(R)t(f)t(h ≤≤
−== (2.37)
2.4.4 Reliabilitas Sistem
23
Menurut AICPA Assurance service Alert, sistem adalah
1. Sebarang hubungan yang teratur antara sumber-sumber dan prosedur-
prosedur yang menyatu dan saling mempengaruhi atau saling tergantung
untuk memenuhi sebuah himpunan fungsi-fungsi yang spesifik.
2. Suatu kombinasi dari dua peralatan atau lebih yang saling berkaitan yang
diatur dalam sebuah paket fungsional untuk membentuk sebuah fungsi
operasional atau untuk memenuhi suatu kebutuhan.
3. Suatu kumpulan dari personil, peralatan dan metode yang diatur untuk
membentuk suatu himpunan fungsi-fungsi yang spesifik. (SysTrust
services-2001)
Sedangkan menurut (atis.org,) suatu sistem terdiri dari lima komponen
dasar, yaitu
1. Infrstruktur, yaitu komponen sistem yang berupa komponen-komponen
fisik dan hardware (perangkat kasar) seperti kerangka dan fasilitas-
fasilitas.
2. Software (perangkat lunak), yaitu program-program untuk mendukung
sistem.
3. Manusia, yaitu personil yang terlibat di segala aspek pada sistem ataupun
pengguna sistem, misalnya pembuat program, operator, pengguna sistem.
4. Prosedur,yaitu langkah-langkah serta aturan-aturan untuk menjalankan
sistem.
5. data, yaitu suatu informasi yang diperoleh dan digunakan dalam
menjalankan suatu sistem.
24
Sebagai contoh adalah sebuah sistem peluncuran sebuah satelit. Dalam sistem ini
terdapat perlengkapan serta operasi-operasi pendukung untuk keberhasilannya,
yaitu seperti pesawat dan roket sebagai komponen fisiknya, program-program
untuk menjalankan operasi, awak yang mengemudikan pesawat, langkah-langkah
dan prosedur-prosedur peluncuran satelit serta data-data yang akan digunakan
ataupun dicari.
Sebuah sistem dapat menjadi sangat sederhana, sebagai contoh sebuah
sistem aplikasi pembayaran yang hanya melibatkan seseorang dengan sebuah unit
personal komputer. Namun sebuah sistem juga dapat menjadi sangat rumit yaitu
dengan melibatkan jumlah pengguna yang besar di dalamnya dan terdapat
berbagai aplikasi dengan menggunakan begitu banyak komputer, misalnya sebuah
sistem perbankan yang besar.
Definisi 2.4.2 Reliabilitas Sistem
Reliabilitas sistem didefinisikan sebagai probabilitas suatu sistem dapat berfungsi
dengan baik untuk suatu waktu dan kondisi tertentu.
Dari definisi diatas, reliabilitas sistem adalah ketahanan suatu sistem untuk
suatu waktu dan suatu konsisi tertentu. Dengan kata lain, reliabilitas sistem adalah
probabilitas suatu sistem dimana sistem tersebut tidak akan rusak sebelum t
waktu.
Suatu sistem yang melibatkan sejumlah besar komopnen-komponen pendukung,
komponen-komponen tersebut dapat disusun dengan berbagai cara. Ada banyak
25
sistem yang disusun secara seri, beberapa disusun secara pararel dan ada yang
disusun dengan mengkombinasikan kedua cara tersebut. Dua contoh berikut akan
memberi ilustrasi tentang suatu sistem.
Contoh 2.9
Peluncuran sebuah satelit kecil memerlukan serangkaian operasi pendukung
yang dikaitkan dengan probabilitas keberhasilan. Setiap operasi diasumsikan tidak
saling tergantung satu dengan yang lain.
1. Penghidupan roket pendorong, 0.99
2. Baut penghubung satelit dengan roket utama, 0.98
3. Putaran gas jet satelit untuk stabilitas, 0.965
4. Pematian roket pendorong pada kecepatan akhir yang diinginkan, 0.97
Setiap tindakan tersebut harus dilakukan, dan bila salah satu operasi gagal, maka
peluncuran satelit juga gagal. Berapakah probabilitas keberhasilan atau
reliabilitasnya?
Penyelesaian
Keberhasilan suatu sistem adalah irisan dari empat keberhasilan subsistem yang
terpisah, atau
908.0)97.0)(965.0)(98.0)(99.0(
)tT(P
)]tT()tT()tT()tT[(P)tT(P4
1ii
4321MS
==
>=
>∩>∩>∩>=>
∏=
(2.38)
Terlihat bahwa reliabilitas sistem konsisten dengan reliabilitas serentetan subsis-
tem, yaitu kurang dari atau sama dengan reliabilitas subsistem yang paling rendah.
26
Contoh 2.10
Rem adalah komponen terpenting untuk setiap kendaraan. Kebanyakan kendaraan
memiliki dua sistem pengereman, yaitu hidrolis dan mekanis. Jika salah satu ru-
sak, maka yang lain akan mengambil alih ( sebenarnya, hanya sistem mekanis
yang akan mengambil alih fungsi ketika sistem hidrolis rusak, namun dalam hal
ini diasumsikan salah satu akan mengambil alih fungsi jika yang lain rusak). Jika
diberikan reliabilitas kedua subsistem pengereman untuk sebuah truk berturut-
turut adalah 0.98 untuk subsistem Hidrolis dan 0.95 untuk subsistem Mekanis,
berapa reliabilitas keseluruhan untuk pengereman truk?
Penyelesaian
Untuk sistem ini, semua subsistem harus rusak untuk mengakibatkan kerusakan
sistem, jadi
001.0)95.01)(98.01(
)tT(P
)]tT()tT[(P)tT(P2
1ii
21B
=−−=
>=
≤∩≤=≤
∏=
(2.39)
adalah reliabilitas kegagalan ( kerusakan ). Probabilitas keberhasilan atau relia-
bilitasnya adalah
999..0001.01)(1)(
=−=≤−=> tTPtTP BB (2.40)
Dari dua contoh di atas, dapat disimpulkan hubungan reliabilitas menyangkut de-
ngan dua jenis sistem ( seri dan pararel ).
27
Reliabilitas Sistem Seri
Andaikan adalah subsistem ke- i untuk suatu system S dalam sistem seri,
keberhasilan sistem keseluruhan bergantung pada keberhasilan tiap-tiap
subsistemnya, yaitu
iS
(2.41)n21 S...SSS ∩∩∩=
Jadi probabilitas keberhasilan pada sistem keseluruhan atau reliabiltas sistem,
diasumsikan setiap subsistem adalah berdiri sendiri, yaitu
∏ ∏= =
=>=
>∩∩>∩>=>=
n
1i
n
1iii
n21
seris
)t(R)tT(P
)]tT(...)tT()tT[(P)tT(P)t(R
(2.42)
Dapat ditunjukkan bahwa tingkat kegagalan untuk sitem seri adalah jumlahan dari
tingkat kegagalan untuk tiap subsistemnya. Logaritma dari persamaan 2.42
menghasilkan
∑−
>=
>=n
1ii
seris
)]tT(Pln[
)]tT(Pln[)t(Rln[ (2.43)
Turunan negatif dari logaritma reliabilitas adalah tingkat kegagalan berdasarkan
persamaan 2.31, jadi
∑
∑
=
=
=
⎭⎬⎫
⎩⎨⎧−=
−=
n
1ii
n
1ii
ss
)t(h
)]t(T[Plndtd
)]t(Rln[dtd)t(h
(2.44)
Contoh 2.11
28
Andaikan reliabilitas berdasar waktu untuk subsistem dalam contoh 2.17 adalah
fungsi eksponensial
t4
t3
t2
t1
44
3
2
1
e)t(R
e)t(R
e)t(R
e)t(R
λ
λ
λ
λ
−
−
−
−
=
=
=
=
(2.45)
Tentukan reliabilitas sistem, rata-rata waktu kegagalan dan tingkat kegagalan.
Penyelesaian
Reliabilitas sistem berdasarkan persamaan 2.42 adalah
(2.46)∏−
+++−==a
1i
t)(is
4321e)t(R)t(R λλλλ
Dari persamaan 2.27, rata-rata waktu kegagalan adalah
4321
0
t)(
0ss
1
dte
dt)t(R)T(E
4321
λλλλ
λλλλ
+++=
=
=
∫
∫∞
+++−
∞
(2.47)
Untuk subsistem dengan reliabilitas eksponensial, tingkat kegagalan adalah kon-
stanta dalam eksponensial, oleh karena itu tingkat kegagalan sistem adalah
(2.48)4321s )t(h λλλλ +++=
Reliabilitas Sistem Pararel
29
Andaikan adalah subsistem ke- i untuk suatu system F dalam sistem
pararel, semua subsistem harus mengalami kerusakan sebelum sistem mengalami
kerusakan. Jadi untuk subsistem paling bebas
iF
(2.49)n21pararel F...FFF ∩∩∩=
Probabilitas kegagalan
∏
∏
∏
≠
=
=
−=
=
≤=
≤∩∩≤∩≤=≤=
n
1ii
n
1ii
n
1ii
n21pararelp
)]t(R1[
)t(F
)tT(P
)]tT(...)tT()tT[(P)tT(P)t(F
(2.50)
Reliabilitas sistem pararel adalah
∏=
−−=
−=n
1ii
pp
)]t(R1[1
)t(F1)t(R (2.51)
Contoh 2.12
Fungsi exponensial reliabilitas dalam sistem pararel diberikan dengan
tb
ta
b
a
e)t(R
e)t(Rλ
λ
−
−
=
= (2.52)
Tentukan reliabilitas sistem pararel, rata-rata waktu kegagalan, dan tingkat kega-
galan.
Penyelesaian
Dari persamaan 2.51, diperoleh reliabilitas sistem yaitu
t)(tt
ttp
baaa
ba
eee
)e1)((e1(1)t(Rλλλλ
λλ
+−−−
−−
−+=
−−−= (2.53)
30
Dari persamaan 2.16, rata-rata waktu kegagalan adalah
baba
0pp
111
dt)t(R)T(E
λλλλ +−+=
= ∫∞
(2.54)
Dari persamaan 2.31, tingkat kegagalannya adalah
t)(tt
t)(ba
tb
ta
pp
baba
baba
eeee)(ee
)t(Rlndtd)t(h
λλλλ
λλλλ λλλλ+−−−
+−−−
−++−+
=
−= (2.55)
Tidak seperti kasus yang terjadi dalam sistem seri, tingkat kegagalan dalam sistem
pararel tidak dinyatakan sederhana.
Reliabilitas Sistem Standby
Dalam sistem ini, suatu subsiatem akan beroperasi sampai rusak, dan pada
suatu waktu sistem standby (disingkat sb) akan akan menggantikannya. Untuk
beberapa susunan :
(2.56)21sb TTT +=
Dimana adalah sistem utama dan adalah sistem standby. Pengambilan nilai
harapan dari keduanya, dapat menentukan rata-rata waktu kegagalan
1T 2T
(2.57))T(E)T(E)T(E 21sb +=
Persamaan 2.56 menyatakan bahwa waktu kegagalan dari sistem stanby adalah
jumlahan dari dua variable random, yaitu waktu kegagalan sistem primer dan
waktu kegagalan sistem sekunder. Jika kedua waktu kegagalan adalah saling be-
31
bas secara statistik, fungsi distribusi probabilitas untuk sistem standby adalah
konvolusi dari dua fungsi distribusi probabilitas kegagalan subsistem, atau
(2.58)∫∞
∞−
−= ηηη d)(f)t(f)t(f 21sb
Fungsi distribusi kumulatif kegagalan adalah integral dari fungsi distribusi
probabilitas, dan reliabilitasnya adalah 1 minus fungsi distribusi kumulatif
kegagalan.
Contoh 2.13
Tentukan rata-rata waktu kegagalan, fungsi distribusi probabilitas kegagalan,
fungsi distribusi kumulatif kegagalan dan reliabilitas sistem standby dengan dua
subsistem yang mempunyai fungsi distribusi probabilitas berupa fungsi
eksponensial yang diberikan dengan
(2.59)0t,e)t(f ti ≥= −λλ
Penyelesaian
Waktu kegagalan untuk setiap subsistem adalah λ1 , jadi tingkat kegagalan sistem
standby adalah
λ2)T(E sb = (2.60)
Dari persamaan 2.58,fungsi distribusi probabilitas kegagalan adalah
0t,tedtee)t(f t2
0
)t(t2sb,2 ≥== −
∞−−−∫ λλλλ λλ (2.61)
32
Perhatikan bahwa fungsi distribusi probabilitas adalah 0 saat 0=t dan bernilai
maksimum saat λ1
=t . Pengintegralan menghasilkan fungsi distribusi kumulatif
kegagalan, yaitu
∫ ≥+−== −t
0
tsb,2sb,2 0t,e)t1(1d)(f)t(F λλττ (2.62)
Reliabilitasnya
(2.63)0t,e)t1()t(F1)t(R tsb,2sb,2 ≥+=−= −λλ
Seperti pada persamaan 2.60, pengintegralan reliabilitas dari 0 sampai tak hingga
menghasilkan rata-rata waktu kegagalan.
2.5 Distribusi Bernoulli
Distribusi Bernoulli didasarkan atas ruang sampel yang dibangkitkan dari
percobaan Bernoulli. Ruang sampel ini terdiri atas dua unsur yang biasanya
disimbolkan dengan “sukses” dan “gagal”, dengan probabilitas sukses P(S)=p dan
probabilitas gagal P(G)=1-p. Jika sukses disimbolkan dengan 1 dan gagal dengan
0, maka fungsi probabilitas Bernoulli dapat didefinisikan sebagai berikut :
Definisi 2.5.1 fungsi Probabilitas Bernoulli
Jika X adalah variabel random bernoulli maka fungsi probabilitas X adalah
⎩⎨⎧ =−
==−
selainnya,01,0x,)p1(p
)p;x(f)x(fx1x
XX (2.64)
Sifat-sifat percobaan Bernoulli adalah :
a. Setiap percobaan menghasilkan satu dari dua hasil yang mungkin
yang dinamakan sukses dan gagal.
33
b. Untuk setiap percobaan, probabilitas sukses P(S) adalah sama dan
ditulis P(S) = p, dan probabilitas gagal P(G) = (1-p)dan biasa ditulis
sebagai q, maka p+q = 1.
c. Percobaan yang satu dengan yamg lain saling bebas.
Contoh percobaan Bernoulli ysng psling sederhana adalah pelemparan
mata uang logam, di mana terjadinya gambar dan angka dapat dikatakan sukses
dan gagal. Jika mata uang logam tersebut seimbang, maka 21
== qp .
2.6 Distribusi Binomial
Suatu percobaan seringkali terdiri atas ulangan-ulangan dan masing-masing
mempunyai kemungkinan hasil yang dapat diberi nama sukses atau gagal.
Misalnya dalam pengambilan 5 kartu berturut-turut, pengambilan dapat dikatakan
sukses jika yang terambil adalah kartu warna hitam. Bila setiap kali kartu
dikembalikan sebelum pengambilan berikutnya, maka percobaan tersebut bersifat
bebas dan peluang keberhasilan setiap ulangan tetap sama yaitu 21 . Percobaan
semacam ini disebut sebagai percobban Binomial yang tak lain adalah percobaan
yang terdiri atas ulangan-ulangan percobaan Bernoulli.
Percobaan Binomial adalah percobaan yang memiliki ciri-ciri sebagai berikut
a. Percobaan terdiri atas n ulangan.
b. Dalam setiap ulangan, hasilnya dapat digolongkan sebagai sukses dan
gagal.
34
c. Peluang sukses, yang dilambangkan dengan p, untuk setiap ulangan
adalah sama.
d. Ulangan-ulangan tersebut adalah saling bebas.
Definisi 2.6.1 Distribusi Binomial
Jika X adalah variabel random Binomial, maka distribusi probabilitas X adalah
(2.65)n...,,1,0xuntuk,)p1(pxn
)p,n;x(b xnx =−⎟⎟⎠
⎞⎜⎜⎝
⎛= −
Teorema 2.6.1
Nilai harapan dan variansi untuk variabel random yang berdistribusi Binomial b(x; n,p) adalah
E(X)=np dan Var[X]=np(1-p)
Bukti :
Nilai harapan untuk distribusi Binomial
∑
∑
∑
∑
=
−−
=
−
−
=
−
=
−−−−
=
−−−
=
−−
=
−⎟⎟⎠
⎞⎜⎜⎝
⎛=
n
1x
xn1x
n
1x
xnx
xnxn
0x
xnxn
0x
)!xn()!1x()p1(pp)!1n(n
)p1(p)!xn()!1x(
!n
)p1(p)!xn(!x
!nx
)p1(pxn
x)X(E
35
np
)p1(p1x1n
np
)p1(p)!1x())!1x()1n((
)!1n(np
)!xn()!1x()p1(p)!1n(np
n
1x
))1x()1n((1x
))1x()1n(()1x(n
1x
n
1x
xn1x
=
−⎟⎟⎠
⎞⎜⎜⎝
⎛−−
=
−−−−−
−=
−−−−
=
∑
∑
∑
=
−−−−
−−−−
=
=
−−
Variansi untuk distribusi Binomial
)X(E)X(E))1X(X(E 2 −=−
2
n
1x
))2x()2n((22x
n
1x
))2x()2n((x
))2x()2n((xn
1x
xnxn
2x
n
1x
xnx
xnxn
0x
p)1n(n
)p1(pp2x2n
)1n(n
)p1(p2x2n
)1n(n
)p1(p)!2x()!xn(
)!2n()1n(n
)p1(p)!2x()!xn(
!n
)p1(p)!1x()!xn(
!n)1x(
)p1(pxn
)1x(x))1X(X(E
−=
−⎟⎟⎠
⎞⎜⎜⎝
⎛−−
−=
−⎟⎟⎠
⎞⎜⎜⎝
⎛−−
−=
−−−
−−=
−−−
=
−−−
−=
−⎟⎟⎠
⎞⎜⎜⎝
⎛−=−
∑
∑
∑
∑
∑
∑
=
−−−−
=
−−−
−−−
=
−
=
=
−
−
=
npnppn)X(E
p)1n(n)X(E)X(Ep)1n(n))1X(X(E
2222
22
2
+−=
−=−
−=−
[ ]
)p1(npnpnp
pnnpnppn))X(E()X(EXVar
2
22222
22
−=−=
−+−=
−=
■
36
2.7 Teorema Limit Pusat
Salah satu teorema yang penting dalam statistika adalah Teorema Limit Pusat.
Teorema ini penting karena teoema ini memberikan jaminan jika suatu populasi
berdistribusi sembarang ( tidak harus normal ) maka untuk jumlah sampel yang
cukup besar distribusi sampling nilai rata-rata akan berdistribusi normal. Teorema
Ketunggalan ( Uniqueness Theorem ) berikut digunakan untuk menentukan
distribusi probabilitas suatu variabel random melalui fungsi pembangkit momen
(f.p.m ).
Teorema 2.7.1. Teorema Ketunggalan.
Andaikan untuk setiap variabel random X dan Y fungsi-fungsi pembangkit
momennya ada, yaitu berturut-turut dan . Jika =
untuk setiap t, maka X dan Y memiliki distribusi probabilitas yang sama.
)t(M x )(tM y )t(M x )t(M y
( Bukti teorema di atas di luar cakupan tulisan ini )
Definisi 2.7.1 Distribusi Normal
Variabel random X dikatakan berdistribusi normal dengan mean μ dan variansi
jika fungsi probabilitas kontinunya adalah 2σ
.0,;X;e2
1),;x(f)x(f 2
2
2)x(
XX >∞<<∞−∞<<∞−==−−
σμπσ
σμ σμ
(2.66)
Jika suatu variabel random X berdistribusi normal dengan mean μ dan
variansi maka ditulis . 2σ ),(N~X 2σμ
37
Teorema 2.7.2
Jika X adalah variabel random yang berdistribusi normal dengan mean μ dan
variansi maka fungsi pembangkit momen bagi X adalah 2σ
(2.67)2tt
X
22
e)t(mσμ +
=
dan bila σμ−
=XZ maka 2
t
Z
2
e)t(m =
Bukti
( )( )
( ) ( )
( )[ ]dxe
21e
dxe2
1e
dxee2
1e
)e(Ee)e(E)t(M
)x(t2X2
1t
2x
t
xt2x
t
)X(tttXX
222
xt2
2
μσμσμ
σμ
μ
μσμ
μ
μμ
πσ
πσ
πσμ
−−−−∞
∞−
+−−∞
∞−
−−−∞
∞−
−
∫
∫
∫
=
=
=
==
−
Karena ( )[ ]
2422
24242222
t)tx(tt)x(t2)x()x(t2X
σσμ
σσμσμμσμ
−−−=
−+−−−=−−−
Maka
dxe2
1eedxe2
1ee
dxee2
1edxe2
1e)t(m
2
2222
2
2222
22
2
22
2
2422
2]))t(x[(
2t
t2])tx[(
2t
t
2t
2])tx[(
t2t)tx(
tX
σσμσ
μσσμσ
μ
σσσμ
μσσσμ
μ
πσπσ
πσπσ−−−∞
∞−
−−−∞
∞−
−−−∞
∞−
−−−−∞
∞−
∫∫
∫∫
==
==
Akan tetapi,
1dxe2
1 2
22
2]))t(x[(
=−−−∞
∞−∫ σ
σμ
πσ
38
Sehingga
2t
t2t
tX
2222
eee)t(mσ
μσ
μ +==
)t(mX ini merupakan fungsi pembangkit momen dari distribusi normal dengan
mean μ dan variansi . Karena maka 2σ 1dan0 2ZZ == σμ
2t
2t.1
0t
Z
22
ee)t(m ==+
yang merupakan fungsi pembangkit momen dari distribusi normal standar.
Sehingga Z berdistribusi normal standar berdasarkan Teorema Ketunggalan.
■
Teorema 2.7.3 Distribusi sampling Mean dan Variansi
Misalkan ,...., X1X n adalah sampel random dari suatu populasi dengan
fungsi probabilitas f(o) yang memiliki mean μ dan variansi . Jika 2σ
∑=
⎟⎠⎞
⎜⎝⎛=
n
1iiX
n1X adalah mean sampel maka
(2.68)( ) μμ == xXE dan Var ( )X = n
22x
σσ =
Bukti
[ ] μμ ==⎥⎦
⎤⎢⎣
⎡=
⎟⎠
⎞⎜⎝
⎛=
⎟⎠
⎞⎜⎝
⎛=
∑
∑
∑
=
=
=
nn1X
n1
XEn1
Xn1E)X(E
n
1ii
n
1ii
n
1ii
39
nn
n1
)X(Varn1
XVarn1
Xn1Var)X(Var
22
2
n
1ii2
n
1ii2
n
1ii
σσ ==
=
⎟⎠
⎞⎜⎝
⎛=
⎟⎠
⎞⎜⎝
⎛=
∑
∑
∑
=
=
=
■
Teorema ini berlaku apabila pemilihan sampel dilakukan dengan pengembalian
Secara tegas, teorema ini mengatakan apabila ,...., X1X n adalah sampel
random dari sembarang distribusi dengan mean μ dan variansi maka 2σ
( ) μμ == xXE dan Var ( )X = n
22x
σσ = . Teorema ini tidak mengatakan apakah
X berdistribusi normal atau tidak. Jika distribusi dari X dijadikan sebagai pusat
perhatian, maka teorema berikut ini yang dikenal sebagai teorema limit pusat akan
menjawab pertanyaan bagaimana X berdistribusi .
Teorema 2.7.4 Teorema Limit Pusat.
Misalkan fx(x) adalah fungsi probabilitas dengan mean μ dan variasi σ2 dan nX
adalah mean sampel random berukuran n dari fx(x). Jika Zn adalah variabel
random yang didefinisikan sebagai
n
XZ nn σ
μ−= (2.69)
Maka untuk n → ∞, Zn berdistribusi mendekati distribusi normal standar.
40
Bukti:
Fungsi pembangkit momen dari variabel random adalah nZ
( ) ( )( )( )
( )[ ]
( ) ( ) ( )
n
n
YY
n
Y
n
i
n/Yt
tZZ
)n(sn
t
...''Mn!
t'Mn
t
ntM
eE
eEtM
i
n
n
⎥⎦
⎤⎢⎣
⎡++=
⎥⎥⎦
⎤
⎢⎢⎣
⎡+
σ+
σ+=
σ=
=
=
μ−μ−
μ−
=
σμ−∏
21
02
01
2
2
2
1
dengan s(n) sebagai suku sisa.
Dengan demikian fungsi pembangkit momen dari , jika menjadi nZ ∞→n
222
2
21 t
nZne)n(s
ntlim)t(Mlim
n=⎥
⎦
⎤⎢⎣
⎡++=
∞→∞→ (2.70)
yang merupakan fungsi pembangkit momen bagi distribusi normal standar.
Sehingga terbukti bahwa . ■ )1,0(N~Zn
2.8 Pendekatan Normal untuk Disribusi Binomial
Teorema Limit Pusat dapat juga digunakan untuk memperkirakan probabilitas
beberapa variabel random diskret, jika probabilitas yang berdasarkan distribusi
sesungguhnya sukar dihitung untuk ukuran sampel n besar. Contoh berikut
berkaitan dengan distribusi Binomial.
Andaikan variabel random Y berdistribusi Binomial dengan n ulangan dan
probabilitas sukses p. Jika akan dihitung )( bYP ≤ , maka dapat digunakan fungsi
41
distribusi probabilitas binomial untuk setiap bilangan bulat tak negatif yang
kurang dari atau sama dengan b. Tabel Binomial memuat nilai-nilai probabilitas
hanya untuk beberapa nilai n yang terbatas. Bila n sangat besar, maka perhitungan
menjadi sukar dan di lain pihak tidak tersedia tabel.
Sebagai alternatif, pandang Y, banyaknya sukses dalam n ulangan, sebagai
jumlah suatu sampel yang tediri atas nilai 0 dan 1, yaitu
∑=
=n
1iiXY (2.71)
di mana
⎩⎨⎧ −
=selainnya,0
suksesanmenghasilkikeulanganjika,1Xi
dan , variabel random yang saling bebas. Berdasarkan Teorema
2.7.3, maka untuk n yang besar, proporsi ulangan yang bernilai sukses adalah
n,...,2,1i,X i =
∑=
==n
1ii XX
n1
nY
akan memiliki distribusi sampling yang mendekati distribusi normal dengan
dan variansi p)X(E i =n
)p1(pn
)X(V −=
Pendekatan ini sangat baik bila p dekat dengan 21 karena distribusi binomial
simetrik bila 21
=p .
42
2.9 Penduga Parameter
Statistika banyak berhubungan dengan penarikan kesimpulan mengenai
parameter populasi. Fungsi variabel random tertentu yang diperoleh dari sampel
random sering digunakan sebagai penduga atau pembuat keputusan tetntang
parameter populasi. Sebagai contoh, jika akan menduga mean suatu populasi µ,
jika diperoleh n pengamatan random , maka cukup beralasan jika µ
diduga dengan
nyyy ...,,, 21
(2.72)∑=
=n
1iiy
n1y
Kebaikan dari penduga ini didasarkan pada perilaku variabel random
dan pengaruh perilaku tersebut terhadap
n21 Y,...,Y,Y
∑=
=n
1iiy
n1y . Variabel random Y adalah
fungsi dari variabel random dan ukuran sampel n. Atau contoh lain,
andaikan berdasar hasil perhitungan dari data sampel, rata-rata produktivitas
kelapa sawait dalam satu tahun sebesar 154,97 kw/ha, maka
ˆ
n21 Y,...,Y,Y
97,154=x . Dengan
demikian, dan y x adalah contoh statistik.
Definisi 2.9.1. Statistik.
Statistik adalah fungsi dari pengamatan yang diperoleh dari sampel random dan
konstanta yang diketahui. Statistik digunakan untuk menarik kesimpulan
( menduga atau memutuskan ) tentang parameter populasi.
43
Penduga parameter merupakan usaha penentuan nilai parameter yang sedang
diselidiki. Untuk melakukan pendugaan nilai suatu parameter dapat dilakukan
denagn dua cara. Cara pertama yaitu dengan menentukan nilai tunggal yang
mendekati nilai parameter itu dengan sebaik-baiknya atau sering disebut penduga
titik. Cara kedua merupakan penentuan suatu selang nilai dengan peluang yang
besar mencakup nilai parameter yang diselidiki yang disebut penduga interval (
selang kepercayaan ).
2.9.1 Penduga Titik
Penduga titik adalah sebarang statistik yang digunakan untuk menduga
parameter θ. Suatu penduga titik bagi suatu parameter populasi adalah nilai
tunggal numerik dari suatu statistik yang relevan dengan parameter tersebut.
Contoh penduga titik adalah sebagai berikut
Andaikan X adalah suatu variabel random Binomial (n:p) maka variabel
random mempunyai mean p dan variansi pn
)p1(p − , dan untuk n besar, harga
variabel random
n)p1(p
ppz−−
= mendekati distribusi normal standar ( Teorema
Limit Pusat ).
2.9.2 Penduga Interval ( Selang Kepercayaan)
Andaikan pada populasi yang berdistribusi normal akan dilakukan
pendugaan parameter θ (μ dan P) maka selang kepercayaan (1-α) bagi parameter
44
populasi adalah suatu interval nilai ]Zˆ,Zˆ[ ˆ2ˆ2 θαθα σθσθ +− sedemikian hingga
]Zˆ,Zˆ[ ˆ2ˆ2 θαθα σθσθθ +−∈ dan ασθθσθ θαθα −=+<<− 1)ZˆZˆ(P ˆ2ˆ2 di mana
penduga titk bagi θ θ . Pernyataan taraf kepercayaan 95% (misalnya) mempunyai
implikasi bahwa jika rencana penarikan sampel berukuran sama dengan teknik
yang sama dilakukan berulang kali, misalnya 100 kali penarikan sampel,
kemudian dari setiap sampel dibuat pernyataan tentang pendugaan selang, maka
sekitar 95 kali dari selang nilai ]Zˆ,Zˆ[ ˆ2ˆ2 θαθα σθσθ +− mencakup parameter
populasi akan benar, dan hanya sekitar 5 kali akan salah.
Data sampel yang diperoleh melalui penarikan sampel menghasilkan nilai
statistik yang dapat digunakan sebagai penduga parameter. Nilai statistik tidak
bisa tepat sama dengan nilai parameter populasi, tetapi dapt ditentukan sejauh
mana ketepatan pendugaan tersebut
2.9.2.1 Metode Pivot
Metode yang sangat berguna untuk menentukan selang kepercayaan disebut
metode Pivot yang memerlukan kuantitas pivot. Ciri-ciri kuantitas pivot adalah
sebagai berikut :
1. Merupakan fungsi dari pengukuran sampel dan parameter θ ( yang tidak
diketahui ). θ merupakan satu-satunya kuantitas yang tidak diketahui.
2. Harus memiliki distribusi probabilitas yang tidak tergantung pada θ
45
Contoh 2.16 Jika diketahui observasi Y berdistribusi normal dengan )1,(μ , tentukan selang
kepercayaan 95% bagi μ bila diketahui kuantitas pivotnya adalah
σμ−
=Yz
Penyelesaian
Periksa apakah syarat dipenuhi:
1. z merupakan fungsi dari observasi Y
z merupakan fungsi dari parameter μ yang tidak diketahui
2. Distribusi probabilitas dari pivot
Bila Y~Normal (μ,σ) maka 2tt
Y
22
e)t(Mσ
μ +=
2t
Z
22
e)t(M
Yzσ
μ
=
−=
distribusi normal dengan 0Z =μ dan 1]Z[Var 2 ==σ
distribusi probabilitas dari pivot
)aYbY(P)bYa(P)bza(P95,0 −<<−=<−<=<<= μμ
96,1a025,0)96,1Z(P025,0)aZ(P
−==−<=<
96,1b975,0)96,1Z(P975,0)bZ(P025,0)bZ(P1025,0)bZ(P
==<=<=<−=>
46
Maka selang kepercayaannya berbentuk
96,1Y96,1Y +<<− μ
2.10 Teori Likelihood
Andaikan adalah sampel random waktu hidup dari sebuah
populasi item dengan distribusi waktu hidup yang mempunyai fungsi densitas f(t).
Distribusi ini memiliki vektor parameter yang tidak diketahui
nttt ,...,, 21
( )',...,, p21 θθθθ = ,
dimana p adalah banyaknya parameter yang tidak diketahui. Karena waktu hidup
adalah saling bebas, fungsi likelihood, ),(L θt adalah hasil kali dari fungsi
densitas yang diduga pada setiap titik sampel :
∏=
=n
1ii ),t(f),(L θθt . (2.73)
dimana Penduga maksimum likelihood diperoleh dengan
memaksimumkan
).t,...,t,t( n21=t θ
),( θtL terhadap θ . Jadi adalah penduga parameter distribusi
yang kemungkinan besar menghasilkan data .
θ
n21 t,...,t,t
Secara praktis, akan lebih mudah untuk memaksimumkan fungsi log
likelihood log ),(L θt untuk memperoleh vektor dari penduga maksimum
likelihood, dimana hal ini valid karena fungsi logaritma adalah bersifat monoton.
Fungsi log likelihood adalah :
∑=
=n
1ii ),t(flog),(Llog θθt (2.74)
dan berdistribusi normal asimtotik oleh teorema limit pusat, karena terdiri atas
jumlahan dari n hubungan yang saling bebas.
47
Karena ),(L θt adalah funsi densitas bersama untuk , maka hal
ini harus sama dengan 1 :
n21 t,...,t,t
(2.75) ∫ ∫ ∫∞ ∞ ∞
=0 0 0
1dt),(L... θt
asumsikan bahwa fungsi likelihood adalah kontinu ( dan karena diferensiasi dan
interal dapat dipertukarkan ), turunan parsial sisi kiri berkenaan dengan satu
parameter iθ menjadi :
[ ] p....,2,1i)(
),(Llog
d),(L),(Llog...
d),(L...d),(L...
i
i
0 0 0 i
0 0 0 0 0 0 ii
==
⎥⎦
⎤⎢⎣
⎡∂
∂=
∂∂
=
∂∂
=∂∂
∫ ∫ ∫
∫ ∫ ∫ ∫ ∫ ∫∞ ∞ ∞
∞ ∞ ∞ ∞ ∞ ∞
θθ
θ
θθ
θ
θθ
θθ
UE
tE
ttt
tttt
(2.76)
dimana ))'(U....,),(U),(U()( p21 θθθθ =U sering disebut sebagai vektor skor.
Pendiferensialan sisi kanan dari persamaan (2.72) berkenaan dengan iθ :
[ ] p...,,2,1i0)(UE i ==θ
atau dalam bentuk vektor adalah
(2.77) [ ] 0U =)(E θ
Contoh 2.17
Andaikan adalah sampel random dari suatu populasi eksponensial
dengan p=1 dan parameter θ, populasi tersebut adalah
n21 t,...,t,t
48
0te1),t(f t ≥= − θ
θθ
Tentukan vektor skor dan penduga maksimum likelihood untuk θ.
Penyelesaian :
Fungsi likelihood populasi tersebut adalah
( )
∑==
=
=
−−−
=
=
∏
∏n
1i
it
i ee1
),t(f,L
ntn
1i
n
1ii
θ
θθ
θθt
θ
Fungsi log likelihoodnya adalah
( ) ∑=
−−=n
1iitlogn,Llog θθθt
Vektor skornya hanya memiliki satu elemen karena hanya terdapat satu parameter
( ) ( )2
n
1iit
1,LlogU
θθθθ
θ∑=+−=
∂∂
=t
.
Persamaan vektor dengan nol dan menyelesaikan penduga maksimum likelihood :
∑=
=n
1iit
n1θ
dimana ini adalah rata-rata sampel.
Pendiferensialan persamaan (2.73) terhadap jθ ( dengan aturan rantai )
adalah
49
[ ] p...,2,1i),(LlogE)(U)(UE
d),(L),(Llog),(L),(Llog),(Llog...
d),(L),(Llog),(L),(Llog...
d),(L),(Llog...
ji
2
ji
0 0 0 ji
2
ji
0 0 0 ji
2
ji
0 0 0 ij
=⎥⎥⎦
⎤
⎢⎢⎣
⎡
∂∂∂
+=
⎟⎟⎠
⎞⎜⎜⎝
⎛
∂∂∂
+∂
∂∂
∂=
⎟⎟⎠
⎞⎜⎜⎝
⎛
∂∂∂
+∂
∂∂
∂=
∂∂
∂∂
∫ ∫ ∫
∫ ∫ ∫
∫ ∫ ∫
∞ ∞ ∞
∞ ∞ ∞
∞ ∞ ∞
θθθθθ
θθθ
θθθ
θθ
θ
θθθ
θθθ
θθ
θθ
θθ
t
tttttt
ttttt
ttt
(2.78)
Karena pernyataan ini adalah turunan kedua dari persamaan (2.72) sisi kiri, dan
turunan kedua dari sisi kanannya adalah nol, maka
(2.79) [ ],p,...,2,1j,p,...,2,1i
)(U)(UE),(LlogE jiji
2
==
=⎥⎥⎦
⎤
⎢⎢⎣
⎡
∂∂∂− θθ
θθθt
Dengan persamaan (2.74), dapat diketahui bahwa [ ] [ ] 0)()( == θθ ji UEUE untuk
dan , sehingga pi ,....2,1= pj ,....2,1=
( ),p,...,2,1j,p,...,2,1i
)(U)(UCov),(LlogE jiji
2
==
=⎥⎥⎦
⎤
⎢⎢⎣
⎡
∂∂∂− θθ
θθθt (2.80)
Elemen ini membentuk Matriks informasi Fisher p×p , I(θ) yang elemen
diagonalnya adalah variansi dari elemen-elemen vektor skor dan elemen-elemen
diagonal kebalikannya adalah covariansi.
Untuk melihat hasilnya adalah terlalu jauh, matriks p×1 untuk vektor skor
U(θ) mempunyai komponen
p....,,2,1i),(Llog)(Ui
i =∂
∂=
θθθ t (2.81)
50
yaitu, ketika disama dengankan nol dan diselesaikan, menghasilkan matriks p×1
penduga maksimum likelihood . Nilai harapan dari vektor skor mempunyai
komponen
θ
(2.82) [ ] p...,,2,1i0)(UE i ==θ
dan matriks variansi-kovariansi adalah
(2.83) [ ])(')(E)(I θθθ UU= .
Matriks tersebut mempunyai komponen
,p,...,2,1j,p,...,2,1i),(LlogE
ji
2
==
⎥⎥⎦
⎤
⎢⎢⎣
⎡
∂∂∂−
θθθt (2.84)
dan ini sering disebut dengan Matriks informasi Fisher.
Contoh 2.18
Dari contoh 2.17, tunjukkan bahwa nilai harapan vektor skor adalah nol dan
tentukan matriks informasi Fisher.
Penyelesaian
Turunan dari vektor skor adalah
3
n
1ii
22
2 t2n),(Llog
θθθθ ∑
=−=∂
∂ t
Nilai harapan vektor skor adalah
51
( )[ ]
.0
n1n
tE1n
t1nEUE
2
n
1ii2
n
1ii2
=
+−=
⎥⎦
⎤⎢⎣
⎡+−=
⎥⎦
⎤⎢⎣
⎡+−=
∑
∑
=
=
θθθ
θθ
θθθ
karena [ ] θ=itE untuk .....,,2,1 ni =
Matriks informasi Fisher adalah :
( )
2
n
1ii3
3
n
1ii
2
2
2
n
tE2n
t2nE
),(LlogEI
θ
θθ
θθ
θθθ
=
⎥⎦
⎤⎢⎣
⎡+−=
⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
−=
⎥⎦
⎤⎢⎣
⎡∂
∂−=
∑
∑
=
=
t
BAB III
PENDUGA FUNGSI SURVIVOR
Sebelum mencari penduga fungsi survivor, akan dibahas terlebih dahulu apa
yang dimaksud fungsi survivor.
3.1 Fungsi Survivor
Fungsi survivor yang juga dikenal sebagai fungsi survival atau fungsi relia-
bilitas adalah sifat dari sebarang variabel random yang memetakan himpunan-
himpunan kejadian, yang biasanya berhubungan dengan kegagalan suatu sistem
dalam sembarang waktu t ( wikipedia.org ).
Fungsi survivor, S(t) adalah generalisasi dari reliabilitas. Dalam statistika, reli-
abilitas didefinisikan sebagai probabilitas suatu barang ( item ) dapat berfungsi
dalam suatu waktu tertentu, sedangkan fungsi survivor adalah probabilitas suatu
barang ( item ) dapat berfungsi dalam sembarang waktu t.
Fungsi survivor dapat ditulis
(3.1) 0t],tT[P)t(S ≥≥=
dimana t = suatu waktu
T = waktu kematian
P = Probabilitas
Dengan kata lain, fungsi survivor merupakan probabilitas dari kegagalan lebih
lama dari waktu yang telah ditentukan. Di sini diasumsikan untuk t = 0.
Fungsi survivor juga sering dikenal sebagai fungsi reliabilitas karena S(t) adalah
1)0( =S
52
53
reliabilitas pada waktu t. Jadi hubungannya dengan fungsi distribusi kumulatif
F(t) adalah untuk variabel random kontinu. Dengan demikian,
implikasi dari hubungan tersebut adalah fungsi survivor harus memenuhi beberapa
kondisi sebagai berikut :
)t(F1)t(S −=
1. 1)0(S =
2. 0)t(Slimt
=∞→
3. monoton turun )t(S
Terdapat dua interpretasi dalam fungsi survivor. Pertama, S(t) adalah proba-
bilitas suatu item individual dapat berfungsi pada waktu t. Dalam menentukan
waktu hidup ( lifetime ), terdapat hal yang sangat penting sebagai dasarnya, yaitu
menentukan distribusi waktu hidup untuk masing-masing komponennya. Kedua,
jika terdapat suatu populasi yang besar dengan distribusi waktu hidup yang sama,
S(t) adalah fraksi harapan dari populasi yang berfungsi pada waktu t.
Fungsi survivor juga digunakan untuk membandingkan pola survival dari be-
berapa populasi. Berikut ini adalah contoh grafik dua fungsi survivor.
S(t)
1.0
0.8
0.6
0.4
0.2
0.0
)t(S1
)t(S 2
0.0 0.5 1.0 1.5 2.0
Grafik 3.1
54
Gambar di atas menunjukkan grafik dua buah fungsi survivor dan ,
untuk populasi 1 dan populasi 2. Karena untuk semua nilai t, dapat
disimpulkan bahwa semua bagian dari populasi 1 lebih unggul dari populasi 2.
)t(S1 )t(S2
)t(S1 ≥ )t(S2
Dalam fungsi survivor, dikenal juga adanya fungsi survivor bersyarat )t(S aTT ≥
yaitu fungsi survivor dari suatu barang yang berfungsi pada waktu a.
Fungsi survivor bersyarat dapat ditulis
at,)a(S)t(S
]aT[P]tT[P
]aT[P]aTandtT[P)t(S aTT ≥=
≥≥
=≥
≥≥=≥ (3.2)
Fungsi survivor bersyarat digunakan untuk membandingkan daya tahan sekelom-
pok barang yang berhasil bertahan hidup pada waktu a.
3.2 Penyensoran Data
Penyensoran sering terjadi pada data waktu hidup, karena tidaklah mungkin
atau bahkan tidak praktis bila harus meneliti seluruh item yang akan diuji. Sebuah
pengamatan dapat tersensor ketika hanya diketahui sebuah batas dalam suatu
waktu kgagalan. Himpunan data yang seluruh waktu kegagalannya diketahui
disebut himpunan data lengkap. Grafik 3.2 menunjukkan suatu himpunan data
lengkap dengan n=5 item yang diuji, di mana X menunjukkan waktu kegagalan.
Jika suatu himpunan data terdiri dari satu atau lebih pengamatan tersensor,
himpunan data ini disebut sebagai himpunan data tersensor.
55
1
2
3
4
5
0
X
X
X
X
X
t
Grafik 3.2 Himpunan data lengkap dengan n=5
Menentukan waktu kegagalan secara tepat lebih baik daripada
mengelompokkan waktu kegagalan ke dalam interval-interval, sehingga dengan
pengecualian tabel hidup, waktu kegagalan diasumsikan telah diketahui untuk
pengamatan tak tersensor.
Terdapat beberapa tipe penyensoran. Salah satu tipe yang sering terjadi adalah
sensor kanan. Dalam suatu himpunan dengan sensor kanan, terdapat satu item atau
lebih untuk sebuah batas bawah yang diketahui dalam suatu waktu hidup. Sebagai
contoh dalam uji hidup dalam dunia industri, 10 mesin masuk servis pada 1
Januari dan 7 item mengalami kerusakan pada 31 Desember. Himpunan data
terdiri dari 7 waktu kegagalan dan 3 pengamatan dengan sensor kanan, karena
waktu kegagalannya akan terjadi pada suatu waktu setelah 365 hari. Banyaknya
item yang diuji dinotasikan dengan n dan banyaknya pengamatan yang gagal
dinotasikan dengan r.
56
Pada sensor kanan, terdapat tiga kasus khusus yang sering terjadi dalam
reliabilitas dan uji daya hidup yaitu penyensoran Tipe I, penyensoran Tipe II dan
penyensoran Random.
3.2.1 Peyensoran Tipe II
Penyensoran Tipe II ini juga sering disebut sebagai penyensoran statistik
terurut. Pada tipe ini, pengamatan diakhiri pada salah satu dari kegagalan-
kegagalan yang terurut.
1
2
3
4
5
X
0
X
O
X
t
O
Grafik 3.3 Himpunan data ternsensor Tipe II dengan n=5 dan r=3
Grafik 3.3 menunjukkan sebuah himpunan dengan n=5 item yang diuji di
mana terdapat kegagalan r=3 dengan X adalah waktu kegagalan dan O adalah
item yang masih bertahan. Dalam penyensoran Tipe II, waktu untuk
menyelesaikan suatu pengujian adalah random.
57
3.2.2 Penyensoran Tipe I
Penyensoran Tipe I ini juga sering disebut penyensoran waktu karena sensor
ini mengakhiri pengamatan pada suatu waktu tertentu.
1
2
3
4
5
X
0
X
X
X
t
O
t1
Grafik 3.4 Himpunan data ternsensor Tipe I dengan n=5 dan r=4 Grafik 3.4 menunjukkan suatu himpunan dengan n=5 item diuji yang diakhiri
pada suatu waktu t1 yang ditunjukkan oleh garis vertikal ( t1 adalah waktu dimana
pengujian dihentiakan ). Dalam penyensoran Tipe I, banyaknya kegagalan adalah
random.
3.2.3 Penyensoran Random
Penyensoran random terjadi ketika item individual terambil dari pengujian
pada setiap waktu selama pengamatan. Ini biasa diasumsikan bahwa waktu hidup
ke i, dan waktu penyensoran ke i, adalah variabel random yang saling bebas. it ic
58
Dengan kata lain, dalam himpunan data tersensor random, suatu item tidak dapat
tersensor karena berada pada resiko kegagalan luar biasa tinggi atau rendah. Tipe
penyensoran ini biasa digunakan di dunia Biostatistik, karena tidaklah bisa untuk
mengontrol kapan seorang pasien untuk masuk ke rumah sakit atau kapan pasien
akan sembuh. Grafik 3.5 menunjukkan suatu himpunan dengan ietm n=5 yang
memiliki waktu penyensoran berbeda-beda untuk masing-masing item.
1
2
3
4
5
Disamping sensor kanan, terdapat pula penyensoran lain yang disebut sensor
kiri. Sensor kiri lebih jarang terjadi daripada sensor kanan. Aplikasi sensor ini
untuk pengukuran ketepatan presisi suatu peralatan. Sebagai contoh dalam terapan
Ilmu Bumi, ketika gas tidak dapat diukur di bawah batas ppm dengan
suatu peralatan tertentu, maka himpunan datanya memuat pengamatan dengan
sensor kiri.
6106 −x
Grafik 3.5 Himpunan data ternsensor Random dengan n=5 dan r=2
O
0
X
O
O
t
X
59
Tipe penyensoran yang lain adalah penyensoran interval yaitu di mana waktu
hidup jatuh pada sebuah interval. Penyensoran ini terjadi untuk kasus di mana data
dikelompokkan dalam suatu interval. Penyensoran ini juga terjadi ketika seuah
item diperiksa secara periodik, misalnya satu minggu atau satu bulan sekali.
Dalam kasus ini, informasi yang didapat mengenai waktu hidup adalah waktu
kegagalan yang terjadi pada awal interval sampai ketika kegagalan terdeteksi.
Secara garis besar, tipe-tipe penyensoran dapat digambarkan dalam sebuah
skema sebagai berikut :
Himpunan data waktu hidup
Disensor
Lengkap
Sensor Kiri
Sensor kanan
Sensor interval
lainnya
Tipe II
Tipe I
Random
Lainnya
Grafik 3.6 Skema Tipe Penyensoran
Dari ketiga pendekatan untuk mengatasi masalah penyensoran, hanya terdapat
satu dari ketiganya yang valid dan praktis. Pendekatan yang pertama adalah
mengabaikan semua nilai tersensor dan hanya menganalisa pada item-item yang
60
diamati untuk gagal. Meskipun secara matematis lebih sederhana, tetapi hal ini
bukan pendekatan yang valid. Misalnya pendekatan ini digunakan pada suatu
himpunan data dengan sensor kanan, penganalisa akan membuang nilai-nilai yang
tersensor kanan dan itu adalah item-item yang bertahan paling lama. Dalam kasus
ini, hasil yang didapat dari analisa waktu hidup diragukan, karena item yang
terbaik ternyata dibuang dari analisa. Pendekatan yang kedua adalah dengan
menunggu semua pengamatan item yang tersensor kanan mengalami kegagalan.
Meskipun hal ini valid secara statistik, namun hal ini tidaklah praktis. Misalnya
dalam suatu industri, bila harus menunggu sampai bola lampu terakhir mati atau
sampai sebuah mesin tidak berfungsi adalah terlalu lama sehingga produk yang
diuji tidak akan didapat dipasaran tepat waktu. Dalam dunia kedokteran,
menunggu sampai pasien terakhir meninggal karena suatu penyakit akan
membutuhkan waktu berpuluh-puluh tahun. Karena alasan-alasan tersebut,
pantaslah bila pendekatan untuk penyensoran dilakukan secara probabilitas,
termasuk nilai tersensor dalam fungsi likelihood.
Fungsi likelihood untuk suatu himpunan data dapat dituliskan dalam beberapa
persamaan yang berbeda. Andaikan adalah pengamatan yang saling
bebas menunjukkan sampel waktu hidup random suatu populasi. Waktu tersensor
kanan yang berhubungan dinotasikan dengan . Dalam kasus sensor
Tipe I, . Himpunan U terdiri atas indeks-indeks item yang
gagal dalm uji ( pengamatan tak tersensor ) :
n21 t,..,t,t
n21 c,...,c,c
cc...cc n21 ====
{ }ii ct|iU ≤=
61
Himpunan C terdiri atas indeks-indeks item yang waktu kegagalannya melebihi
waktu penyensoran yang telah ditentukan ( dengan sensor kanan ) :
{ }ii ct|iC >=
Bentuk yang biasa digunakan untuk data waktu hidup adalah diberikan dengan
pasangan ),x( ii δ , dimana },{min iii ctx = dan iδ adalah variabel indikator
penyensoran :
⎩⎨⎧
≤>
=ii
iii ct,1
ct,0δ (3.3)
untuk i = 1, 2, ...., n. Oleh sebab itu, iδ adalah 1 jika kegagalan item i telah
teramati dan 0 jika kegagalan item i adalah tersensor kanan, dan adalah waktu
kegagalan
ix
)1( i =δ atau waktu penyensoran )0( i =δ . Jika vektor
)',...,,( p21 θθθθ = adalah vektor dengan parameter yang tidak diketahui,
kemudian mengabaikan faktor konstan, fungsi likelihoodnya adalah
(3.4)∏∏∈∈
=Ci
iUi
i ),c(S),t(f),(L θθθx
dimana ),c(S i θ adalah fungsi survivor dengan parameter θ yang dievaluasi pada
waktu penyensoran i, . Alasan bahwa fungsi survivor adalah bentuk yang
tepat dalam fungsi likelihood untuk sebuah pengamatan tersensor kanan adalah
bahwa
Ci∈
),c(S i θ adalah probabilitas item i dapat bertahan ke . Fungsi log
likelihood-nya adalah
ic
∑∑∈∈
+=Ci
iUi
i ),c(Slog),t(flog),(Llog θθθx
atau
62
∑∑∈∈
+=Ci
iUi
i ),x(Slog),x(flog),(Llog θθθx (3.5)
Karena fungsi densitas adalah hasil dari fungsi hazard dan fungsi survivor, maka
fungsi log likelihood dapat disederhanakan menjadi
∑∑∑∈∈∈
++=Ci
iUi
iUi
i ),x(Slog),x(Slog),x(hlog),(Llog θθθθx
atau
(3.6)∑∑=∈
+=n
1ii
Uii ),x(Slog),x(hlog),(Llog θθθx .
Terakhir, untuk menulis log likelihood dalam bentuk hazard dan fungsi hazard
kumulatif adalah
(3.7)∑∑=∈
−=n
1ii
Uii ),x(H),x(hlog),(Llog θθθx
karena H(t) = - log S(t). Pilihan untuk menulis fungsi log likelihood dari ketiga
persamaan mungkin digunakan untuk suatu distribusi tertentu tergantung pada
bentuk tertentu dari S(t), f(t), h(t) dan H(t).
3.3 Penduga Fungsi Survivor
Dalam pembahasan sebelumnya, dijelaskan bahwa fungsi survivor adalah
fungsi yang berkaitan dengan waktu. Fungsi ini memetakan himpunan-himpunan
kejadian kegagalan suatu barang atau populasi dengan suatu waktu t, dengan
fungsi ini akan diketahui berapa besar probabilitas suatu barang atau polulasi da-
pat berfungsi pada t waktu yang telah ditentukan. Namun akan sulit untuk me-
nentukan fungsi survivor tersebut, karena tidak ada yang dapat mengetahui apa
yang akan terjadi untuk waktu yang akan datang, sehingga sulit untuk mengetahui
63
apakah suatu barang ataupun polulasi dapat berfungsi dalam waktu yang telah
ditentukan. Dengan kata lain sulit untuk mengetahui kapan suatu barang atau
populasi akan mengalami kegegagalan atau kerusakan sebelum hal itu benar-benar
terjadi. Oleh karena itu diperlukan suatu model fungsi survivor tersebut sehingga
fungsi survivor dapat diduga.
Dalam pembahasan ini, akan digunakan contoh sekumpulan data waktu
kegagalan beberapa gotri dengan n = 23 dalam suatu pengujian ketahanan. Urutan
waktu kegagalan yang diukur dalam setiap 106 putaran adalah sebagai berikut :
17.88 28.92 33.00 41.52 42.12 45.60 48.48 51.84 51.96
54.12 55.56 67.80 68.64 68.64 68.88 84.12 93.12 98.64
105.12 105.84 127.92 128.04 173.40
Dengan menggunakan data tersebut, gambar 2.3 menunjukkan tiga buah fungsi
survivor yang memberi ilustrasi suatu alasan bahwa penduga secara parametrik
dapat membawa ke suatu kesimpulan yang salah. Tes hidup (life test) dengan
menggunakan n = 23 gotri, dapat disimpulkan ketika semua gotri telah rusak..
64
S(t)
1.0
0.8
0.6
0.4
0.2
0.0 t
0 50 100 150
Fungsi survivor populasi
Pendekatan eksponensial
Penduga nonparametrik
Grafik 3.7 Perbandingan penduga fungsi survivor parametrik dengan nonparametrik
Fungsi survivor tertinggi dalam grafik, menggambarkan fungsi survivor
populasi untuk waktu hidup gotri. Fungsi survivor gotri mewakili distribusi untuk
semua kemungkinan kegagalan gotri. Fungsi survivor populasi mereprensentasi-
kan distribusi waktu kegagalan yang mungkin terjadi dari 23gotri. Fungsi survivor
ini tidak diketahui bentuknya, tetapi jika semua item dalam populasi dapat diuji
kegagalannya dibawah kondisi operasi lingkungan disekitarnya, kurva semacam
ini dapat dihasilkan. Fungsi survivor kedua, yang berupa fungsi tangga adalah
penduga nonparametrik dari S(t) untuk 23 sampel waktu hidup gotri dari suatu
populasi. Secara sederhana, penduga nonparametik S(t) adalah jumlah gotri yang
rusak dalam suatu waktu t dibagi dengan n. Pendugaan ini cenderung menurun
dengan ukuran n1 untuk setiap titik data. Berdasarkan pada kesalahan sampling,
65
penduga nonparametrik secara umum berada di bawah fungsi survivor populasi
yang sebenarnya. Fungsi survivor yang ketiga adalah pencocokan data dengan
fungsi eksponensial dengan menggunakan penduga biasa untuk tingkat kegagalan
λ, banyaknya kegagalan yang diamati dibagi dengan total waktu dalam tes. Untuk
t kecil, penduga fungsi survivor eksponensial secara signifikan lebih rendah
daripada fungsi survivor populasi. Dari ketiga contoh model pendekatan, fungsi
eksponensial yang berdasar pada pendugaan parameter merupakan penduga yang
buruk untuk fungsi survivor populasi, karena faktor kesalahan sampling dan
pendekatan yang digunakan maka fungsi eksponensial lebih jelek.
Dalam pendugaan nonparametrik, fungsi survivor untuk data lengkap dengan
n waktu hidup adalah tanpa pengamatan yang bernilai sama. Fungsi R(t) dikenal
dengan himpunan resiko ( risk set ), terdiri dari semua item yang gagal untuk
waktu t. Misalkan )t(R)t(n = adalah bilangan pokok, atau jumlah elemen dalam
R(t). Penduga nonparametrik untuk fungsi survivor yang paling sederhana adalah
0t,n
)t(n)t(S ≥= (3.8)
dimana ini biasanya dihubungkan dengan fungsi survivor empiris. Fungsi tangga
ini memiliki tangga turun, yaitu n1 untuk setiap pengamatan waktu hidup. Fungsi
survivor juga berhubungan dengan distribusi diskrit untuk n titik yang
berkemungkinan sama. Nilai-nilai yang sama tidaklah sukar untuk
disesuaikan,karena rumus untuk adalah sama dan fungsinya juga akan )(ˆ tS
66
bergerak dengan tangga turun nd jika ada d buah pengamatan yang sama pada
suatu waktu.
Bila tidak terdapat nilai yang sama dalam sekumpulan data, untuk menentukan
pendekatan selang kepercayaan asimtotik untuk fungsi survivor, didasarkan pada
pendekatan normal untuk distribusi binomial.
Untuk setiap n item dalam tes, survival ke t dapat dianggap sebagai percobaan
Bernoulli. Jadi jumlah item yang bertahan (survive ) ke waktu t, atau n(t), mem-
punyai distribusi Binomial dengan parameter n dan probabilitas suksesnya S(t),
dimana sukses didefinisikan dapat bertahan ke waktu t. Penduga fungsi survivor
pertama, n
)t(n)t(S = adalah fraksi sukses yang memiliki nilai harapan
[ ] )t(S)t(SE = dan variansi [ ]n
))t(S1)(t(S)t(SV −= ( Teorema 2.5.1 dan 2.5.2 ).
Selanjutnya, ketika ukuran sampel n besar dan S(t) tidak mendekati 0 atau 1,
distribusi Binomial mengasumsikan bahwa sebuah bentuk yang mendekati
perkiraan dengan fungsi densitas probabilitas normal, dapat digunakan untuk me-
nentukan selang penduga untuk S(t). Interval penduga ini lebih akurat, mengeli-
lingi median dari distribusi, karena pendekatan normal untuk distribusi Binomial
bekerja lebih baik ketika probabilitas keberhasilannya 21 , di mana distribusi Bino-
mial simetris. Dengan mengganti S(t) dengan dalam rumus variansi dan )t(S
n))t(S1)(t(S − sebagai pivot, ketepatan pendekatan 100(1-α)%, selang
kepercayaan probabilitas untuk bertahan ke waktu t adalah
67
n))t(S1)(t(Sz)t(S)t(S
n))t(S1)(t(Sz)t(S
22
−+<<
−− αα
(3.9)
Contoh 3.1
Dengan menggunakan data waktu kegagalan gotri, tentukan penduga
nonparametrik fungsi survivor dan 95% selang kepercayaan untuk probailitas
gotri akan bertahan selama 50.000.000 putaran.
Penyelesian
Penduga nonparametrik fungsi survivor ditunjukkan oleh grafik 3.8.
Dalam grafik tersebut, tangga turun dihubungkan oleh garis vertikal. Ini
digunakan ketika membandingkan pengamatan penduga S(t) untuk dicocokkan
dengan model parametrik. Fungsi survivor bergerak dengan tangga turun dengan
ukuran
)t(S
)t(S
231 untuk setiap nilai data, dengan pengecualian pada nilai 68,64 yang
bergerak menurun dengan ukuran 232 . Karena data diberikan dalam putaran,
penduga fungsi survivor saat t=50 adalah
610
696,02316)50(ˆ ==S dan selang
kepercayaan untuk fungsi survivor saat t=50 adalah
23))50(S1)(50(S96.1)50(S)50(S
23))50(S1)(50(S96.1)50(S −
+<<−
−
884.0)50(S508.0 <<
68
1.0 0.8 0.6 0.4 0.2 0.0 0 50 100 150
Grafik 3.8 Penduga nonparametrik untuk data gotri
Proses ini dapat berlaku untuk semua nilai t, wilayah kepercayaan 95% untuk
S(t) ditunjukkan dengan garis patah-patah pada grafik 3.8. Wilayah kepercayaan
dibatasi oleh 0 dan 1. Tidak terdapat nilai kepercayaan untuk nilai pertama
pengamatan kegagalan yaitu 17.88. Hal ini sesuai kenyataan bahwa adalah 1
untuk nilai t yang berada diantara 0 dan waktu kegagalan pertama, jadi batas
teratas dan terendah selang kepercayaan adalah 1.
)t(S
Secara umum, yaitu untuk semua nilai dan nilai tersensor adalah sebagai
berikut. Andaikan dengan k adalah waktu kegagalan yang jelas dan
andaikan melambangkan banyaknya kegagalan pada saat dan
k21 y.,..,y,y
jd k...,,2,1j,y j =
69
ini biasanya untuk menggolongkan semua nilai yang telah disensor pada .
adalah himpunan semua indeks dan item yang berisiko sebelum waktu
jy
)y(R j
k...,,2,1j,y j = .
Pencarian penduga fungsi survivor dimulai dengan mengasumsikan bahwa
data muncul dari distribusi diskrit dengan nilai distribusi k21 y...yy <<< . Untuk
distribusi diskrit adalah probabilitas bersyarat dengan interpretasi )y(h j
[ ]jjj yTyTP)y(h ≥== . Fungsi survivor dapat ditulis dalam fungsi hazard
dengan nilai mass
(3.10) 0t)]y(h1[)t(S)'t(Rj
i ≥−= ∏∈
dimana R(t)’ adalah komplemen dari himpunan risiko pada waktu t. Jadi penduga
rsional untuk S(t) adalah
(3.11) ∏∈
−)'j(Rj
j )]y(h1[
dengan menurunkan masalah penduga fungsi surbibor sehingtga fungsi hazard
berada pada nilai mass. Elemen yang tepat untuk fungsi likelihood pada nilai
mass adalah jy
(3.12) jjj dnj
dj )]y(h1[)y(h −−
untuk j=1, 2, ... , k
Pernyataan diatas benar karena adalah banyaknya kegagalan pada ,
adalah banyaknya item dalam tes yang tidak gagal saat dan adalah
jd jy jj dn −
jy )y(h1 j−
70
probabilitas bersyarat kegagalan setelah waktu dalam bertahan ke waktu .
Jadi fungsi likelihood untuk adalah
jy jy
)y(h...,),y(h),y(h k21
jjj dnj
k
1j
djk21 )]y(h1[)y(h))y(h...,),y(h),y(h(L −
=
−=∏ (3.13)
{ }∑=
−−+=k
1jjjjjjk21 )]y(hilog[)dn()y(hlogd))y(h...,),y(h),y(h(Llog (3.14)
Elemen ke-i dalam nilai vektor adalah
(3.15) )y(h1
dn)y(h
d)y(h
))y(h...,),y(h),y(h(Llog
i
ii
i
i
j
k21
−−
−=∂
∂
untuk i=1,2,...,k
Jika persamaan di atas sama dengan nol maka wilayah penyelesaian penduga
maksimum likelihood untuk wilayah adalah )y(h i
i
ii n
d)y(h = (3.16)
Penduga ini tampaknya cukup beralasan, karena adalah kegagalan
item dalam tes pada waktu . Jadi rasio dengan adalah penduga yang
layak bagi probabilitas bersyarat untuk kegagalan pada waktu . Persamaan ini
mungkin membawa ke bentuk yang familiar, pada suatu waktu , menduga
dengan dibagi n adalah ekivalen dengan menduga probabilitas ‘sukses’,
yaitu kegagalan pada waktu untuk setiap item yang diuji. Jadi persamaan
ini ekivalen dengan menentukan penduga maksimum likelihood untuk probabilitas
sukses untuk k variabel random binomial.
)y(h i id in
iy id in
iy
iy
)y(h i id
iy in
71
Dengan menggunakan pendugaan untuk fungsi hazard pada ini, penduga
fungsi survivor menjadi
iy
∏
∏
∈
∈
⎥⎥⎦
⎤
⎢⎢⎣
⎡−=
−=
)'t(Rj j
j
)'t(Rjj
nd
1
)]y(h1[)t(S
(3.17)
yang biasa dikenal sebagai penduga Kaplan-Meier atau penduga produk-limit.
Masalah yang sering muncul pada pendugaan produk-limit adalah pengamatan
waktu kegagalan terakhir tidak dapat didefinisikan. Cara yang biasa digunakan
untuk mengatasi masalah ini adalah dengan menghilangkan penduga pengamatan
waktu kegagalan terakhir . ky
Contoh 3.2
Sebuah percobaan dilakukan untuk menentukan pengaruh suatu obat yang
bernama 6-mercaptopurin (6-MP) terhadap waktu penyembuhan leukimia. 21
penderita leukimia diambil sebagai sampel dan diobati dengan 6-MP dan waktu
penyembuhannya dicatat. Dari situ, terdapat r=9 individu yang waktu
penyembuhannya diamati sedangkan 12 pasien lainnya disensor secara random.
Andaikan tanda ‘*’ melambangkan pengamatan yang disensor, data waktu
penyembuhannya ( dalam minggu ) adalah
6 6 6 6* 7 9* 10 10* 11* 13 16
17* 19* 20* 22 23 25* 32* 32* 34* 35*
tentukan penduga S(14) untuk data di atas.
72
Penyelesaian
Himpunan data terdiri atas n = 21 pasien dalam tes, kegagalan yang diamati r = 9
dan terdapat k = 7 waktu kegagalan yang berbeda. Tabel 3.1 memberikan nilai-
nilai dari jjjjj nd1dan,n,d,y − untuk j = 1, 2, ...,7.
j jy jd jn jj nd−1
1
2
3
4
5
6
7
6
7
10
13
16
22
23
3
1
1
1
1
1
1
21
17
15
12
11
7
6
2131−
1711−
1511−
1211−
1111−
711−
611−
Tabel 3.1 Perhitungan produk-limit untuk kasus pengobatan 6-MP
Secara khusus, penduga produk-limit fungsi survivor pada saat t = 14 minggu
adalah
69.0255176
1211
1511
1711
2131
nd
1)14(S)14(Rj j
j
=
=
⎥⎦⎤
⎢⎣⎡ −⎥⎦
⎤⎢⎣⎡ −⎥⎦
⎤⎢⎣⎡ −⎥⎦
⎤⎢⎣⎡ −=
⎥⎥⎦
⎤
⎢⎢⎣
⎡−= ∏
∈
73
t
0 10 20 30 40
S(t)
0.0
0.2
0.4
0.6
0.8
1.0
Grafik 3.9 penduga produk-limit fungsi survivor untuk data 6MP
Pengaruh pengamatan tersensor pada penduga fungsi survivor adalah berupa
fungsi tangga turun yang lebih lebar pada waktu kegagalan berikutnya. Jika
terdapat nilai-nilai diantara pengamatan dan waktu penyensoran, seperti pada
waktu 6, kesepakatan untuk memasukkan nilai tersensor dalam himpunan resiko
berarti bahwa akan terdapat tangga turun yang lebih lebar sesuai dengan nilai-nilai
tersebut. Dengan catatan penduga pada saat waktu 23 dihilangkan karena itu
adalah waktu pengamatan terakhir.
Untuk menentukan penduga variansi dari penduga produk-limit akan lebih
sulit secara signifikan dibanding dengan kasus yang tidak menggunakan
74
penyensoran. Matriks informasi Fisher yang diamati membutuhkan sebuah
penurunan nilai vektor yaitu
(3.18) ))y(h1(
dn)y(h
d)y(h)y(h
))y(h...,),y(h),y(h(Llog2
i
ii2
i
i
ji
k21
−−
+=∂∂
∂−
di mana i=j dan 0 untuk selainnya. Matriks informasi Fisher yang diamati
keduanya adalah diagonal. Dengan mengganti dengan penduga maksimum
likelihood, elemen diagonal dari matriks informasi yang diamati menjadi
)y(h i
( )
( )( )
( )( )
( )
( )iii
3i
iii
i2ii
2i
3i
iii
i2iii
2i
ii
2i
i
2i
2ii
2iii
2i
2ii
2iii
2i
2iii
2i
2ii
2i
2i
i
i
ii
2i
2i
i
2
i
i
ii2
i
i
i
nd
)y(h2
i
k212
dndn
dnddndnn
dnddndnn
dnn
dn
dnndn
dnd
dnd2nndn
dnd
nd
nd21
dn
ndd
nd1
dn
nd
d)y(h
))y(h...,),y(h),y(h(Llog
i
ii
−=
−+−
=
−+−
=
−+=
−−
+=
+−−
+=
+−
−+=
⎟⎟⎠
⎞⎜⎜⎝
⎛−
−+
⎟⎟⎠
⎞⎜⎜⎝
⎛=⎥
⎦
⎤⎢⎣
⎡∂
∂−
=
(3.19)
untuk i = 1, 2, ..., k. Dengan menggunakan fakta tersebut dan beberapa
pendekatan, penduga variansi menurut Greenwood ( Reliability, 1995 ) untuk
fungsi survivor adalah
75
∑∈ −
=)t(Rj jjj
j
)dn(nd
)]t(S[)]t(S[V (3.20)
yang sering dikenal dengan formula Greenwood. Rumus tersebut dapat digunakan
untuk menentukan selang kepercayaan asimtotik untuk S(t) dengan menggunakan
titik kritis normal, yaitu
)]t(S[VZ)t(S)t(S)]t(S[VZ)t(S 22 αα +<<− (3.21)
Contoh 3.3
Dengan menggunakan data pada contoh 3.2, tentukan selang kepercayaan 95%
untuk probabilitas survival ke waktu 14.
Penyelesaian
Penduga titik untuk survival waktu ke 14 dalam contoh 3.2 adalah 0.69. Dengan
menggunakan formula Greenwood, variansi untuk penduga fungsi survivor pada
saat t = 14 dapat diduga, yaitu
011.0)112(12
1)115(15
1)117(17
1)321(21
3)69.0(
)dn(nd
)]14(S[)]14(S[V
2
)14(Rj jjj
j2
=
⎥⎦
⎤⎢⎣
⎡−
+−
+−
+−
=
−= ∑
∈
jadi penduga untuk standar deviasi dari fungsi survivor untuk semua nilai t adalah
11.0011.0 = pada saat t=14. interval kepercayaan 95% untuk S(14) adalah
90.0)14(S48.0011.096.169.0)14(S011.096.169.0
)]14(S[VZ)14(S)14(S)]14(S[VZ)14(S 22
<<+<<−
+<<− αα
76
Grafik 3.10 menunjukkan batas kepercayaan 95% untuk fungsi survivor untuk
semua nilai t.
Survival Curve
t
0 10 20 30 40
S(t)
0.0
0.2
0.4
0.6
0.8
1.0
Grafik 3.10 Batas interval kepercayaan untuk penduga produk-limit fungsi
survivor untuk data 6MP
3.3 Tabel Hidup
Tabel hidup (life table) telah digunakan dalam sejarah aktuaris untuk menduga
distribusi survival manusia, tetapi penggunaan yang lebih tepat adalah untuk
reliabilitas dan situasi biostatistik untuk data yang dikelompokkan. Dengan
asumsi bahwa waktu dibagi dalam k interval .
Aplikasi dalam asuransi, secara tipikal intervalnya memiliki lebar yang sama (1
)a,a[),....,a,a[),a,a[ k1k2110 −
77
tahun) karena biaya asuransi berubah-ubah berdasar umur individu. Dalam hal ini
akan dibahas secara umum yaitu intervalnya tidak selalu memiliki lebar yang
sama. menyatakan banyaknya kegagalan dalam interval j, menyatakan
banyaknya item tersensor dalam interval j dan dinotasikan sebagai banyaknya
item yang beresiko dalam interval j, j = 1, 2, ...k. Untuk sebuah item yang
berfungsi pada awal interval j , probabilitas bersyarat untuk kegagalan dalam
iterval dapat diduga dengan
jd jm
jn
j
j
nd
jika data tersensor di akhir interval atau dengan
jj
j
mnd−
jika data tersensor di awal interval. Ketentuan yang biasa digunakan
untuk menduga probabilitas bersyarat tersebut adalah dengan 2mn
d
jj
j
− dengan
pertimbangan bahwa item tersensor selama dalam interval hanya akan beresiko
setengah dari interval tersebut. Analog dengan penduga produk-limit fungsa
survivor, tabel hidup penduga fungsi survivor pada saat adalah ja
∏=
⎟⎟⎠
⎞⎜⎜⎝
⎛−
−=j
1i ii
jj 2mn
d1)a(S (3.22)
untuk j = 1,2,...,k. Penduga fungsi survivor ini memiliki ketidakkontinuan pada
batas interval dan konstan bila berada sepanjang interval. Formula Greenwood
dapat digunakan untuk menduga variansi dari penduga fungsi survivor ini.
Dengan mengganti dengan jn 2mn ii − menjadi
(3.23) ∑= −−−
=j
1i iiiii
i2jj )d2mn)(2mn(
d)]a(S[)]a(S[V
78
untuk j=1,2,..,.k
Contoh 3.4
Pengobatan dengan 6-MP dibagi dalam k=5 interval yang tidak sama. Intervalnya
yaitu banyaknya individu yang beresiko, banyaknya penderita kanker yang
diamati dan benyaknya penyensoran selama dalam interval j diberikan dalam
tabel 3.2. Seperti sebelumnya, penduga pengamatan kegagalan terakhir
dihilangkan. Tentukan penduga titik dan interval kepercayaan 95% untuk S(14).
j 1−ja ja jn jd jm2/)( jj
j
mnd−
( )jaS )(ˆ[ˆ jaSV
1 0 8 21 4 1 418 0.80 0.088
2 8 12 16 1 3 292 0.75 0.098
3 12 18 12 2 1 234 0.62 0.12
4 18 24 9 2 2 41 0.46 0.13
5 24 36 5 0 5 0 0 0
Tabel 3.2 Tabel hidup untuk data pengobatan 6-MP
Penyelesaian
Dari tabel terlihat dan . Pengelompokan data
menyebabkan perubahan signifikan dalam pendugaan pada saat t = 14 minggu,
75.0)12(S = 62.0)18(S =
79
jadi asumsikan bahwa penduga fungsi survivor adalah konstan
sepanjang interval [12,18). Interval kepercayaan 95% untuk S(14) adalah
75.0)14(ˆ =S
94.0)14(56.0)98(1.96)(0.00.75S(14)98)(1.96)(0.0-0.75
<<+<<
S
Pada dasarnya, tabel hidup berasal dari ilmu asuransi. Ketika berhubungan
dengan populasi manusia, ukuran sampel dapat membesar seara ekstrim, menuntut
penduga survival yang sangat akurat. Ada dua tipe tabel hidup yang digunakan
oleh para aktuaris, yaitu tabel hidup generasional dan tabel hidup searah.
3.4.1 Tabel hidup generasional
Tabel hidup generasional menggolongkan pengalaman survival dari sebuah
kelompok individu yang lahir pada tahun yang sama. Semua individu yang lahir
pada tahun tertentu tersebut dipertimbangkan dengan tahun yang berurutan, dan
tabel hidup generasional mencerminkan kematian untuk semua individu tersebut.
3.4.2 Tabel hidup searah
Tabel hidup searah berbeda dengan tabel hidup generasional, tabel ini
mempertimbangkan individu-individu dari semua umur dalam suatu tahun
tertentu, misalnya tahun 1988. Pola survival untuk semua individu adalah subyek
untk tingkat kematian selama tahun 1988. Faktor-faktor yang mempengarui
kematian adalah kemajuan medis, nutrisi, faktor lingkungan dan kehidupan
keluarga. Jadi tabel hidup searah memberi sebuah potret tentang kematian yang
terjadi dalam suatu tahun tertentu. Tabel ini biasanya digunakan oleh aktuaris
untuk menentukan tarif polis asuransi hidup suatu individu.
80
Berikut ini adalah contoh tabel hidup Amerika Serikat yang menggunakan
100.000 kelahiran pada saat t=0. Seperti terlihat dalam tabel 3.3, penduga
variansinya lebih kecil secara signifikan dari pada contoh tabel hidup sebelumnya.
Kebanyakan dari tabel hidup seperti ini terbagi atas jenis kelamin dan ras. Tipe
tabel hidup ini adalah cocok untuk suatu opulasi tetapi tidak untuk sebuah
individu. Faktor genetik, jabatan dan gaya hidup akan meningkatkan atau
menurunkan probabilitas survival survival semua orang. Kolom menunjukkan
kematian bayi.
jd
j 1−ja ja jn jd jm ( )jaS )(ˆ[ˆ jaSV
1 0 1 100000 999 0 0.990 0.000314
2 1 5 99.001 128 0 0.989 0.000334
3 5 10 98.803 120 0 0.988 0.000351
4 10 15 98.683 134 0 0.986 0.000369
5 15 20 98.549 431 0 0.982 0.000422
6 20 25 98.118 565 0 0.976 0.000482
7 25 30 97.553 596 0 0.970 0.000537
8 30 35 96.957 717 0 0.963 0.000596
9 35 40 96.240 924 0 0.954 0.000664
10 40 45 95.316 1204 0 0.942 0.000741
11 45 50 94.112 177 0 0.924 0.000838
12 50 55 92.335 2766 0 0.896 0.000964
13 55 60 89.569 4238 0 0.854 0.0012
14 60 65 85.331 6208 0 0.792 0.00128
15 65 70 79.123 8344 0 0.708 0.00144
16 70 75 70.779 11,096 0 0.597 0.00155
81
17 75 80 59.683 13,654 0 0.461 0.00158
18 80 85 46.029 15,858 0 0.302 0.00145
∞19 85 30.171 30,171 0 0.000 .
Tabel 3.3 Tabel hidup untuk Amerika Serikat pada tahun 1988
3.5 Uji Kolmogorov-Smirnov ( K-S )
Pembahasan dalam tulisan ini hanya ditekankan pada distribusi waktu hidup
kontinu, sehingga uji kelayakan model juga dibatasi untuk distribusi kontinu. Uji
Chi-Square sebenarnya dapat digunakan baik untuk distribusi diskrit maupun
kontinu, namun kekurangannya adalah lebar batas intervalnya berubah-ubah dan
hanya dapat digunakan untuk himpunan data yang berukuran besar.
Fungsi survivor S(t) telah ditekankan dalam pembahasan sebelumnya, namun
fungsi distribusi kumulatif biasa digunakan untuk mendefinisikan uji statistik K-S,
di mana )t(S1]tP[)t(F −=≤= untuk distribusi kontinu. Untuk menjaga
kebiasaan tersebut, F(t) akan digunakan dalam pembahasan pada subbab ini.
Uji goodness of fit K-S bertujuan untuk membandingkan fungsi distribusi
kumulatif empiris dari variabel random T dengan fungsi distribusi kumulatif
hipotesis yang akan bermanfaat dalam penentuan selang kepercayaan bagi S(t)
sebagaimana dalam persamaan (3.9)
Prinsip dari statistik uji K-S adalah menghitung perbedaan maksimum antara
fungsi distribusi kumulatif empiris dengan fungsi distribusi kumulatif yang
dihipotesiskan, . Hipotesis nol dan alternatif untuk uji ini adalah
)t(F
)t(F0
82
)t(F)t(F:H)t(F)t(F:H
01
00
≠= (3.24)
di mana F(t) adalah fungsi distribusi kumulatif yang diuji, sedangkan adalah
distribusi kumulatif yang dihipotesiskan (teoritis). Dengan kata lain, hipotesis nol
adalah bahwa waktu hidup random T mempunyai fungsi distribusi kumulatif
.
)t(F0
)t(F0
Statistik uji Kolmogorov-Smirnov merupakan selisih absolut terbesar antara
dan yang kita sebut deviasi maksimum D. Statistik D ditulis sebagai
berikut :
)t(F )t(F0
)t(F)t(FmaxD 0−=
Nilai D kemudian dibandingkan dengan nilai kritis pada tabel distribusi penarikan
sampel (Tabel D), pada ukuran sample n dan tingkat signifikansi α. Ho ditolak bila
nilai maksimum D yang teramati lebih besar atau sama dengan nilai kritis D
maksimum. Dengan penolakan Ho berarti bentuk distribusi yang teramati dan
distribusi teoritis berbeda secara signifikan. Sebaliknya dengan tidak menolak Ho
berarti tidak terdapat perbedaan signifikansi antara distribusi teramati dan
distribusi teoritis. Perbedaan-perbedaan yang tampak hanya disebabkan variasi
penarikan sampel (sampling variation).
3.5.1 Langkah-langkah uji Kolmogorov-Smirnov
Langkah-langkah uji Kolmogorov-Smirnov adalah sebagai berikut
)t(F)t(F:H)t(F)t(F:H
01
00
≠=
1. Tetapkan :
83
2. Tetapkan α
3. Statistik uji :
)t(F)t(FmaxD 0−=
4. Wilayah kritis :
Dengan mengacu pada tabel D, dapat dilihat probabilitas ( dua sisi )
kejadian menemukan nilai-nilai teramati sebesar D, bila benar. Bila
probabilitas itu sama atau lebih kecil dari α, maka ditolak.
0H
0H
5. Perhitungan :
• Susun frekuensi-frekuensi dari tiap nilai teramati, berurutan dari
nilai terkecil sampai nilai terbesar
• Susun frekuensi kumulatif dari nilai-nilai teramati
• Konversikan frekuensi kumulatif tersebut ke dalam probabilitas,
yaitu ke dalam fungsi distribusi frekuensi kumulatif )t(F
• Hitung nilai z untuk masing-masing nilai teramati, dimana
sttz i −= kemudian dengan menggunakan tabel distribusi normal
didapat )t(F i0
• Susun berdampingan dengan . Hitung selisih absolut
antara dan pada masing-masing nilai termati.
)(ˆitF )(0 itF
)(ˆitF )(0 itF
6. Membuat kesimpulan
84
3.5.2 Statistik Uji Kolmogorov-Smirnov untuk distribusi waktu hidup
Dalam distribusi waktu hidup, selisih absolut terbesar antara dan
disebut deviasi maksimum yang ditulis sebagai berikut
)t(F i )t(F i0
nD
)t(F)t(FSupD 0t
n −= (3.25)
Untuk himpunan data yang lengkap, dimana sup adalah suprimum.
Untuk selanjutnya, pembahasan ini hanya akan mempertimbangkan fungsi
distribusi kumulatif hipotesis . Dengan membandingkan distribusi distribusi
eksponensial yang sesuai dengan fungsi distribusi kumulatif empiris, dapat
digunakan untuk menggambarkan aspek geometrik dari statistik uji K-S untuk
. Grafik di bawah ini menunjukkan perbedaan antara menggunakan fungsi
survivor dan fungsi distribusi kumulatif dalam penghitungan .
)t(F0
nD
nD
85
: Penduga Nonparametrik : Penduga Exponensial
Grafik 3.11 Grafik 3.11 menunjukkan tangga empiris funsi survivor dengan
menggunakan waktu kegagalan 23 gotri yang digunakan dalam contoh 3.1 dengan
pencocokan eksponensial . Perbedaan maksimum antara kedua fungsi
distribusi kumulatif hanya terjadi di sebelah kiri
)(ˆ tS
)(0 tS
52,41)4( =t dan
seperti terlihat dalam grafik. Grafik 3.12 adalah komplemen dari grafik 3.11
dengan lebih memperhatikan fungsi distribusi kumulatif dari pada fungsi survivor.
Perbedaan maksimum kembali terjadi hanya disebelah kiri . Untuk menghitung
301,023 =D
)4(t
23D
Penduga Nonparametrik
Pendekatan Eksponensial
0
0.0
0.2
0.4
0.6
0.8
1.0
23D
41,52 50 100 150 200
S(t)
t
86
23D diperlukan loop untuk semua nilai data pada 23 sampel gotri dan juga
mempertimbangkan tiga kasus berikut.
: Penduga Nonparametrik : Penduga Exponensial
Grafik 3.12
Kasus pertama diperlihatkan oleh grafik 3.13, di mana F(t) dan berada
disekitar nilai data . Ketika i = 12, fungsi distribusi yang dicocokan
jatuh di atas ; yaitu, . Seperti yang ditunjukkan dalam
grafik, perbedaan maksimum antara kedua fungsi distribusi kumulatif di sekitar
hanya terjadi di sebelah kiri . Kasus ini mengindikasikan mengapa Sup
)t(F0
80.6712 =t
)t(F )i( )t(F)t(F )i()i(0 ≥
)(it )(it
Survival Curve
t
0.0
0.2
0.4
0.6
0.8
1.0
F(t)
23D
0 20 40 60 80 100 120 140 160 180 200
87
digunakan untuk mendefinisikan daripada max. Perbedaan fungsi distribusi
empiris dan yang dicocokkan pada saat adalah
nD
)i(t
(3.21) )t(F)t(F )1i()i(0 −−
: Penduga Nonparametrik : Penduga Exponensial
Grafik 3.13
Kasus kedua diperlihatkan oleh grafik 3.14, di mana distribusi yang dicocokan
memotong anak tangga pada )t(F0 )t(F 12.93)17( =t . Kondisi seperti ini
berhubungan dengan kasus ini, yaitu . Perbedaan antara )t(F)t(F)t(F i)i(0)1i( <<−
( )12t
t0 20 40 60 80 100 120 140 160 180 200
F(t)
0.0
0.2
0.4
0.6
0.8
1.0
67.80
88
kedua distribusi kumulatif pada saat bergantung apakah memotong
bagian atas atau bagian bawah anak tanga pada saat .
)t(F0)i(t
)i(t
t0 20 40 60 80 100 120 140 160 180 200
F(t)
0.0
0.2
0.4
0.6
0.8
1.0
93.12
: Penduga Nonparametrik : Penduga Exponensial
Grafik 3.14
Kasus ketiga diperlihatkan oleh grafik 3.15, di mana dan terlihat
disekitar nilai data . Dalam kasus ini, funsi distribusi kumulatif yang
dicocokan pada saat jatuh pada ; yaitu . Perbedaan
antara fungsi distribusi kumulatif yang dicocokan pada saat adalah
)t(F )t(F0
12.105)19( =t
)t(F )1i( − )t(F)t(F )1i()i(0 −≤)(it
)(it
)()(ˆ)(0)( ii tFtF −
89
t0 20 40 60 80 100 120 140 160 180 200
F(t)
0.0
0.2
0.4
0.6
0.8
1.0
( )19t
105.12
: Penduga Nonparametrik : Penduga Exponensial
Grafik 3.15
Metode pertama dalam penghitungan adalah menentukan kasus yang
terjadi diantara ketiga kasus tersebut pada beberapa nilai data dan kemudian
tentukan nilai maksimum dari n nilai. Metode kedua yang lebih sering digunakan
adalah
nD
⎟⎠⎞
⎜⎝⎛ −
−=
⎟⎠⎞
⎜⎝⎛ −=
=
−
=
+
n1it(FmaxD
)t(FnimaxD
)i(0n....2,1in
)i(0n...2,1in
(3.27)
dan kemudian
90
{ }−+= nnn D,DmaxD (3.28)
Contoh 3.5
Gunakan metode kedua untuk mencari dari data kegagalan 23 gotri yang
digunakan dalam contoh 3.1
nD
Penyelesaian
66.36,23.72t,23n === σDiketahui
i data z )( )(0 itF )( )(0 itFni−
nitF i
1)( )(0−
−
1 17.88 -1.48 0.0694 -0.02592 0.0694 2 28.92 -1.18 0.119 -0.03204 0.075522 3 33 -1.07 0.1423 -0.01187 0.055343 4 41.52 -0.84 0.2005 -0.02659 0.070065 5 42.12 -0.82 0.2061 0.011291 0.032187 6 45.6 -0.73 0.2327 0.02817 0.015309 7 48.48 -0.65 0.2578 0.046548 -0.00307 8 51.84 -0.56 0.2877 0.060126 -0.01665 9 51.96 -0.55 0.2912 0.100104 -0.05663
10 54.12 -0.49 0.3121 0.122683 -0.0792 11 55.56 -0.45 0.3264 0.151861 -0.10838 12 67.8 -0.12 0.4522 0.069539 -0.02606 13 68.64 -0.1 0.4602 0.105017 -0.06154 14 68.64 -0.1 0.4602 0.148496 -0.10502 15 68.88 -0.09 0.4641 0.188074 -0.1446 16 84.12 0.32 0.6255 0.070152 -0.02667 17 93.12 0.57 0.7157 0.02343 0.020048 18 98.64 0.72 0.7642 0.018409 0.02507 19 105.12 0.9 0.8159 0.010187 0.033291 20 105.84 0.92 0.8212 0.048365 -0.00489 21 127.92 1.52 0.9357 -0.02266 0.066135 22 128.04 1.52 0.9357 0.020822 0.022657 23 173.4 2.76 0.9971 0.0029 0.040578
Dari tabel di atas diketahui :
188074.0)t(FnimaxD )i(0n...2,1in =⎟
⎠⎞
⎜⎝⎛ −=
=
+
91
075522.0n
1it(FmaxD )i(0n....2,1in =⎟⎠⎞
⎜⎝⎛ −
−==
−
{ }{ }
188074.0075522.0,188074.0max
D,DmaxD nnn
=== −+
3.6 Sensor Kanan Himpunan Data
Uji K-S mudah digunakan untuk kasus sensor Tipe I dan tipe II. Namun
situasinya akan lebih kompleks untuk sensor kanan data secara random. Untuk
sensor data Tipe II, rumus uji K-S didefinisikan dengan
(3.29) )t(F)t(FSupD 0tt0
r,n)r(
−=≤≤
dimana adalah urutan waktu hidup yang diamati. Contoh kasus
sensor data Tipe II adalah
)()2()1( ...,, rttt
⎟⎠⎞
⎜⎝⎛ −
−=
⎟⎠⎞
⎜⎝⎛ −=
=
−
=
+
n1it(FmaxD
)t(FnimaxD
)i(0r....2,1ir,n
)i(0r...2,1ir,n
(3.30)
{ }−+= r,nr,nr,n D,DmaxD (3.31) kemudian dicari .
Contoh 3.6
Dengan menggunakan data pada contoh 3.2, hitunglah nilai rnD ,
Penyelesaian
Dari contoh 3.2 diketahui n = 21, r = 9 dengan data sebagai berikut
92
6 6 6 6* 7 9* 10 10* 11* 13 16
17* 19* 20* 22 23 25* 32* 32* 34* 35*
dengan (*) menandakan item yang tersensor.
r = 9, maka
nitF i
1)( )(0−
−)( )(0 itFni−
i data z )( )(0 itF1 6 -1.72158 0.1711 -0.1711 0.218719 2 6 -1.56664 0.1711 -0.1711 0.218719 3 6 -1.4117 0.1711 -0.1711 0.218719 4 7 -1.25675 0.2148 -0.2148 0.262419 5 10 -1.10181 0.3707 -0.3707 0.418319 6 13 -0.94687 0.5557 -0.5557 0.603319 7 16 -0.79193 0.7257 -0.7257 0.773319 8 22 -0.63698 0.937 -0.937 0.984619 9 23 -0.48204 0.8545 -0.8545 0.902119
1711.0)t(FnimaxD )i(0r...2,1ir,n −=⎟
⎠⎞
⎜⎝⎛ −=
=
+
984619.0n
1it(FmaxD )i(0r....2,1ir,n =⎟⎠⎞
⎜⎝⎛ −
−==
−
{ }{ }
984619.0984619.0,1711.0max
D,DmaxD r,nr,nr,n
=−=
= −+
Semua statistik uji tersebut diatas , yaitu dan , untuk selanjutnya
dibandingkan dengan tabel D untuk membuat kesimpulan tentang bentuk
distribusi.
nD r,nD
BAB IV
APLIKASI PENDUGA FUNGSI SURVIVOR
Dalam bab ini diberikan beberapa contoh permasalahan sebagai aplikasi untuk
penduga fungsi suvivor. Permasalahan akan dimulai dari data yang lengkap tanpa
terdapat penyensoran, kemudian permasalahan dengan data yang tersensor, yang akan
ditentukan penduga dan selang kepercayaannya dengan beberapa metode yang telah
dibahas dalam bab sebelumnya.
4.1 Permasalahan Sebanyak 44 penderita leukemia diambil sebagai sampel yang kemudian akan
ditentukan selang penduga dan kepercayaan untuk waktu bertahan hidupnya. Data
dari pasien tersebut adalah ( dalam minggu ) sebagai berikut :
4 5 8 9 10 10 10 10 12 12 13 14 20 20 23 28 28 28 29 31
32 37 41 41 48 57 62 70 74 75 99 100 103 139 161 162 169
195 199 217 220 245 258 269
dari data tersebut tentukan penduga nonparametrik fungsi survivor dan selang
kepercayaan 95% untuk probabilitas pasien akan bertahan selama 40 minggu.
Penyelesaian
Sebelum menentukan penduga nonparametrik fungsi survivor dan selang
kepercayaannya, data perlu diuji apakah data berdistribusi normal atau tidak. Dengan
menggunakan Uji Kolmogorov-Smirnov, akan diketahui apakah data berdistriusi
normal atau tidak.
93
94
Uji K-S
Langkah-langkah uji Kolmogorov-Smirnov adalah sebagai berikut
1. = Data berdistribusi normal 0H
= data tidak berdistribusi normal 1H
2. α = 0.05
3. Statistik uji :
{ }−+= nnn D,DmaxD
4. Wilayah kritis :
Dengan mengacu pada tabel D, dapat dilihat probabilitas ( dua sisi ) kejadian
menemukan nilai-nilai teramati sebesar D, bila benar. Bila probabilitas itu
sama atau lebih kecil dari α, maka ditolak.
0H
0H
5. Perhitungan (dengan menggunakan metode kedua) :
i data z )( )(0 itF )( )(0 itFni−
nitF i
1)( )(0−
−
1 4 -0.92 0.1788 -0.15607 0.1788 2 5 -0.91 0.1841 -0.13865 0.1614 3 8 -0.87 0.1922 -0.12402 0.1467 4 9 -0.86 0.1949 -0.10399 0.1267 5 10 -0.85 0.1977 -0.08406 0.1067 6 10 -0.85 0.1977 -0.06134 0.0840 7 10 -0.85 0.1977 -0.03861 0.0613 8 10 -0.85 0.1977 -0.01588 0.0386 9 12 -0.82 0.2061 -0.00155 0.0242
10 12 -0.82 0.2061 0.02117 0.0015 11 13 -0.81 0.2119 0.03810 -0.0153 12 14 -0.79 0.2148 0.05793 -0.0352 13 20 -0.72 0.2358 0.05966 -0.0369 14 20 -0.72 0.2358 0.08238 -0.0596
95
15 23 -0.68 0.2433 0.09761 -0.0748 16 28 -0.62 0.2676 0.09604 -0.0733 17 28 -0.62 0.2676 0.11876 -0.0960 18 28 -0.62 0.2676 0.14149 -0.1187 19 29 -0.61 0.2743 0.15752 -0.1347 20 31 -0.58 0.281 0.17355 -0.1508 21 32 -0.57 0.2843 0.19297 -0.1702 22 37 -0.51 0.305 0.19524 -0.1722 23 41 -0.46 0.3228 0.19993 -0.1772 24 41 -0.46 0.3228 0.22263 -0.1999 25 48 -0.37 0.3557 0.21248 -0.1897 26 57 -0.25 0.4013 0.18961 -0.1668 27 62 -0.19 0.4247 0.18894 -0.1662 28 70 -0.09 0.4641 0.17226 -0.1495 29 74 -0.04 0.484 0.17509 -0.1523 30 75 -0.03 0.492 0.18982 -0.1670 31 99 0.27 0.6064 0.09815 -0.0754 32 100 0.29 0.6064 0.12087 -0.0981 33 103 0.32 0.6255 0.12453 -0.1017 34 139 0.78 0.7823 -0.00957 0.0323 35 161 1.05 0.8531 -0.05765 0.0803 36 162 1.07 0.8554 -0.03722 0.0599 37 169 1.15 0.8749 -0.03399 0.0567 38 195 1.48 0.9306 -0.06696 0.0896 39 199 1.53 0.937 -0.05064 0.0733 40 217 1.76 0.9608 -0.05171 0.0744 41 220 1.80 0.9641 -0.03228 0.0551 42 245 2.11 0.9826 -0.02805 0.0507 43 258 2.27 0.9884 -0.01113 0.0338 44 269 2.41 0.992 0.00842 0.0147
Tabel 4.1
Dari tabel diketahui
22263.0)t(FnimaxD )i(0n...2,1in =⎟
⎠⎞
⎜⎝⎛ −=
=
+
96
1788.0n
1it(FmaxD )i(0n....2,1in =⎟⎠⎞
⎜⎝⎛ −
−==
−
{ }{ }
22263.01788.0,22263.0max
D,DmaxD nnn
=== −+
Kemudian nilai akan dibandingkan dengan nilai D dalam Tabel D. Sdiketahui
nilai D tabel adalah 0.210 sedangkan nilai =0.22263 dengan demikian > D
sehingga diterima.
nD
nD nD
0H
6. Karena diterima, dengan demikian data berdistribusi normal. 0H
Kemudian akan ditentukan penduga nonparametrik fungsi survivor dan selang
kepercayaan saat t=40 sebagai berikut :
Penduga fungsi survivor saat t=40 adalah
5.0
4422)40(S
=
=
Selang kepercayaan fungsi survivor saat t=40
648.0)40(S352.0148.05.0)40(S148.05.0
44)5.0)(5.0(96,15.0)40(S
44)5.0)(5.0(96,15.0
44))40(S1)(40(S96.1)40(S)40(S
44))40(S1)(40(S96.1)40(S
<<+<<−
+<<−
−+<<
−−
97
Gambar 4.1 t
0 50 100 150 200 250 300
S(t)
0,0
0,2
0,4
0,6
0,8
1,0
Grafik 4.1
4.2 Permasalahan
Dari permasalahan 4.1 terdapat r=37 individu yang waktu penyembuhannya diamati
dan terdapat 7 pasien yang tersensor. Andaikan (*) melambangkan pengamatan yang
tersensor, data contoh 4.1 menjadi sebagai berikut
4 5 8 9 10 10 10 10 12 12 13 14 20 20* 23 28 28 28 29 31
32 37 41 41 48 57 62 70 74 75 99 100 103 139 161* 162 169
195 199* 217* 220 245* 258* 269*
tentukan penduga S(30) untuk data di atas
98
Penyelesaian
Himpunan data terdiri atas n = 44 pasien, kegagalan yang diamati r = 37 dan terdapat
k = 30 waktu kegagalan yang berbeda, maka
j jy jd jn jj nd−1
1 4 1 44 0.98 2 5 1 43 0.98 3 8 1 42 0.98 4 9 1 41 0.98 5 10 4 40 0.90 6 12 2 36 0.94 7 13 1 32 0.97 8 14 1 32 0.97 9 20 1 31 0.97
10 23 1 30 0.97 11 28 3 29 0.90 12 29 1 26 0.96 13 31 1 25 0.96 14 32 1 24 0.96 15 37 1 23 0.96 16 41 2 22 0.91 17 48 1 20 0.95 18 57 1 19 0.95 19 62 1 18 0.94 20 70 1 17 0.94 21 74 1 16 0.94 22 75 1 15 0.93 23 99 1 14 0.93 24 100 1 13 0.92 25 103 1 12 0.92 26 161 1 11 0.91 27 162 1 9 0.89 28 169 1 8 0.88 29 195 1 7 0.86 30 220 1 4 0.75
Tabel 4.2
Dengan menggunakan penduga produk-limit dapat dicari penduga fungsi survivor
saat t = 30 minggu
99
[ ][ ][ ][ ][ ][ ][ ][ ][ ][ ][ ][
59.0584828.0
96.090.097.097.097.097.094.090.098.098.098.098.0
nd
1)30(S)30(Rj j
j
≈==
⎥⎥⎦
⎤
⎢⎢⎣
⎡−= ∏
∈
]
4.3 Permasalahan
Dengan menggunakan data pada permasalahan 4.2, tentukan selang kepercayaan 95%
untuk probabilitas survival ke waktu 30
Penyelesaian
Penduga titik untuk survival waktu ke 30 dalam permasalahan 4.2 adalah 0.59.
Dengan menggunakan formula Greenwood, variansi untuk penduga fungsi survivor
pada saat t = 30 dapat diduga, yaitu
036443.0)(0.001538)(0.003979)(0.001149)(0.001075)(0.001008)(0.001008)
(0.001634)(0.002778))(0.00061))(0.000581)(0.000554((0.000529)59.0(
)dn(nd
)]30(S[)]30(S[V
2
)30(Rj jjj
j2
=
=
−= ∑
∈
jadi penduga untuk standar deviasi dari fungsi survivor untuk semua nilai t adalah
18.0036.0 = pada saat t=30 interval kepercayaan 95% untuk S(30) adalah
94.0)30(S24.0036.096.159.0)30(S036.096.159.0
)]30(S[VZ)30(S)30(S)]30(S[VZ)30(S 22
<<+<<−
+<<− αα
100
4.4 Permasalahan
Buatlah tabel hidup dari data dalam permasalahan 4.2 kemudian tentukan penduga
titik dan interval kepercayaan 95% untuk S(30)
Penyelesaian
Data dalam permasalahan 4.2 akan dibagi dalam k=18 interval yang berbeda. Tabel
hidup dari data tersebut adalah sebagai berikut
j 1−ja ja jn jd jm 2/)( jj
j
mnd− )(ˆ
jaS )(ˆ[ˆ jaSV1 0 6 44 2 0 0.09 0.91 02 6 15 42 10 0 0.48 0.52 -0.0253 15 24 32 2 1 0.13 0.87 0.0684 24 30 29 4 0 0.28 0.59 0.0375 30 36 25 2 0 0.16 0.84 0.0496 36 42 23 3 0 0.26 0.73 0.0327 42 50 20 1 0 0.10 0.90 0.0528 50 58 19 1 0 0.11 0.89 0.0559 58 63 18 1 0 0.11 0.89 0.06010 63 76 17 3 0 0.35 0.64 0.02311 76 101 14 2 0 0.29 0.71 0.02612 101 110 12 1 0 0.17 0.83 0.04413 110 140 11 1 0 0.18 0.81 0.05414 140 163 10 1 1 0.22 0.77 0.06415 163 170 8 1 0 0.25 0.75 0.07716 170 200 7 1 1 0.33 0.67 0.08517 200 221 5 1 1 0.50 0.50 0.07918 221 270 3 0 3 0 1 0
Tabel 4.3
Dari tabel terlihat penduga pada saat t = 30 minggu, jadi . 59.0)30(S =
Interval kepercayaan 95% untuk S(30) adalah
94.0)30(S24.0037.096.159.0)30(S037.096.159.0
<<+<<−
BAB V
PENUTUP
5.1 Kesimpulan
Fungsi survivor adalah suatu fungsi yang berkaitan dengan waktu, yaitu
probabilitas dari kegagalan lebih lama dari waktu yang telah ditentukan. Dengan kata
lain fungsi survivor digunakan untuk mengetahui ketahanan hidup suatu item.
Sangatlah sulit untuk mengetahui kapan suatu item akan mengalami kegagalan
sehingga diperlukan suatu penduga untuk fungsi survivor tersebut. Metode
nonparametrik sangatlah tepat untuk menentukan model penduga fungsi survivor.
Penentuan selang kepercayaannya dapat dilakukan dengan pendekatan distribusi
normal untuk binomial. Terdapat tiga metode yang bisa digunakan untuk menetukan
penduga nonparametrik fungsi survivor dan selang kepercayaannya tersebut. Metode
pertama adalah dengan memodelkan 0t,n
)t(n)t(S ≥= dan dilanjutkan dengan
menentukan selang kepercayaan yang formulanya telah ditentukan. Metode kedua
adalah dengan menggunakan teori Kaplan-Meier yang penentuan selang
kepercayaannya menggunakan formula Greenwood. Tabel hidup adalah metode
terakhir yang memudahkan untuk menentukan penduga dan selang kepercayaan
untuk fungsi survivor. Namun sebelumnya, Uji K-S perlu dilakukan untuk
menentukan normal atau tidaknya distribusi data sebagai syarat pembentukan selang
kepercayaan.
101
102
5.1 Saran
Dalam penulisan skripsi ini tentunya penulis masih melakukan banyak kesalahan,
sehingga sangat diharapkan adanya kritik dan saran yang membangun. Selain itu,
penulis juga menyarankan untuk membahas lebih dalam lagi mengenai fungsi
survivor dan apikasi-aplikasinya.
103
DAFTAR PUSTAKA
Anonim.(2002). Survival Function. http://en.wikipedia.org/wiki/survivor-
function. Diakses pada tanggal 13/09/2006.
Anonim.(2001). What is a Sistem? http://www.atis.org/tg2k/_system.html. Diak-
ses pada tanggal 12/11/2006.
Everitt, B.S.(1994). Statistical Methods in Medical Investigations. New York :
Wiley&Sons, Inc.
Grimmett, G.K.& D.R, Stirzaker.(1992). Probability and Random Processes. New
York : Oxford University Press, Inc.
Kopetz, H.(1979). Sofware Reliability. UK : The Macmillan Press, Ltd.
Larsen, R.J.& M.L, Marx.(1985). An Introduction to Probability and Its Aplica-
tions. New Jersey : Prentice-Hall, Inc.
Leemis, L.M.(1995). Reliability : Probabilistic Models and Statistical Methods.
Englewood Cliff : Asimon & Schuster,Inc.
Miller, I.& J.E,Freund(1965). Probability and Statistics for Engineering. Engle-
wood Cliff : Prentice-Hall, Inc..
Murti Bisma.(1996). Penerapan Metode statistik Nonparametrik dalam Ilmu-ilmu
Kesehatan. Jakarta : Gramedia Pustaka Utama.
Ross, S.(1998). A First Course in Probability. New Jersey : Prentice-Hall, Inc.
Walpole, R.E.(1988). Pengantar Satistika. Jakarta : Gramedia
Ziemer, R.E.(1997). Elements of Engineering Probability and Statistics. New Jer-
sey : Prentice-Hall, Inc.