11
Pertanika 15(2), 159-169 (1992) Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan Tapisan Sebagai Satu Risiko NOORAKMA IBRAHIM dan ISA BIN DAUD Jabatan Matematik Fakulti Sains & Pengajian Alam Sekitar Universiti Pertanian Malaysia 43400 UPMSerdang, Selangor Darul Ehsan/Malaysia Kata kunci: Risiko bersaingan, cerapan tertapis, kaedah satu-langkah, jarak Cook, jarak kebolehjadian. ABSTRAK Kaedah mengesan cerapan berpengaruh bagi modelrisiko bersainganyangdata tertapis dianggap sebagai satu daripada risiko dalam model dua risiko yang dikemukakan. Kaedah yang disarankan termasuk kaedah penghapusan cerapan, penghapusan satu langkah Jarak Cook dan jarak kebolehjadian. Penekanan diberi ke atas kesan suatu cerapan terhadap pengganggar parameter terhasil. Dua set data digunakan untuk mengilustrasikan kaedah-kaedah int. ABSTRACT Methods of detecting influential observationsfor competing risks model with censoringas one of the risk in a two-risks model are proposed. These methods include deletion of observations, one-step deletion, Cook distance and likelihood distance. Emphasis is on assessing the impact of an observation on the parameter estimation. Two sets of data are used to illusrate these techniques. l.PENGENALAN Kertas ini megemukakan penyelidikan ke atas cerapan berpengaruh dalam model risiko bersaingan dengan data tertapis sebagai salah satu risiko. Model ini digunakan bagi menganalisis data mandirian yang mempunyai dua atau lebih punca atu risiko yang menyebabkan kegagalan. Teori risiko bersaingan bermula pada kurun kelapan belas dan pada tahun 1760 mendapat perhatian sains yang lain apabila Daniel Bernoulli, seorang ahli matematik juga ahli perubatan mengemukakan soalan berikutan dengan isu semasa ketika itu dan soalannya ialahjika bagi suatu populasi, cacar boleh dihapuskan, apakah kesannya terhadap struktur mortaliti pada peringkat umur yang berbeza? Beliau mengenap pasti bahawa individu yang terselamat daripada cacar akan menghadapi risiko seterusnya sama seperti individu yang lain di dalam populasi tersebut. Bagi penyesuaian masa kini cacar boleh digantikan dengan barah atau penyakit jantung, umpamanya dan kebarangkalian kematian disebabkan penyakit tersebut dengan kehadiran risiko yang lain boleh dikirakkan. Selain data klinikal, teori ini juga boleh dilaksanakan ke atas data kebolehpercayaan komponen-komponen dalam bidang industri termasukjuga bidang ekonomi, demografi dan juga aktuari. Apabila menganalisis darta mandirian, perhatian perlu diberi kepada cerapan tertapis kerana masa tertapis adalah juga masa kegagalan. Tapisan ini berlaku jika pemerhatian terpaksa diberhentikan sebelum terjadi kegagalan akibat kesuntukan masa atau kos mengendalikannya tinggi. Selain itu data perlu ditapis apabila kegagalan yang berlaku bukan disebabkan oleh punca yang diselidiki atau apabila individu hilang daripada kajian. Dalam model yang diselidik di sini, tapisan merupakan satu risiko kerana tapisan pada sesuatu masa x mengelakkan kematian daripada sesuatu risiko semasa ujian sama seperti kematian pada masa x dari risiko yang lain. Dengan ini, tapisan dalam model risiko bersaingan akan dilayan sebagai satu risiko dan ia mengikut taburan yang tertentu. Di antara artikel dan buku yang telah membincangkan analisis data mandirian dengan cerapan tertapis ialah Kaplan dan Meier (1958), Cox (1972), Kalbfleisch dan Prentice (1980) dan Cox dan Oakes(1984). Model risiko bersaingaan seperti model statistik yang lain hanyalah merupakan anggaran memperihal situasi sebenar tertakluk kepada beberapa kekangan dan andaian model Disebabkan ketidaktepatan ini, kestabilan dan variasi keputusan analisis di bawah

Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

  • Upload
    lyque

  • View
    232

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

Pertanika 15(2), 159-169 (1992)

Diagnostik Pengaruh bagi Model Risiko Bersaingandengan Tapisan Sebagai Satu Risiko

NOORAKMA IBRAHIMdan ISA BIN DAUDJabatan Matematik

Fakulti Sains & Pengajian Alam SekitarUniversiti Pertanian Malaysia

43400 UPM Serdang, Selangor Darul Ehsan/Malaysia

Kata kunci: Risiko bersaingan, cerapan tertapis, kaedah satu-langkah, jarak Cook, jarak kebolehjadian.

ABSTRAKKaedah mengesan cerapan berpengaruh bagi modelrisiko bersainganyangdata tertapis dianggap sebagai satu daripadarisiko dalam model dua risiko yang dikemukakan. Kaedah yang disarankan termasuk kaedah penghapusan cerapan,penghapusan satu langkah Jarak Cook dan jarak kebolehjadian. Penekanan diberi ke atas kesan suatu cerapan terhadappengganggar parameter terhasil. Dua set data digunakan untuk mengilustrasikan kaedah-kaedah int.

ABSTRACT

Methods of detecting influential observations for competing risks model with censoringas one of the risk in a two-risks modelare proposed. These methods include deletion of observations, one-step deletion, Cook distance and likelihood distance.Emphasis is on assessing the impact of an observation on the parameter estimation. Two sets of data are used to illusratethese techniques.

l.PENGENALAN

Kertas ini megemukakan penyelidikan ke atascerapan berpengaruh dalam model risikobersaingan dengan data tertapis sebagai salah saturisiko. Model ini digunakan bagi menganalisis datamandirian yang mempunyai dua atau lebih puncaatu risiko yang menyebabkan kegagalan. Teori risikobersaingan bermula pada kurun kelapan belas danpada tahun 1760 mendapat perhatian sains yanglain apabila Daniel Bernoulli, seorang ahlimatematik juga ahli perubatan mengemukakansoalan berikutan dengan isu semasa ketika itu dansoalannya ialahjika bagi suatu populasi, cacar bolehdihapuskan, apakah kesannya terhadap strukturmortaliti pada peringkat umur yang berbeza? Beliaumengenap pasti bahawa individu yang terselamatdaripada cacar akan menghadapi risiko seterusnyasama seperti individu yang lain di dalam populasitersebut.

Bagi penyesuaian masa kini cacar boleh digantikandengan barah atau penyakit jantung, umpamanyadan kebarangkalian kematian disebabkan penyakittersebut dengan kehadiran risiko yang lain bolehdikirakkan. Selain data klinikal, teori ini juga bolehdilaksanakan ke atas data kebolehpercayaankomponen-komponen dalam bidang industri

termasukjuga bidang ekonomi, demografi dan jugaaktuari.

Apabila menganalisis darta mandirian, perhatianperlu diberi kepada cerapan tertapis kerana masatertapis adalah juga masa kegagalan. Tapisan iniberlaku jika pemerhatian terpaksa diberhentikansebelum terjadi kegagalan akibat kesuntukan masaatau kos mengendalikannya tinggi. Selain itu dataperlu ditapis apabila kegagalan yang berlaku bukandisebabkan oleh punca yang diselidiki atau apabilaindividu hilang daripada kajian. Dalam model yangdiselidik di sini, tapisan merupakan satu risiko keranatapisan pada sesuatu masa x mengelakkan kematiandaripada sesuatu risiko semasa ujian sama sepertikematian pada masa x dari risiko yang lain. Denganini, tapisan dalam model risiko bersaingan akandilayan sebagai satu risiko dan ia mengikut taburanyang tertentu. Di antara artikel dan buku yang telahmembincangkan analisis data mandirian dengancerapan tertapis ialah Kaplan dan Meier (1958), Cox(1972), Kalbfleisch dan Prentice (1980) dan Cox danOakes(1984).

Model risiko bersaingaan seperti model statistikyang lain hanyalah merupakan anggaran memperihalsituasi sebenar tertakluk kepada beberapa kekangandan andaian model Disebabkan ketidaktepatan ini,kestabilan dan variasi keputusan analisis di bawah

Page 2: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

NOOR AKMA IBRAHIM DAN ISA BIN DAUD

modifikasi atau gangguan yang kecil ke atas fomulasimodel perlu dikaji. Jika gangguan kacil inimempengaruhi keputusan analisis, model atau datasebaiknya sikaji selidik semula. Sebaliknya jikakesannya tidak ketara, sampel adalah teguh terhadapgangguan yang disengajakan dan andaian modeldianggap kukuh untuk memperihalkan ciri-ciripenting data tersebut.

Kebelakangan ini beberapa artikel dan buku telahditerbitkan yang membincangkan kaedah-kaedahpenilaian pengaruh ke atas model yang diganggutermasuk mengenal pasti cerapan berpengaruh dandata terpencil di dalam konteksanalisis regresi. Cook(1977) telah mengemukakan satu statistik bagimenentukan pengaruhan sesuatu cerapan di dalammodel regresi biasa. Berikutan dengan ini, ramaipenulis telah mencadangkan beberapa statistik untukmengenal pasti satu atau lebih cerapan sebagaicerapan terpencil, berpengaruh atau kedua-duasekali.Mengikuttakrif, cerapan dianggap berpengaruhjikapenghapusnya daripada data menghasilkanperubahan yang besar kepada ciri-ciri penting didalam analisis. Ukuran-ukuran yang akandipertimbangkan di dalam kertas ini adalahberdasarkan fungsi pengaruhan empirikal yang telahdikemukakan oleh Cook( 1977), Cook dan Weisberg(1980, 1982) dan Belsley, Kuh dan Welsch (1980)bagi model regresi. Akan tetapi penulis-penulis initidak mempertimbangkan data tertapis di dalammodel-model mereka. Walaubagaimana-pun terdapatbeberapa penyelidikan diagnostik ke atas data tertapisseperti di dalam penulisan Schoenfeld (1982), BinDaud (1987) yang telah melaksanakannya dalammodel bahaya kadaran Cox (1972) dan Weissfeld danSchneider (1990) dalam model normal linear.

Tumpuan kertas ini ialah megenal pasti cerapan-cerapan berpengaruh bagi model risiko bersaingandengan tapisan yang dianggap sebagai salah saturisiko. Kaedah-kaedah pendiagnosisan termasuklahpenghapusan cerapan, penghapusan satu langkahdan ukuran pengaruh.

2. TATA - TANDA DAN FORMULASI

Katakan suatu populasi tertakluk kepada k puncakegagalan atau risiko, R:,R2, , ̂ d an katakan bagisetiap individu di dalam populasi tersebut dapatdicirikan oleh masa kegagalannya Y^, Y2,...., Yk bersamaRp R̂ , , R̂ masing-masingnya. Pembolehubahrawak Y1(i=l,....,k) menwakili hayat seseorang individuR penyebab yang tunggal dan mempunyai fungsitaburan P.(x)=Kb(Y< x) dengan fungsi ketumpatan

p.(x). Dan fungsi bahayanya ialah h.(x) = p.(x)/ l -P.(x). Mengikut David dan Moeschberger (1978)dengan kehadiransemuak risiko R(e=l, ,k)secaraserentak, hanya V = minimum (Y|, Yk) dan puncakegagalan sebenar, katakan R yang dapat dicerap.Berikutan dengan ini kebarangkalian V melebihi xiaitu fungsi mandiriannya ialah

Kb(V > x) = P(Y,> x,...., Yk > x) (1)

Gail (1975) telah menunjukkanhubungan (1) adalahbenar bagi Yp Y2, , Yk merdeka atau sebaliknya

Katakan X. masa hayat tercerap bersyarat dari puncakegagalan R., maka

X, = = minimum (Y,, Yy...,Yk) (2)

Kebarangkalian kegagalan yang disebabkan oleh R.ialah

n. =Kb[Y. =minimum(Y1,...,Yk)] (3)

dengan n, > 0 d a n ^ n t =1.

Dari (2) dan kemerdekaan Y, fungsi ketumpatanf (x)bagi X., tanpa mengambil kira sebutan peringkatbawah, diberi oleh

f,(x)dt=^Kb[x-dx<y <x]fjKb[Y, > x]

yang demikian

(4)

dengan Pe (x)=l-P1(x).

Katakan N. pembolehubah rawak mewakilibilangan individu yang gagal dari punca R(i=l, 2,...,k) dan X hayat individu kej( j=l,..., n.) yang gagaldari punca R. Fungsi ketumpatan tercantum bagi Xboleh ditulis sebagai

, x l n ] , . . . , x n > = n ^ -

(5)

Fungsi ketumpatan kebarangkali ini adalahbersyaratkan ke atas N. = n. (i = 1 ,.„, k) dan N. suatu

160 PERTANIKA VOL. 15 NO. 2, 1992

Page 3: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO

pembolehubah rawak multinational dengan fungsiketumpatan kebarangkalinya

f(n n , ) - - I n 1 (6)

n<»'')'dan

<= n

Jadi, fungsi kebolehjadian yang menjadi tumpuanialah

n! n.dengan

L; = ft,L j-i

nnt (7)

2.1. Model risiko bersaingan dengan kovariat

Dengan menggunakan model yang disarankan olehCox (1972), fungsi ketumpatan kebarangkalian bagimasa kehidupan teori bersekutu dengan punca R ialah

Pi(y)=hoi(y) eksp(ftTZ) eksp[-Hoi (y)eksp(ZTz)] (8)

dengan p vektor baris bagi parameter s regresor

dan Z vektor lajur bagi s kovariat berkaitan dengan

sesuatu individu,

= !»!»,( t)dt

= hoi(y)eksp(pTz)

Andaikan taburan pendasar bagi masa kehidupan

ialah Weilbull dengan h,,(t) = Xcf'x [ho(t) adalah

fungsi bahaya dengan kovariat sama sifar] maka (8)

boleh ditulis sebagai berikut

P j ( y ) = \ c, y ' "eksp(_pTZ ) [ - l , f eksp(PTZ

(9)dengan

y > 0 , ^ i > 0 , C i > 0

3. PENTAFSIRAN DAN ANGGARAN

Di sini parameter regresor P dan pemalar bentuk cakan dianggarkan menggunakan kaedah ke-bolehjadian maksimum. Pendekatan yang bolehdigunakan di antaranya ialah seperti pendekatanNewton-Rhapson, algoritma EM (Dempster e t al1977) dan kompromi Maquardt terubahsuai (David8c Moeschberger 1978, Appendiks B).

Katakan X. masa hingga kegagalan bagi suatuindividu kej gagal dari punca R (i=l,..., k;j=l,..., n) .Berdasarkan (7) dan (9) dengan menganggap

P = ( p;, ,p. 2 , . . . , ps$ ) berbeza bagi setiap R, maka

fungsi kebolehjadian dari sesuatu punca ialah

(10)

Dengan mengambil log asli bagi (10),

lnL. =

j = 1 1 = 1j = 1

j = l 1 = 1 j =1

Untuk keadaan maksimum terhadap X

1 = I j = l

maka

1 = 1 j = 1

(12)

PERTANIKA VOL. 15 NO. 2, 1992 161

Page 4: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

NOOR AKMA IBRAHIM DAN ISA BIN DAUD

Dengan

A = -

ainL,31 nc. '

lnL i

2C.

ainL.^i31 np

InL. >

InL

P, c, P P l

anggaran parameter peringkat pertama

6 = [ A ., c , Pi ) (ditandakan sebagai 6 ) apa-

bila menggunakan pendekatan kompromi Mar-quardt terubahsuai (David & Moeschberger 1978)

awal ialahdan nilai 0

9 ' _ 9 " =-W(WAW+5I)" Wg

dengan W matriks m x m penskalaan pepenjuru2 ^ (2) I

dengan unsur pepenjurunya d lnL./d6.dan 8 pemalar bukan negatif. Di sini SL adalahmatriks segiempat sama yang dipilih supayapenumpuan dapat dipercepatkan atau untukmengelakkan keanehan.

4. DIAGNOSTIK BAGI MODEL RISIKO BER-SAINGAN DENGAN TAPISAN SEBAGAI SATURISIKOCook (1977) telah mengemukakan satu prosedurbagi mengesan cerapan-cerapan berpengaruh bagidata penuh dalam model linear. Di sini kami akanmemanfaatkan saranan Cook tetapi kaedahnyaberbeza sedikit kerana tapisan dan penglibatanprosedur berlelaran bagi anggaran parameter.

Kaedah kedua yang akan diperlihatkan ialahdengan menggunakan log kepada fungsikebolehjadian data lengkap dan data dengan satucerapan dihapuskan. Ini dikenali sebagai jarakkebolehjadian. (Cook & Weisberg 1982)

4.1. Ukuran berpengaruh

Kaedah jarak Cook melibatkan anggaran bagiA

parameter 8^^ dengan penghapusan cerapan kejdaripada set dengan setiap penghapusan perludiikuti dengan lelaran sehingga penumpuan danini melibatkan masa yang sangat lama seperti yangtelah diperlihatkan oleh Ibrahim dan Daud (1990).Apa yang boleh dilakukan ialah dengan

menggunakan kaedah satu-langkah. Mungkindengan menggunakan kaedah ini, anggaran danukuran berpengaruh tidak begitujitu tetapi kejituantidak menjadi masalah keranayang pentingnya ialahkita dapat mengenal pasti sesuatu cerapan yangberlainan dari yang lain untuk pertimbanganseterusnya. Inijuga telah diperakui oleh Cook danWeisberg (1982). Pregibon (1981) pulamenyifatkanpenghapusan ini sebagai gangguan terhadap modeldan beliau juga telah menggunakan kaedah satu-langkah dalam diagnostik pengaruh bagi modelregresi logistik.

A

Di sini anggaran kebolehjadian maksimum, 9, ,digunakan sebagai nilai awal. Berdasarkan (13),kaedah satu langkah kepada kompromi Marquardtterubahsuai adalah seperti berikut:-

A

9 r e, =_ [ W(WAW) +5i] wg(j) (14)

yang mana W, A dan g dikira pada 9 ,

Jarak Cook bagi satu-langkah ialah

Di (j) ukuran jarak setelah cerapan kej dihapuskan

( 2 ^( 2) \

d lnL./36 . ) dan

Satu lagi ukuran yang dipertimbangkan ialahjarak kebolehjadian yang ditakrifkan seperti berikut:-

dengan L( 9 ) logasli kepada fungsi kebolehjadian~ i

data lengkap bagi punca R . dan IY 9 \ fungsi

kebolejadian setelah cerapan kej dihapuskan.Seperti perolahan dalam perkembangan di atas,

kaedah satu=langkah boleh disarankan dengan

menggantikan IV 9 \ dengan iaitulY g' )^ i(j) / ' ( ) )

log kebolehjadian pada nilai 9 dianggarkan

dengan satu-langkah (Bin Daud 1987).Jikakonturlog kebolehjadian menghampiri elips,

Jika kontur bagi fungsi kebolehjadian tidakelips, Cook dan Weisberg (1982), berpendapat

PERTANIKA VOL. 15 NO. 2, 1992

Page 5: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO

ukuran jarak kebolehjadian mungkin memberikeputusan yang agak menyeleweng daripada yangdijangkakan.

5. CONTOH

Dua contoh dipertimbangkan isitu ujian klinikaluntuk rawatan bar ah orofarinks dan datapemindahan jantung Stanford. Kedua-dua dataterdapat di Appendiks 1 daripada Kalbfleisch danPrentice (1980). Model yang digunakan dalamkedua-dua data ini menganggap kegagalan yangsebenar sebagai risiko pertama dan tapisan sebagairisiko kedua. Anggaran kebolehjadian maksimumyang berasingan dilakukan ke atas setiap risiko bagisetiap data dan diagnostik berpengaruh juga dikirasecara berasingan bagi setiap risiko.

Hanya tujuh kovariat diambil kira bagi data barahorofarinks dan tiga kovariat bagi data pemindahanjantung.

5.1. Ujian klinikal bagi barah orofarinks

Analisis bagi data ini melibatkan 195 kes denganbilangan kematian,n1=142 dan bilangan tapisan n^= 53. Tujuh kovariat dipertimbangkan iaitu umur,jantina, rawatan, kesihatan pesakit, gred, peringkat1 dan peringkat 2. Umur ialah umur pesakit semasadiagnos dan diukur dalam ukuran tahun. Jantinaialahlelaki (=1) danwanita (=2).Terdapatduajenisrawatan iaitu, rawatan terapi beradiasi (=1) danrawatan terapi beradiasi dengan agenkemoterapeutik (=2). Keadaan yang meng-gambarkan kesihatan pesakit terbahagi kepadaempat kategori semasa menjalani rawatan iaitu,tiadakekurangankebolehan (=1), yang hanya bolehdilakukan kerja yang tertentu sahaja (=2), yangmemerlukan bantuan untuk kebersihan diri (=3)dan yang tidak berdaya (terlantar di atas katil),(=4). Gred ialah perbandingan darjah selketumbuhan menyerupai sel hos iaitu, jelas (=1),kurangjelas (=2) dan tidakmenentu (=3). Peringkat1 mengukur saiz ketumbuhan iaitu, ukuran 2 cmatau kurang (=1), ukuran 2 cm hingga 4 cm (=2),ukuran lebih dari 4 cm (=3) dan sangat besar sertaagresif (=4). Peringkat 2 pula mengukur wujudnyapenglibatan nod limpatek iaitu, tiada bukti klinikalbagi kerebakan nod (=0), satu nod positif yangberlegar dan diameternya berukuran tidak lebihdari 3 cm (=1), satu nod positif yang berlegar dabdiameternya lebih dari 3 cm (=2) danbeberapanodpositif yang tidak berlegar (=3).

Model yang telah digunakan ialah model risikoberasingan dengan taburan pendasar bagi masa

kegagalan diandaikan sebagai Weibull, k=2 danpemalar bentuknya berlainan bagi setiap risiko.

Dengan nilai awal c( = 1 dan P = 0 kaedah

kompromi Marquardt terubahsuai berlelaranmemberikan anggaran kebolehjadian maksimumkepada lima titik perpuluhan seperti berikut:-

£, = 0.08508, Ci =1.16552, pn = 0.00406, p, ,=

-0.19071 , p , , = 0.17200, pM = -0.10148,

P,5 = 0. 25932 . pI(i = 0.31154 dan p | 7 = 0.13882

Bagi cerapan tertapis dengan nilai awal Cj = 1 dan

P = 0 anggaran kebolehjadian maksimum adalah

seperti berikut:-

£j = 0.01875 , C2= 3.191124, p2|= -0.01417,

p 2 2 = -0.0205 41, P2S= 0.1 4541

p.M = 0.004646,pa.= 0.38582, p.,fi= 0.06303

dan pir. = 0.12080 serta log kebolehjadian maksimum=-93.37044. Anggaran sisihan piawai asimptot bagipunca pertama dan kedua adalah

s$, ) = 0.06814 s(l2) - 0.02278

s(c\) = 0.07143 s(c\2) - 0.13007

s $ u ) =0.00832 s(P21) =0.01478

s$12) =0.20268 s(fy =0.32575

s$ls) =0.17111 s( |y =0.29921

s$I4) = 0.12027 s$24) = 0.20804

s(^,) =0.07207 s$25) =0.28590

s$16) =0.11647 s(fy =0.19756

s$17) =0.07654 s$27) =0.14253

Bagi i = 1 Jarak kebolehjadian bagi setiap cerapanadalah lebih besar daripada jarak Cook (Rajah 1dan Rajah 2). Didapati cerapan ke-159 memberikannilaijarakCookdanjarak kebolehjadian yang palingbesar berbanding dengan cerapan-cerapan yanglain dan cerapan ini boleh dianggap sebagai titikterpencil.

Bagi i = 2, daripada Rajah 3 iaitu graf bagi jarakCook, jelas kelihatan cerapan<erapan 6, 43, 46,53dan 176 cerapan yang berpengaruh yang mungkin.Tetapi graf jarak kebolehjadian [Rajah 4)menunjukkan cerapan-cerapan yang lain telahdisebut tadi, cerapan ke-186 dan 190 adalah jugacerapan berpengaruh. Jarak kebolehjadian mem-berikan gambaran yang tidak begitujelas bagi i = 2,

PERTANIKA VOL. 15 NO. 2, 1992 163

Page 6: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

NOOR AKMA IBRAHIM DAN ISA BIN DAUD

dan ini mungkin disebabkan bilangan cerapantertapis adalah kecil pada keseluruhannya. Oleh itubagi keadaan yang begini lebih baik berpandukanukuran jarak Cook untuk mengesan cerapanberpengaruh.

5.2. Data pemindahan jantung Stanford

Data ini melibatkan 90 kes, n, = 62, nt, =28 dan 3 kova-riat iaitu umur, pembedahan dan pemindahan.Umur ialah umur seseorang itu diterima ketikamenjalani program Stanford ini. Kovariat

pembedahan pula bermaksud pembedahan yangpernah dilakukan (= 1) dan tidak pernah dilakukan(=0) sebelum mengikuti program ini. Pemindahanbermaksud pemindahan dilakukan (=1) dan tiadaberlaku pemindahan (=0) semasa mengikutiprogram.

Dengan nilai awal c} = 1 dan £, = 0, pendekatankomprom Marquardt terubahsuai bagi anggaranmaksimum adalah seperti berikut:-

^ = 0.23933, c > 0.76289 J , , = 0.05587, $ n =-0.8569

12

ID

J -1 •

M

2

n

-

-

-

-

-

-

i j i i i i i i j |

*

J A 1 A 1 _l 1 1 J l f 1

I 17 33 MS hh HI 17 I 13 I2S IMS IE I 177 IR3S 25 Ml 57 73 BS ID5 12 1 137 153 IBS IBS

cerapan

Rajah 1: Rajah Cook bagi data barah orofarinksrisiko pertama

cerapan

Rajah 2: Jarak kebolehjadian bagi data orofarinks

risiko pertama

164 PERTANIKA VOL. 15 NO. 2, 1992

Page 7: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO

0.6 -

JL A. . A ft, A ^ i A n i L ,I 17 33 MR B5 HI R7 I 13 I2S (45 IE I 177 IR3

25 Ml 57 73 HH ID5 12 1 137 153 IER IBB

cerapan* *.

Rajah 3: Jarak Cook bagi data barah orofarinksrisiko kedua

I 17 33 MR 65 B I R7 I 13 I2T IMS IGI 177 IS325 Ml 57 73 BR IDS 121 137 153 IBR IB5

cerapan

Rajah 4: Jarak akebolehjadian bagi data orofarinksrisiko kedua

PERTANIKA VOL. 15 NO. 2, 1992 165

Page 8: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

NOOR AKMA IBRAHIM DAN ISA BIN DAUD

D.M

I 5 q 13 17 2 I 25 29 33 37 Ml MS MS 53 57 E I E5 ES 73 77 B I B5 8S

Rajah 5: Jarak Cook bagi data barah Stanfordrisiko pertama

13 17 21 25 ^ 33 37 HI H5 4^ 53 57 61 65 5=1 73 77 HI Q5I 5

Rajah 6: Jarak kebokhjadian bagi data Stanfordrisiko pertama

166 PERTANIKA VOL. 15 NO. 2, 1992

Page 9: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO

13 17 21 25 21 33 37 41 45 41 53 57 61 55 B1 73 77 Bl B5 B1I 5

Rajah 1: Jarak Cook bagi data barah Stanfordrisiko kedua

I 5 1 13 17 21 25 21 33 37 41 45 41 53 57 6! 55 51 73 77 BI B5

Rajah 8: Jarak kebolehjadian bagi data Stanfordrisiko kedua

PERTANIKA VOL. 15 NO. 2, 1992 167

Page 10: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

NOOR AKMA IBRAHIM DAN ISA BIN DAUD

dan^13=-1.42677sertalogkebolehjadian=-56.5087.Bagi cerapan tertapis dengan nilai awal c2 = 1 dan (32

• 0, anggaran kebolehjadian maksimum adalahseperti berikut:-

i2 = 0.74576 = e2 = 1.38135, £2] = -0.02263, $n =

-0.19567, (^ = -0.15521 serta log kebolehjadian =-56.19152. Anggaran sisihan piawai asimptot bagipunca pertama dan kedua adalah:-

8$,) =0.16941 $(%2) =0.65654

s(c\) =0.08743 s(c\) = 0.15330

s( ftu) = 0.01666 s( fl21) = 0.02402

s( ft12) = 0.44220 s( ft22) = 0.47688

s( 313) = 0.33011 s( ^23) = 0.63287

Bagi i * l , daripada Rajah 5, jarak Cookmemberikan gambaran yang jelas bahawa cerapanke-60 dan 85 adalah titik-titik berpengaruh. Tetapidaripada Rajah 6, yangjelas kelihatan ialah cerapanke-85 sahaja dan boleh dianggap sebagaiberpengaruh. Kelainan ini mungkin disebabkanapabila pemindahan beralaku pesakit akanmengikuti rawatan yang berlainan dan kovariatjenisini mestilah diteliti dahulu sebelum modelditentukan.

Bagi i = 2, jarak Cook (Rajah 7) dan jarakkebolehjadian (Rajah 8) tidakdapatmenunjukkandengan jelas cerapan-cerapan yang mungkinberpengaruh. Terdapat sedikit gangguan padakedua-dua graf dan ini berlaku mungkin disebabkankovariat yang bersandaran kepada masa danpengaruh cerapan kegagalan terhadap keseluruhandata.

6. KESIMPULAN

Analisis diagnostik untuk masa kegagalan yangsebenar dalam model risiko bersaingan seperticontoh barah orfarinks menunjukkan kedua-duaukuran iaitu D dan LD berjaya mengesancerapan yang sama. Tetapi ini tidak berlaku ke atasdata Stanford bagi i = 1, walau-pun terdapat satucerapan yang dikesan oleh kedua-dua kaedah.Kelainan ini mungkin disebabkan oleh cirian yangada pada data itu sendiri.

Bagi data tertapis pula beberapa kesimpulanboleh diperoleh daripada penyelidikan ini. Masatapisan itu sendiri boleh menyebabkan kelainancerapan yang dikesan oleh D danLd . Ini bolehdisebabkan oleh pengaruh masa kegagalan sebenarke atas keseluruhan data atau disebabkan taburan

yang bukan kuadratik yang memberikan konturkebolehjadian yang tidak elips dan ukuran yangdiberi agak menyeleweng. Dalam hal ini lebih baikberpandukan jarak Cook bagi mengesan cerapanberpengaruh. Bilangan cerapan juga memainkanperanan untuk menentukan keberkesanan kaedahkebolehjadian dalam mengesan cerapan ber-pengaruh. Didapati jika n2 adalah besar atau samadengan nv kaedah kebolehjadian lebih ber-keseimbangan dengan jarak Cook. Keputusanmemperlihatkan cerapan tertapis juga memberi-kan kesan ke atas anggaran parameter dan perluditeliti apabila penyesuaian model dilakukan keatasnya.

RUJUKAN

BELSLEY, D ,A.,E. KUH and R.E. WELSCH. 1980. Regression

Diagnostics: Identifying Influential Data and SourcesofCollinearity. New York: Wiley.

BIN DAUD, 1.1987. Influence Diagnostics in Regressionwith Censored Data. Ph. D. Thesis, LoughboroughUniversity.

COOK, R. D. 1977. Detection of Influential Observationsin Linear Regression. Technometrics 19: 15-18.

COOK, R. D. and S. WEISBERG. 1980. Characterizationsof an Empirical Influence Function for DetectingInfluential Cases in Regression. Techmetrics 22:495-508.

COOK. R. D. and S. WEISBERG. 1982. Residuals andInfluence in Regression. London: Chapman andHall.

Cox, D. R. 1972. Regression Models and Life Tables(with discussion)./ R. Statist Soc. B34: 187-220.

Cox. D. R. andD. OAKES. 1984. Analysis of SurvivalData.London: Chapman and Hall.

DAVID, H. A. and M. L. MOESCHBERGER. 1978. The Theoryof Competing Risks. London: Griffin.

DEMPSTER, A. P., N. M. LAIRD and D. B. RUBIN. 1977.

Maximum Likehood from Incomplete Data viaEm Algorithm./ R Statist Soc. B39: 1-38.

GAIL, M. 1975. A Review and Critique of some ModelsUsed in Competing Risks Analysis. Biometrics 31:209-222.

IBRAHIM, N. A. and I. DAUD 199O.AnalisisRegresiMudahdan Mengesan Cerapan Berpengaruh bagi DataTertapis. Lapuran Teknikal, 45/1990, JabatanMatematik, Universiti Pertanian Malaysia.

KALBFLEISCHJ. D. andR. L. PRENTICE. 1980. The StatisticalAnalysis of failure Time Data. New York: Wiley.

KAPLAN, E. L. and P. MEIER. 1958. NonparametricEstimatuion from Incomplete Observations./ Amer. Statist Assoc. 53: 457-481.

168 PERTANIKA VOL. 15 NO. 2, 1992

Page 11: Diagnostik Pengaruh bagi Model Risiko Bersaingan dengan ... PAPERS/PERT Vol. 15 (2) Aug... · soalan berikutan dengan isu semasa ketika ... Pj(y)= \ c, y ' "eksp(_pT ... diagnos dan

DIAGNOSTIK PENGARUH BAGI MODEL RISIKO BERSAINGAN DENGAN TAPISAN SEBAGAI SATU RISIKO

PREGIBON, D. 1981. Logistics Regression Diagnostics. WEISSFELD, L. A. and H. SCHNEIDER. 1990. Influence

Ann. Statist. 9: 705-724. Diagnostics for the Normal Linear Model withSCHOENFELD, D. 1982. Partial Residuals for the Censored Data. Austral. J. Statistics 32(1): 11-20.

Proportional Hazards Regression Model.Biometrika 69(1): 239-241. (Di ^ ^ 24Ogos 1991)

PERTANIKA VOL. 15 NO. 2, 1992 169