31
Pendekatan CART Untuk Mendapatkan Faktor yang Mempengaruhi Terjangkitnya Penyakit Demam Tifoid di Aceh Utara OLEH OLEH : DINA YUANITA 1306 100 O56 DOSEN PEMBIMBING : M. SYAHID AKBAR, S.Si, M,Si

PendekatanCART Untuk MendapatkanFaktor yang

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Pendekatan CART  Untuk Mendapatkan Faktor yang Mempengaruhi Terjangkitnya Penyakit Demamp g j g y y

Tifoid di Aceh Utara

OLEHOLEH :DINA YUANITA        1306 100 O56

DOSEN PEMBIMBING :M. SYAHID AKBAR, S.Si, M,Si

Demam Tifoid atau Typhoid fever, yang biasa juga disebut typhus atautypes oleh orang awam, merupakan penyakit yang disebabkan bakteriSalmonella Enterica, khususnya turunannya yaitu Salmonella Typhi (S.Typhi) yang menyerang bagian saluran pencernaan.

http://mangsholeh.wordpress.com

Data World Health Organization (WHO) tahun 2003 memperkirakanterdapat sekitar 17 juta kasus demam tifoid di seluruh dunia denganp j gkejadian 600.000 kasus kematian tiap tahun.

http://koaskamar13.‐wordpress.com).

Di Indonesia, demam tifoid merupakan masalah kesehatan masyarakatdengan kejadian antara 350 ‐ 810 kasus per 100.000 penduduk setiaptahunnyatahunnya

Hidayati (2001) 

Kepadatan penduduk, prosentase cakupan pendudukpemakai air bersih, prosentase cakupan pembuangansampah sementara yang memenuhi syarat, prosentasek t t l h k hicakupan tempat pengolahan makanan yang memenuhi

syarat, dan prosentase cakupan penduduk pemakai saranapembuangan air limbah.

Lubis (2007)Higiene perorangan dankualitas air minum.

Tjipto (2009)

Buang air besarditempat yang baik

(jamban) dan mencucitangan dengan benartangan dengan benar(memakai sabun)

Permasalahan yang akan diselesaikan dalam penelitian ini adalahsebagai berikut.

1. Bagaimana karakteristik anggota rumah tangga (ART) yang terjangkit1. Bagaimana karakteristik anggota rumah tangga (ART) yang terjangkitdemam tifoid di Aceh Utara?

2. Mencari faktor yang berpengaruh terhadap terjangkitnya demamtifoid di Aceh Utara?tifoid di Aceh Utara?

Berdasarkan latar belakang dan permasalahan yang telahdirumuskan di atas, maka tujuan penelitian ini adalah sebagai berikut.1. Mengetahui karakteristik anggota rumah tangganya (ART) yang

terjangkit demam tifoid di Aceh Utara.2 M d k f k b h h d j ki2. Mendapatkan faktor yang berpengaruh terhadap terjangkitnya

demam tifoid di Aceh Utara.

• Memberikan gambaran mengenai penyakit demam tifoid di Aceh Utara

• Didapatkan faktor yang mempengaruhi penyakit demam tifoid di AcehUtara, sehingga diharapkan adanya peningkatan perilaku hidup sehatyang dapat mengurangi terjadinya penyakit demam tifoid.

l d l h d k d d l h dData penelitian adalah data sekunder yang diperoleh dari RisetKesehatan Dasar (Riskesdas) dan Survei Sosial Ekonomi Nasional(Susenas) tahun 2007. Data yang dianalis Riskesdas dan Susenask b t A h Ut U it liti d l h t hkabupaten Aceh Utara. Unit penelitian adalah semua anggota rumahtangga sampel Riskesdas dan Susenas tahun 2007. Diambil respondenyang berumur lebih dari 10 tahun.

CART merupakan metodologi statistik nonparametrik yang dikembangkan untuk topik analisis klasifikasi baik untuk peubahdikembangkan untuk topik analisis klasifikasi, baik untuk peubah

respon kategorik maupun kontinu (Breiman et al.,1993).

•Tujuan utama CART adalah untuk mendapatkan suatu kelompokdata yang akurat sebagai penciri dari suatu pengklasifikasian.•Dalam klasifikasi pohon melibatkan 4 komponen, yaitu variablep p , yrespon, variable prediktor, data learning, dan data testing.

PEMBENTUKAN POHON KLASIFIKASI MAKSIMALPEMBENTUKAN POHON KLASIFIKASI MAKSIMAL

Menurut Breiman et al. (1993) proses pembentukan pohon klasifikasiMenurut Breiman et al. (1993) proses pembentukan pohon klasifikasiterdiri atas 3 tahapan sebagai berikut :

1. PEMILAH‐PEMILAH

a Mendefinisikan fungsi keheterogenan simpula. Mendefinisikan fungsi keheterogenan simpul

Tujuan : mengurangi keheterogenan pada simpulutama dan memaksimumkan kehomogenan padasetiap simpul anaksetiap simpul anak.

Fungsi keheterogenen Indeks Gini :

dengan : p(j|t) adalah proporsi kelas j pada simpul t

p(i|t) adalah proporsi kelas i pada simpul t

Continu…PEMBENTUKAN POHON KLASIFIKASI

1. PEMILAH‐PEMILAH1. PEMILAH PEMILAHb. Proses pemilahan simpulMencari semua kemungkinan pemilah pada variabe independenNominal: 2L‐1‐1 Ordinal : L‐1 Kontinu : n‐1

c. Menentukan kriteria goodness‐of‐split

Goodness‐of‐Split (s,t) yang didefinisikan sebagai penurunan kehete‐rogenan :rogenan :

Pengembangan pohon dilakukan dengan mencari semuakemungkinan pemilah pada simpul sehingga memberikan nilaipenurunan keheterogenan tertinggi yaitu.

Continu…PEMBENTUKAN POHON KLASIFIKASI

2. PENENTUAN SIMPUL TERMINAL

Si l t k j di i l t i l bilSimpul t akan menjadi simpul terminal apabila :

a. Pada simpul t tidak terdapat penurunan keheterogenan yang berarti.

b. Hanya terdapat satu pengamatan pada tiap simpul anak atau adanyabatasan minimum n. Menurut Breiman et al, 1993, pengembanganpohon berhenti apabila pada simpul terdapat n< 5, namun ada jugayang membatasi pengembangan pohon apabila pada simpul terdapat< 10n< 10.

c. Adanya batasan jumlah level atau tingkat kedalaman pohon maksimal.

3 PENANDAAN LABEL KELAS3. PENANDAAN LABEL KELASPenentuan label kelas pada simpul terminal berdasarkan aturan jumlahterbanyak, Yaitu,

PENGHENTIAN PEMBENTUKAN POHON KLASIFIKASI

Menurut Lewis (2000) penghentian pembentukan pohon klasifikasidilakukan jika tidak memungkinkan lagi untuk dilanjutkan., proses tersebutberhenti pada saat :

a. Terdapat hanya satu pengamatan dalam tiap simpul anak atau adanyabatasan minimum n.

b. Semua pengamatan dalam tiap simpul anak mempunyai variabelp g p p p yindependen dengan distribusi yang sama atau identik sehingga tidakmungkin terjadi pemilahan.

c. Adanya batasan jumlah level atau tingkat kedalaman pohon maksimal.y j g p

PEMANGKASAN POHON KLASIFIKASI (PRUNNING)PEMANGKASAN POHON KLASIFIKASI (PRUNNING)

Pemangkasan adalah suatu penilaian ukuran sebuah pohon tanpamengorbankan kebaikan ketepatan melalui pengurangan simpul pohon yangmengorbankan kebaikan ketepatan melalui pengurangan simpul pohon yangpada akhirnya diperoleh ukuran pohon yang layak dan berdasarkan costcomplexity minimum.

cost complexity minimum :

Dimana : 

R (T) = Resubstitution Estimate

α = Parameter  Cost Complexity bagi penambahan satu simpul akhir

pada pohon T. 

׀T׀ = Banyaknya simpul terminal pohon T׀T׀ = Banyaknya simpul terminal pohon T. 

POHON KLASIFIKASI OPTIMAL

Pohon optimal adalah pohon yang berukuran sederhana dan memberikannilai penduga pengganti cukup kecil. Untuk mendapatkan pohon klasifikasioptimum ada dua macam penduga pengganti yaitu:

1. Penduga sampel uji (test sample estimate)

2. Penduga validasi silang lipat V (cross validation V‐fold estimate)

Data yang digunakan bersumber pada data sekunder yang diambildari data Riset Kesehatan Dasar (Riskesdas) tahun 2007 dan SurveiSosial Ekonomi Nasional (Susenas) tahun 2007.Objek diteliti adalahjsemua anggota rumah tangga yang berumur > 10 tahun di Aceh Utarabaik yang dinyatakan menderita penyakit demam tifoid maupun tidak.

Y=1 Terjangkit demam tifoid

Asal Daerah (x1)Jenis Kelamin (x2)

Y=1 ‐‐ Terjangkit demam tifoidY=2 ‐‐ Tidak terjangkit demam tifoid

Tempat buang air besar (x8)Jenis Kelamin (x2)Status Sosial Ekonomi (x3)Kualitas fisik air minum. (x4)Tempat penampungan air minum (x5)

p g ( 8)Kebiasaan cuci tangan pakai sabunsetelah BAB (x9)Kebiasaan cuci tangan pakai sabunp p p g ( 5)

Tempat pembuangan sampah (x6)Tempat penampungan air limbah (x7)

sebelum makan (x10)Penyuluhan Kesehatan (x11)

1. Analisis deskriptif.2. Analisis klasifikasi pohon (Classification Tree) menggunakan software CART

(Classification And Regression Trees) versi 4.0 dan dilakukan dengan(Classification And Regression Trees) versi 4.0 dan dilakukan dengantahapan sebagai berikut :

•Membagi 1.816 data anggota rumah tangga menjadi 2 yaitu data learning dan datatesting. Terdapat 5 kombinasi proporsi data learning dan testing, yaitu 95%:5%,90%:10%, 85%:15%, 80%:20%, dan 75%:25%. Selanjutnya dipilih satu kombinasi proporsidata learning dan testing yang memiliki ketepatan klasifikasi data testing terbesar untuklangkah analisis selanjutnya.•Menentukan kemungkinan pemilah pada setiap 11 variabel prediktor mencari pemilahMenentukan kemungkinan pemilah pada setiap 11 variabel prediktor, mencari pemilahterbaik berdasarkan kriteria Goodness of Split,dan selanjutnya memilah data learningyang masih heterogen menjadi bagian yang lebih homogen dengan indeks gini.•Penentuan simpul terminal (penghentian pohon).•Penandaan label kelas.•Melakukan pemangkasan pada pohon yang telah terbentuk berdasarkan costcomplexityminimum.•Memilih pohon terbaik.Memilih pohon terbaik.•Menguji ketepatan klasifikasi yang berasal dari data learning dengan memasukkan data

testing sehingga mendapatkan angka ketepatan klasifikasi.

l h J i K l iAsal Daerah Jenis Kelamin

Status Sosial Ekonomi Kualitas Fisik Air Minum

iTempat Penampungan Air Minum Tempat Sampah

Tempat PenampunganAir Limbah Tempat Buang Air Besar

Kebiasaan Cuci TanganPakai Sabun Setelah BAB

Kebiasaan Cuci Tangan PakaiSabun Sebelum Makan

P l h K h tPenyuluhan Kesehatan

Kombinasi Data

Ketepatan Klasifikasi DataKlasifikasi Data

Testing (%)Learning Testing

95% 5% 80,20%

90% 10% 83,50%

85% 15% 80 90%85% 15% 80,90%

80% 20% 82,10%

75% 25% 85,70%

Pembentukan Pohon Klasifikasi MaksimalPembentukan Pohon Klasifikasi Maksimal

PEMILAH‐PEMILAH

learning 75% (1.362 data) dan testing 25% (454 data)learning 75% (1.362 data) dan testing 25% (454 data)

Perhitungan pemilah pada setiap variabel prediktor diperoleh hasil sebagai berikut. 

• Asal daerah(2 kategori nominal)  22‐1‐1 = 1 pemilahan

• Jenis kelamin(2 kategori nominal) 22‐1‐1 = 1 pemilahanJenis kelamin(2 kategori nominal) 2 1   1 pemilahan

• Status sosial ekonomi(2 kategori nominal) 22‐1‐1 = 1 pemilahan

• Kualitas air minum(2 kategori nominal) 22‐1‐1 = 1 pemilahan

• Kondisi penampungan air minum(3 kategori nominal) 23‐1‐1 = 3 pemilahanKondisi penampungan air minum(3 kategori nominal) 2 1   3 pemilahan

• Kondisi tempat pembuangan sampah(3 kategori nominal) 23‐1‐1 = 3 pemilahan

• Kondisi penampungan air limbah(5 kategori nominal) 25‐1‐1 = 15 pemilahan

• Tempat buang air besar(2 kategori nominal) 22‐1‐1 = 1 pemilahanTempat buang air besar(2 kategori nominal) 2 1   1 pemilahan

• Kebiasaan cuci tangan pakai sabun setelah BAB(2 kategori nominal) 22‐1‐1 = 1

• Kebiasaan cuci tangan pakai sabun sebelum makan(2 kategori nominal) 22‐1‐1 =1

• Keikutsertaan penyuluhan(2 kategori nominal) 22‐1‐1 = 1 pemilahanKeikutsertaan penyuluhan(2 kategori nominal) 2 1 = 1 pemilahan

Pembentukan Pohon Klasifikasi MaksimalPembentukan Pohon Klasifikasi Maksimal

89 simpul terminal dengan 15 kedalaman

Ketepatan Klasifikasi PohonMaksimal

Pohon Klasifikasi OptimalPohon Klasifikasi Optimal

Pohon Klasifikasi OptimalPohon Klasifikasi Optimal

Skor Variabel PentingSkor Variabel Penting

Pohon Klasifikasi OptimalPohon Klasifikasi Optimal

KesimpulanKesimpulan

• Karakteristik dari masing‐masing variabel prediktor yang terjangkit demam tifoidterbesar adalah anggota rumah tangga dari pedesaan, status sosial ekonomimiskin, kualitas fisik air minum tidak keruh, tidak ada tandon untuk menampungair minum, tempat sampah terbuka,penampungan limbah terbuka di pekarangan,tempat buang air besar tidak di jamban, mempunyai kebiasaan cuci tangan pakaitempat buang air besar tidak di jamban, mempunyai kebiasaan cuci tangan pakaisabun setelah buang air besar, mempunyai kebiasaan cuci tangan pakai sabunsebelum makan, dan tidak pernah mengikuti penyuluhan kesehatan.

• Variabel yang berpengaruh terhadap terjangkitnya penyakit demam tifoid di AcehUtara adalah variabel tempat penampungan air minum sebagai faktor utamadengan skor tertinggi sebesar 100, tempat penampungan air limbah dengan skor70.61, kualitas fisik air minum dengan skor 55.23, kebiasaan cuci tangan pakaisabun sebelum makan dengan skor 48 12 variabel tempat buang air besarsabun sebelum makan dengan skor 48.12, variabel tempat buang air besardengan skor 40.60, tempat pembuangan sampah dengan skor 37.50, jenis kelamindengan skor 33.80 dan status sosial ekonomi dengan skor 22.09. Sedangkanvariabel kebiasaan cuci tangan pakai sabun setelah buang air besar dan

l h k h d k b l d b hpenyuluhan kesehatan dengan skor variabel penting dibawah 20.

Anonim_a. 2009. Penyakit Demam Tifoid. www.mangsholeh.wordpress.com-/2009/02/06/-penyakit-demam-tifoid/ (tanggal akses : 26 September 2009)

Anonim_b. 2008. Metode Diagnostik Demam Tifoid pada Anak.www.koas-kamar13.word-press.com/metode-diagnostik-demam-tifoid-pada-anak/(tanggal akses : 26 September 2009)

Anonim_c. 2007. Demam Tifoid. www.ummusalma.wordpress.com/2007/01-/22/hello-world/ (tanggal akses : 27 September 2009)/22/hello world/ (tanggal akses : 27 September 2009)

Breiman L, Friedman J.H, Olshen R.A, dan Stone C.J. 1993. Classification AndRegression Trees. Chapman And Hall. New York

Hidayati, N. 2001. “Analisis Regresi Poisson Terhadap Faktor-Faktor yangM hi P kit D T h id di P i i J Ti ” Sk i iMempengaruhi Penyakit Demam Typhoid di Provinsi Jawa Timur”. Skripsi,Mahasiswa Jurusan Statistika FMIPA ITS. Surabaya

Jevuska. 2008. Demam Tifoid (Typhoid Fever). www.jevuska.com-/2008/05/10/demam-tifoid-typhoid-fever (tanggal akses: 26 September/2008/05/10/demam tifoid typhoid fever (tanggal akses: 26 September2009)