View
224
Download
2
Category
Preview:
Citation preview
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
7
BAB II TEORI PENUNJANG
2.1 Machine Learning 2.1.1 Pengenalan Machine Learning
Machine learning adalah salah satu disiplin ilmu dari Computer Science yang mempelajari bagaimana membuat komputer atau mesin itu mempunyai suatu kecerdasan. Oleh karena itu agar komputer atau mesin dapat memiliki kecerdasan maka harus belajar. Di mana proses pembelajaran itu terdiri dari :
1. Supervised Learning : Learning dari contoh-contoh Didasari dari Teorema Bayes Menggunakan data positive dan negative Tidak diharuskan menggunakan data yang konsisten Jawaban ditunjukkan oleh nilai probabilitas Biasanya dipakai untuk fngsi - fungsi klasifikasi
2. Unsupervised Learning : Tidak melibatkan jawaban dalam data Hanya membuat suatu klasifikasi tanpa label atau jawaban Labelisasi (pemberian jawaban) menjadi tanggung jawab
user 3. Reinforcement learning :
Learning dari percobaan Memakai konsep reward dan punishment dalam proses
learning
2.1.2 Latar Belakang Machine Learning Latar belakang atau ide dasar adanya konsep mesin
pembelajaran atau machine learning adalah adanya penyajian keputusan berdasarkan fakta seperti berikut ini :
Fakta harian dalam 6 hari dan keputusan untuk berolah raga sebagai berikut ini
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
8
Tabel 2. 1 Tabel Cuaca
Sehingga muncul kasus seperti berikut ini yang membutuhkan suatu penyelesaian
1. Ketika cuaca cerah, apakah akan berolah raga? 2. Ketika cuaca cerah dan temperatur normal, apakah akan
berolah raga?
2.1.3 Data Training Berikut ini merupakan contoh dari data training dari tabel cuaca :
Gambar 2. 1 Data Training Cuaca
Keterangan : Attribut adalah kolom data, terdapat atribut itu sendiri
dan target. Instance adalah isis dari atribut sebagai contoh seperti
atribut cuaca mempunyai instance cerah dan hujan, sering ditulis dengan cuaca = {cerah, hujan}.
Record atau tuple adalah baris data.
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
9
2.1.4 Macam - Macam Data Macam-macam data yang ada dalam mesin pembelajaran
meliputi berikut ini : 1. Data konsisten
Gambar 2. 2 Data Konsisten
Atribut cuaca dan temperatur mempunyai nilai yang sama dalam satu keputusan (berolah raga), maka data ini adalah data yang konsisten. Sedangkan data tidak konsisten seperti berikut ini.
Gambar 2. 3 Data Tidak Konsisten
Tidak satupun atribut yang mempuyai nilai yang sama dalam satu keputusan (berolah raga), maka data ini adalah data yang tidak konsisten
2. Data Bias
Gambar 2. 4 Data Bias
Dari data di atas, data ke-4. Data ini mempunyai keputusan yang berbeda dengan data 1 dan data 2. Tetapi instance pada semua atributnya sama, sehingga data ini disebut dengan data bias.
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
10
2.2 Kanker Kandungan 2.2.1 Pengertian Kanker
Kanker adalah suatu kelompok yang banyak dari penyakit yang berhubungan. Semua kanker dimulai di sel-sel, unit dasar kehidupan dari tubuh. Sel-sel membuat jaringan-jaringan, dan jaringan-jaringan membuat organ-organ tubuh.
Secara normal, sel-sel tumbuh dan membelah membentuk sel-sel baru ketika mereka dibutuhkan oleh tubuh. Ketika sel-sel tumbuh menua dan mati, sel-sel baru mengambil tempat mereka. Kadangkala proses yang teratur ini berjalan salah. Sel-sel baru terbentuk ketika tubuh tidak memerlukan mereka, dan sel-sel tua tidak mati ketika mereka seharusnya mati. Sel-sel ekstra ini dapat membentuk suatu massa dari jaringan yang disebut suatu pertumbuhan atau tumor. 2.2.2 Jenis Kanker Kandungan
Jenis kanker kandungan bukan hanya 1, setiap bagian kandungan dapat terkena kanker seperti:
Cervical Cancer : leher rahim Endometrial : dinding rahim Ovarian : indung telur Fallopian tube : saluran antara indung telur ke lengan pelepas
sel telur Vaginal : jalan lahir bayi Vulvar : daerah luar vagina Placenta (Gestational Throphoblastic Disease) : sisa placenta
bayi Untuk menemukan adanya kanker kandungan yang paling
penting harus diketahui adanya perubahan pada diri sendiri. Contoh perubahan :
Gejala samar seperti rasa tidak nyaman di perut atau perut kambung
Sering buang air kecil Pencernaan terganggu Perdarahan vagina Perdarahan setelah hubungan seks Perdarahan dari vagina yang tidak beratutan Cairan keluar dari vagina atau gumpalan darah Sakit pada bagian perut bawah atau punggung
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
11
Adapun jenis lain seperti tumor adalah 1. Tumor-tumor jinak bukan kanker. Biasanya , dokter-
dokter dapat mengangkat/menghilangkan mereka. Sel-sel dari tumor-tumor jinak tidak menyebar ke bagian-bagian lain tubuh. Pada kebanyakan kasus-kasus, tumor-tumor jinak tidak datang kembali setelah mereka diangkat/dihilangkan. Paling penting, tumor-tumor jinak jarang adalah suatu ancaman nyawa. Tumor jinak ini meliputi Fibroids adalah tumor-tumor jinak yang umum yang
tumbuh dalam otot uterus. Mereka terjadi terutama pada wanita-wanita pada umur empatpuluhannya. Wanita-wanita mungkin mempunyai banyak fibroids pada waktu bersamaan. Fibroids tidak berkembang menjadi kanker. Ketika seorang wanita mencapai menopause, fibroids kemungkinan menjadi lebih kecil, dan kadangkala mereka menghilang. Biasanya, fibroids tidak menyebabkan gejala-gejala dan tidak memerlukan perawatan. Namun tergantung dari ukuran dan lokasi mereka, fibroids dapat menyebabkan perdarahan, kotoran vagina (vaginal discharge), dan kencing yang seringkali. Wanita-wanita dengan gejala-gejala ini harus mengunjungi seorang dokter. Jika fibroids menyebabkan perdarahan yang berat, atau jika mereka menekan pada organ-organ yang berdekatan dan menyebabkan nyeri, dokter mungkin menyarankan operasi atau perawatan lainnya.
Endometriosis adalah kondisi jinak lainnya yang mempengaruhi uterus. Ia adalah paling umum pada wanita-wanita yang berumur tigapuluhan dan empatpuluhan, terutama pada wanita-wanita yang belum pernah hamil. Itu terjadi ketika jaringan endometrial mulai tumbuh pada bagian luar uterus dan pada organ-organ yang berdekatan. Kondisi ini dapat menyebabkan periode-periode menstruasi yang menyakitkan, perdarahan vagina yang abnormal, dan kadangkala kehilangan kesuburan (kemampuan
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
12
menjadi hamil), namun itu tidak menyebabkan kanker. Wanita-wanita dengan endometriosis dapat dirawat dengan hormon-hormon atau operasi.
Endometrial hyperplasia adalah suatu peningkatan dalam jumlah sel-sel lapisan uterus. Itu bukan kanker. Kadangkala itu berkembang menjadi kanker. Periode-periode menstruasi yang berat, perdarahan diantara periode-periode, dan perdarahan setelah menopause adalah gejala-gejala umum dari hyperplasia. Itu adalah paling umum setelah umur 40 tahun. Untuk mencegah endometrial hyperplasia dari pengembangan ke kanker, dokter dapat merekomendasikan operasi untuk mengangkat uterus (hysterectomy) atau perawatan dengan hormon-hormon (progesterone) dan pemeriksaan-pemeriksaan follow-up secara teratur.
2. Tumor-tumor ganas adalah awal dari kanker. Mereka
umumnya adalah lebih serius dan mungkin mengancam nyawa. Sel-sel kanker dapat menyerang dan merusak jaringan-jaringan dan organ-organ yang berdekatan. Juga, sel-sel kanker dapat pecah keluar dari suatu tumor ganas dan masuk kedalam aliran darah atau sistim getah bening (sistim limfatik). Itu adalah bagaimana sel-sel kanker menyebar dari tumor asal membentuk tumor-tumor baru pada organ-organ lain. Penyebaran dari kanker disebut metastasis. Tipe kanker uterus (kandungan) yang paling umum mulai pada lapisan (endometrium). Disebut juga kanker edometrial (endometrial cancer), kanker kandungan, atau kanker uterus. Disini kita akan memakai istilah kanker kandungan atau kanker uterus untuk merujuk pada kanker yang mulai pada endometrium.
Tumor-tumor jinak bukan kanker. Biasanya , dokter-dokter dapat mengangkat/menghilangkan mereka. Sel-sel dari tumor-tumor jinak tidak menyebar ke bagian-bagian lain tubuh. Pada kebanyakan kasus-kasus, tumor-tumor jinak tidak datang kembali setelah mereka diangkat/dihilangkan. Paling penting, tumor-tumor jinak adalah jarang menjadi suatu ancaman nyawa.
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
13
menyebabkan perdarahan, kotoran vagina (vaginal discharge), dan kencing yang seringkali. Wanita-wanita dengan gejala-gejala ini harus mengunjungi seorang dokter. Jika fibroids menyebabkan perdarahan yang berat, atau jika mereka menekan pada organ-organ yang berdekatan dan menyebabkan nyeri, dokter mungkin menyarankan operasi atau perawatan lainnya.
Endometriosis adalah kondisi jinak lainnya yang mempengaruhi uterus. Ia adalah paling umum pada wanita-wanita yang berumur tigapuluhan dan empatpuluhan, terutama pada wanita-wanita yang belum pernah hamil. Itu terjadi ketika jaringan endometrial mulai tumbuh pada bagian luar uterus dan pada organ-organ yang berdekatan. Kondisi ini dapat menyebabkan periode-periode menstruasi yang menyakitkan, perdarahan vagina yang abnormal, dan kadangkala kehilangan kesuburan (kemampuan menjadi hamil), namun itu tidak menyebabkan kanker. Wanita-wanita dengan endometriosis dapat dirawat dengan hormon-hormon atau operasi.
Endometrial hyperplasia adalah suatu peningkatan dalam jumlah sel-sel lapisan uterus. Itu bukan kanker. Kadangkala itu berkembang menjadi kanker. Periode-periode menstruasi yang berat, perdarahan diantara periode-periode, dan perdarahan setelah menopause adalah gejala-gejala umum dari hyperplasia. Itu adalah paling umum setelah umur 40 tahun. Untuk mencegah endometrial hyperplasia dari pengembangan ke kanker, dokter dapat merekomendasikan operasi untuk mengangkat uterus (hysterectomy) atau perawatan dengan hormon-hormon (progesterone) dan pemeriksaan-pemeriksaan follow-up secara teratur.
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
14
3. Tumor-tumor ganas adalah kanker. Mereka umumnya adalah lebih serius dan mungkin mengancam nyawa. Sel-sel kanker dapat menyerang dan merusak jaringan-jaringan dan organ-organ yang berdekatan. Juga, sel-sel kanker dapat pecah keluar dari suatu tumor ganas dan masuk kedalam aliran darah atau sistim getah bening (sistim limfatik). Itu adalah bagaimana sel-sel kanker menyebar dari tumor asal membentuk tumor-tumor baru pada organ-organ lain. Penyebaran dari kanker disebut metastasis. Tipe kanker uterus (kandungan) yang paling umum mulai pada lapisan (endometrium). Disebut juga kanker edometrial (endometrial cancer), kanker kandungan, atau kanker uterus. Disini kita akan memakai istilah kanker kandungan atau kanker uterus untuk merujuk pada kanker yang mulai pada endometrium.
Tumor-tumor jinak bukan kanker. Biasanya , dokter-dokter dapat mengangkat/menghilangkan mereka. Sel-sel dari tumor-tumor jinak tidak menyebar ke bagian-bagian lain tubuh. Pada kebanyakan kasus-kasus, tumor-tumor jinak tidak datang kembali setelah mereka diangkat/dihilangkan. Paling penting, tumor-tumor jinak adalah jarang menjadi suatu ancaman nyawa. 2.3 Naive Bayes 2.3.1 Pengertian Naive Bayes
Naive Bayes merupakan pendekatan statistik untuk melakukan inferensi induksi pada persoalan klasifikasi. Metode ini menggunakan probabilitas bersyarat sebagai dasarnya. Dalam ilmu statistik, probabilitas bersyarat dinyatakan sebagai :
Probabilitas X di dalam Y adalah probabilitas interseksi X dan
Y dari probabilitas Y, atau dengan kata lain P(X|Y) adalah prosentase banyaknya X di dalam Y.
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
15
Gambar 2. 5 Diagram Ven pada Relasi Probabilitas Bersyarat
Misalkan terdapat data set cuaca seperti tampak pada tabel di bawah ini.
Tabel 2. 2 Tabel Set Cuaca
Banyaknya data berolah raga = ya adalah 4 dari 6 data maka dituliskan P(Olahraga=ya)=4/6. Banyaknya data cuaca=cerah dan berolahraga=ya adalah 4 dari 6 data maka dituliskan P(cuaca=cerha dan Olahraga=ya)=4/6. Dari informasi tersebut, maka probabilitas cuaca cerah pada saat berolah raga adalah
Metode Bayes dapat dinyatakan dengan probabilitas bersyarat
seperti yang diilustrasikan oleh gambar berikut
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
16
Gambar 2. 6 Probabilitas Bersyarat
Gambar di atas dapat dinyatakan dengan persamaan :
Dimana, keadaan Posterior (Probabilitas Xk di dalam Y) dapat
dihitung dari keadaan prior(Probabilitas Y di dalam Xk dibagi dengan jumlah dari semua probabilitas Y di dalam semua Xi).
2.3.2 Keunggulan Metode Naive Bayes
Kelebihan metode Naive Bayes sehingga digunakan dalam aplikasi ini adalah
Metode Find-S tidak dapat digunakan untuk data yang tidak konsisten dan data yang bias, sehingga untuk bentuk data semacam ini salah satu metode sederhana yang dapat digunakan adalah metode bayes.
Metode Bayes ini merupakan metode yang baik di dalam mesin pembelajaran berdasarkan data training, dengan menggunakan probabilitas bersyarat sebagai dasarnya. Sedangkan kelemahan dari metode Naive Bayes adalah
Metode Bayes hanya bisa digunakan untuk persoalan klasifikasi dengan supervised learning dan data-data kategorikal.
Metode Bayes memerlukan pengetahuan awal untuk dapat mengambil suatu keputusan. Tingkat keberhasilan metode ini sangat tergantung pada pengetahuan awal yang diberikan.
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
17
2.3.3 Pemanfaatan Metode Naive Bayes Metode Naive Bayes dapat diamanfaatkan dalam beberapa
bidang untuk menyelesaikan permasalahan seperti
Menentukan diagnosa suatu penyakit berdasarkan datadata gejala (sebagai contoh hipertensi atau sakit jantung).
Mengenali buah berdasarkan fitur-fitur buah seperti warna, bentuk, rasa dan lain-lain
Mengenali warna berdasarkan fitur indeks warna RGB Mendeteksi warna kulit (skin detection) berdarkan fitur warna
chrominant
Menentukan keputusan aksi (olahraga, art, psikologi) berdasarkan keadaan.
Menentukan jenis pakaian yang cocok untuk keadaankeadaan tertentu (seperti cuaca, musim, temperatur, acara, waktu, tempat dan lain-lain)
2.3.4 Penerapan Metode Naive Bayyes
Cara mengetahui seseorang menderita kanker atau tidak dengan menggunakan Naive Bayes adalah sebagai berikut : Misalkan seorang pasien melakukan tes laboratorium dan hasilnya adalah positif. Ini diketahui bahwa hasil tes yang benar untuk positif hanya 98% dari kasus-kasus dan hasil yang benar untuk hasil negatif hanya 97% dari kasus-kasus. Sedangkan hanya 0.008 dari keseluruhan popoulation terkena penyakit ini.
1. Berapa kemungkinan pasien ini menderita kanker? 2. Berapa kemungkinan pasien ini tidak menderita kanker? 3. Apa diagnosisnya?
Maka penyelesaiannya adalah
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
18
??.3
...........................)|(.2
..........)(
03.0)|(
...................................................................
)()|()()|()(
008.0)(
98.0)|(
...................................
.........................
)(
)()|()|(.1
'':
}'':2
'':1
Diagnosis
cancerP
cancerP
cancerP
cancerPcancerPcancerPcancerPP
cancerP
cancerP
P
cancerPcancerPcancerP
data
Hspacehypothesiscancerhypothesis
cancerhypothesis
=+
==+
=+++=+
==+
==+
+=+
+
2.4 HMAP 2.4.1 Pengenalan HMAP
Terminologi dari HMAP (Hypothesis Maximum Approri Probability) menyatakan hipotesa yang diambil berdasarkan kondisi prior yang diketahui.
HMAP adalah model penyederhanaan dari metode bayes yang disebut dengan Naive Bayes. HMAP dapat digunakan sebagai metode untuk mendapatkan hipotesis dari suatu keputusan. HMAP dapat diartikan mencari probabilitas terbesar dari semua instance pada atribut target atau semua kemungkinan keputusan. Contoh implementasi HMAP :
Diketahui hasil survey yang dilakukan sebuah lembaga kesehatan menyatakan bahwa 30% penduduk di dunia menderita sakit
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
19
paru-paru. Dari 90% penduduk yang sakit paru-paru ini 60% adalah perokok, dan dari penduduk yang tidak menderita sakit paru-paru 20% perokok. Fakta ini bisa didefinisikan dengan: X=sakit paru-paru dan Y=perokok. Maka : P(X) = 0.9
P(~X) = 0.1 P(Y|X) = 0.6 P(~Y|X) = 0.4 P(Y|~X) = 0.2 P(~Y|~X) = 0.8 Dengan metode bayes dapat dihitung: P({Y}|X) = P(Y|X).P(X) = (0.6) . (0.9) = 0.54 P({Y}|~X) = P(Y|~X) P(~X) = (0.2).(0.1) = 0.02
Bila diketahui seseorang merokok, maka dia menderita sakit paru-paru karena P({Y}|X) lebih besar dari P({Y}|~X). HMAP diartikan mencari probabilitas terbesar dari semua instance pada attribut target atau semua kemungkinan keputusan. Pada persoalan keputusan adalah sakit paru-paru atau tidak
2.4.2 HMAP pada Data Training
Tabel 2. 3 Data Set Cuaca
Berdasarkan tabel set cuaca di atas maka dapat diasumsikan
bahwa Y = berolahraga, X1 = cuaca, X2 = temperatur, X3 = kecepatan angin.
Fakta menunjukkan: P(Y=ya) = 4/6 P(Y=tidak) = 2/6
Fakta: P(X1=cerah|Y=ya) = 1, P(X1=cerah|Y=tidak) = 0
P(X3=kencang|Y=ya) = 1/4 , P(X3=kencang|Y=tidak) = 1/2
Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes
20
HMAP dari keadaan ini dapat dihitung dengan: P( X1=cerah,X3=kencang | Y=ya ) = { P(X1=cerah|Y=ya).P(X3=kencang|Y=ya) } . P(Y=ya) = { (1) . (1/4) } . (4/6) = 1/6 P( X1=cerah,X3=kencang | Y=tidak ) = { P(X1=cerah|Y=tidak).P(X3=kencang|Y=tidak) } .
P(Y=tidak) = { (0) . (1/2) } . (2/6) = 0
Keputusannya adalah berolah raga = YA
Recommended