View
24
Download
1
Category
Preview:
Citation preview
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
212
PENERAPAN METODE CHAID MENGGUNAKAN SMOTE
DALAM KLASIFIKASI TINGKAT LUKA KORBAN
KECELAKAAN LALU LINTAS POLRESTABES SURABAYA Studi Kasus: Data Kecelakaan Lalu Lintas Polrestabes Surabaya
Tahun 2018
Wahyu Rizky Nur Syamsi1) dan Jaka Nugraha2)
1,2)Program Studi Statistika Universitas Islam Indonesia
Email: 1)15611159@students.uii.ac.id, 2*)jaka.nugraha@uii.ac.id
ABSTRAK
Kecelakaan merupakan suatu peristiwa yang tidak disengaja serta bersifat multi
faktor yang selalu didahului oleh situasi dimana seorang atau lebih pemakai jalan telah
gagal mengatasi lingkungan mereka. Kecelakaan yang masih sering terabaikan dan tidak
dapat dihindari salah satunya adalah kecelakaan lalu lintas. Kota Surabaya sebagai salah
satu kota besar di Indonesia, memiliki tingkat kecelakaan lalu lintas yang cukup tinggi.
Jumlah kecelakaan terus mengalami peningkatan setiap tahunnya oleh karena itu perlu
dilakukan upaya untuk memprediksi tingkat kecelakaan tersebut. Perlu dilakukan analisis
untuk mengetahui karakteristik korban kecelakaan lalu lintas. Makalah ini membahas
pengklasifikasian tingkat luka korban kecelakaan lalu lintas menggunakan metode
CHAID (Chi–Square Automatic Interaction Detection). Metode CHAID umumnya
dikenal sebagai metode pohon klasifikasi (Classification Tree Method). Inti dari metode
ini adalah membagi data menjadi kelompok-kelompok yang lebih kecil berdasarkan
keterkaitan antara variabel terikat dengan variabel bebas. Hasil metode CHAID
membentuk pohon klasifikasi tingkat luka korban kecelakaan lalu lintas yang
menunjukkan bahwa seluruh variabel independen signifikan terhadap variabel dependen,
dimana variabel independennya terdiri dari variabel jenis hari terjadinya kecelakaan lalu
lintas, waktu terjadinya kecelakaan lalu lintas, jenis kecelakaan yang terjadi, kendaraan
yang terlibat dalam kecelakaan lalu lintas, usia korban kecelakaan lalu lintas, profesi
korban kecelakaan lalu lintas, dan jenis kelamin korban kecelakaan lalu lintas. Menurut
tingkat akurasi yang dihasilkan metode CHAID menunjukkan bahwa klasifikasi yang
terbentuk dengan persentase data training 80% dan data testing 20% diperoleh tingkat
akurasi sebesar 86,3%.
Kata kunci: Kecelakaan lalu lintas, Pohon Klasifikasi, CHAID
PENDAHULUAN
Menurut Badan Kesehatan Dunia (WHO) dalam Suma’mur (2009), kecelakaan
sebagai suatu kejadian yang tidak dapat dipersiapkan penanggulangan sebelumnya
sehingga menghasilkan cedera yang riil. Kecelakaan yang masih sering terabaikan dan
tidak dapat dihindari salah satunya adalah kecelakaan lalu lintas. Berdasarkan Undang-
undang Nomor 22 Tahun 2009 tentang Lalu Lintas dan Angkutan Jalan, mengungkapkan
kecelakaan lalu lintas adalah suatu peristiwa di jalan yang tidak diduga dan tidak
disengaja yang melibatkan kendaraan dengan atau tanpa pengguna jalan lain yang
mengakibatkan korban manusia dan/atau kerugian harta benda.
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
213
Berdasarkan WHO pada tahun 2013 ada 1,25 juta orang meninggal karena
kecelakaan lalu lintas, hal ini menunjukan bahwa setiap satu orang terbunuh setiap 25
detik. Berdasarkan Data Badan Pusat Statistik (BPS) disebutkan pada tahun 2015, jumlah
kecelakaan lalu lintas mencapai 98,9 ribu kasus. Angka tersebut meningkat 3,19 persen
dibandingkan tahun sebelumnya yang mencapai 95,5 ribu kasus. Indonesia berada di
peringkat ketiga di Asia di bawah Tiongkok dan India dengan total 38.279 total kematian
akibat kecelakaan lalu lintas di tahun 2015. Berdasarkan data Indonesia menduduki
peringkat ketiga tetapi dilihat dari presentase statistik dari jumlah populasi, Indonesia
berada di peringkat pertama dengan angka kematian 0,015 persen dari jumlah populasi di
bawah Tiongkok dengan presentase 0,018 persen dan India 0,017 persen. (Situmorang,
2016). Kota Surabaya sebagai salah satu kota besar di Indonesia, memiliki tingkat
kecelakaan lalu lintas yang cukup tinggi. Dari data Polda Jatim menunjukkan bahwa
selama triwulan I tahun 2010, jumlah kecelakaan di Kota Surabaya berada pada peringkat
kelima di Jawa Timur (Afidah & Susilaningrum, 2011).
Kendaraan bukan hanyak sebagai transportasi yang dapat memindahkan suatu objek
dari satu tempat ke tempat yang lain, tetapi kendaraan juga memudahkan manusia dalam
melakukan sehari-hari sehingga manusia tidak akan pernah lepas sebagai pengguna jalan.
Dibalik manfaat kendaraan bagi masyarakat, terdapat juga berbagai permasalahan yang
berkaitan dengan penggunaan jalan raya. Banyaknya pengguna jalan raya setiap hari
sehingga tidak mungkin luput dari permasalahan lalu lintas. Banyaknya korban
kecelakaan lalu lintas ini terjadi karena faktor manusianya sendiri, baik itu pengendara
atau pengguna jalan yang tidak berhati-hati dalam berlalu lintas dan disebabkan
kendaraan yang sebenarnya sudah tidak layak beroperasional, dan juga karena faktor
cuaca. Apabila masalah kecelakaan di jalan raya tidak diperhatikan dengan baik maka
dikhawatirkan akan terjadi peningkatan jumlah korban kecelakaan dari tahun ke tahun.
Dari permasalah kecelakaan lalu lintas tersebut diperlukan analisis tingkat kecelakaan
lalu lintas yang diharapkan dapat memberikan informasi sehingga mengurangi resiko
kecelakaan lalu lintas dan juga dapat menghindari kerugian baik terhadap korban maupun
masyarakat sekitar. Dengan ini menganalisis permasalahan tersebut yaitu dengan
mengklasifikasikan faktor-faktor yang mengakibatkan terjadinya kecelakaan lalu lintas.
Fikri (2018) telah mengaplikasikan Metode Chi-Squared Automatic Interaction Detection
(CHAID) dengan Synthetic Minority Oversampling Technique (SMOTE).
Menurut Hamakonda & Tairas (1991) dalam Milana & Abadyo (2013) klasifikasi
adalah pengelompokkan yang sistematis pada sejumlah objek, gagasan, buku atau benda-
benda lain ke dalam kelas atau golongan tertentu berdasarkan ciri-ciri yang sama.
Menurut Steyn & Stumph (1986) dalam Milana & Abadyo (2013) Salah satu metode
yang menggunakan teknik klasifikasi yaitu metode CHAID Metode CHAID umumnya
dikenal sebagai metode pohon klasifikasi (Classification Tree Method). Inti dari metode
ini adalah membagi data menjadi kelompok-kelompok yang lebih kecil berdasarkan
keterkaitan antara variabel terikat dengan variabel bebas. Analisis CHAID digunakan
ketika data yang dipakai adalah data dengan variabel-variabel kategorik. Metode CHAID
hanya efektif bila diterapkan pada data dengan pengamatan yang banyak. Metode ini
nantinya akan menghasilkan output berupa pohon klasifikasi yang akan mudah di
interpretasikan karena peneliti dapat melihat langsung bagaimana proses pemisahan dan
penggabungan variabel independen.
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
214
Metode CHAID sudah lazim digunakan pada masalah pengklasifikasian diberbagai
bidang. Permana (2011) telah melakukan klasifikasi Alumni S1 FMIPA UNY dengan
Metode CHAID. Metode CHAID dianggap lebih unggul dibandingkan dengan regresi
logistik biner karena CHAID dapat membagi alumni menjadi beberapa segmen,
sedangkan regresi logistik biner hanya mengklasifikasikan alumni menjadi kategori lulus
tepat waktu dan tidak tepat waktu. Menurut Kunto (2006) juga telah berhasil menerapkan
analisis CHAID untuk segmentasi pasar.
METODE PENELITIAN
Data diperoleh dari Data Kecelakaan Kerja Lalu Lintas Polrestabes Surabaya tahun
2018. Variabel yang digunakan adalah jenis hari terjadinya kecelakaan lalu lintas, waktu
kejadian kecelakaan lalu lintas, jenis kecelakaan lalu lintas, kendaraan yang terlibat dalam
kecelakaan lalu lintas, usia korban kecelakaan lalu lintas, profesi korban kecelakaan lalu
lintas, jenis kelamin korban kecelakaan lalu lintas, dan tingkat luka kecelakaan lalu lintas.
Rincian kategori dari masing-masing variabel dapat dilihat pada Tabel 1.
Tabel 1. Tabulasi Kategori Setiap Variabel
Variabel Kategori
Tingkat Luka Korban (1) LR; (2) LB; (3)MD
Keterangan : LR = luka ringan, LB = luka berat, MD=meninggal
dunia.
Jenis Hari (1) Hari kerja; (2) Hari libur; (3) Akhir minggu
Waktu Kecelakaan (1) dini hari; (2) pagi hari; (3) siang hari; (4) malam hari
Jenis Kecelakaan (1) depan samping; (2) depan belakang;
(3) menabrak penyeberang jalan; (4) depan depan; (5) beruntun;
(6) sendiri
Kendaraan Terlibat (1) spm-spm; (2) spm-mbl; (3) spm; (4) spm-bus/truk; (5) spd-spm;
(6) mbl; (7) bus/truk-bus/truk (8) mbl-mbl; (9) spd-mbl;
(10) mbl-bus/truk; (11) bus/truk.
Keterangan : spm = sepeda motor, mbl = mobil,
Usia Korban (1)balita kanak-kanak; (2) remaja; (3) dewasa; (4) lansia; (5)manula
Profesi Korban (1)wiraswasta/wirausaha; (2) pelajar/mahasiswa; (3) PNS
TNI/POLRI; (4) lain-lain
Jenis Kelamin (1)Laki-laki; (2)perempuan
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
215
HASIL DAN PEMBAHASAN
Analisis data dan pembuatan pohon klasifikasi menggunakan software SPSS dan
Sipina.
1. Analisis CHAID CHAID merupakan salah satu teknik klasifikasi dengan melibatkan beberapa
variabel kategorik dan salah satu variabelnya ditetapkan sebagai variabel independen
dan yang lainnya sebagai variabel independen. Alat utama dalam metode CHAID
adalah statistik Chi-Square. Hipotesis untuk uji independensi adalah
H0 : Faktor baris dan Faktor kolom saling independen
H1 : Faktor baris dan Faktor kolom tidak saling independen
Terdapat dua statistik uji yang berdistribusi Chi-Kuadrat yaitu Pearson Chi-
Kuadrat (2) dan likelihood ratio Chi-Kuadrat (G2) (Nugraha, 2014). Statistik uji Chi-
Square sebagai berikut (Agresti, 2002)
(1)
2 berdistribusi Chi-square dengan derajat bebas : (r-1)(c-1). adalah
observasi baris ke-i dan kolom ke-j. adalah frekuensi harapan baris ke-i dan
kolom ke-j. ri adalah baris ke-i untuk i=1,2,…,c dan cj adalah kolom ke-j untuk
j=1,2,…,c. Total observasi sebanyan n.
CHAID merupakan suatu teknik iteratif yang menguji satu-persatu variabel
independen yang digunakan dalam klasifikasi, dan menyusunnya berdasarkan pada
tingkat signifikansi statistik Chi-Square terhadap variabel dependennya. (Gallagher,
2000). CHAID akan membedakan variabel variabel independennya menjadi tiga
bentuk yang berbeda, yaitu monotonic, bebas dan mengambang (floting). Menurut
Magidson yang dikutip oleh Bagozzi (1994) dalam Kunto (2006), menerangkan
bahwa langkah-langkah analisis CHAID secara garis besar dapat dibagi menjadi tiga
tahap, yaitu Penggabungan, Pemisahan dan Penghentian. Penggabungan adalah
proses pengabungan level kategori yang tidak signifikan dari hasil pengujian
menggunakan statistik Chi-square. Pemisahan adalah proses pembagian kelompok
menggunakan variable independen yang dimulai dari varibel paling signifikan (p-
value paling kecil). Penghentian adalah tahap penghentian proses pemisahan ketika
semua sub kelompok telah dianalisis dan juga telah berisi pengamatan-pengamatan
dengan jumlah yang terlalu sedikit. Skema proses metode CHAID dengan urutan
analisis sebagaimana pada Gambar 1.
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
216
Gambar 1 Diagram Alir Algoritma CHAID
2. Koreksi Bonferroni (Bonferroni Correction) Koreksi Bonferroni adalah suatu proses koreksi yang digunakan ketika beberapa
uji statistik untuk kebebasan atau ketidakbebasan dilakukan secara bersamaan (Sharp
et al., 2002 dalam Kunto, 2006). Koreksi Bonferroni biasanya digunakan dalam
pembandingan berganda.
Ketika terdapat sebanyak M uji perbandingan yang sudah dikatakan bebas satu
sama lain, peluang untuk melakukan kesalahan tipe 1 atau α (dalam satu atau lebih
uji-uji tersebut), akan sama dengan 1 dikurangi peluang untuk tidak melakukan
kesalahan tipe 1 dalam uji-uji tersebut, di mana nilainya akan lebih besar dari α yang
telah ditentukan. Secara umum, hal tersebut dapat dirumuskan sebagai berikut
(Bagozzi, 1994) dalam (Kunto, 2006):
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
217
(2)
dengan M : pengali Bonferroni dan α :salah tipe 1.
Pengali Bonferroni untuk masing-masing tipe variabel variabel independen
adalah berbeda. Gallagher (2000) menyebutkan bahwa pengali Bonferroni untuk
masing-masing jenis variabel variabel independen adalah sebagai berikut:
a. Variabel Independen Monotonik
M = (3)
b. Variabel Independen Bebas
M = (4)
c. Variabel Independen Mengambang (Floating)
M = (5)
dengan M : pengali Bonferroni, c : banyaknya kategori asal, r : banyaknya kategori
baru dan i : kategori baru ke-i.
3. Evaluasi Klasifikasi
Jika metode CHAID digunakan untuk mengklasifikasikan data observasi, maka
perlu diuji keakuratan metode CHAID dalam mengklasifikasikan observasi yang
berasal dari sampel lain. Ketepatan hasil klasifikasi dapat dihitung dari nilai akurasi
yang didefinisikan sebagai porsentase dari observasi yang benar dalam
pengklasifikasian terhadap jumlah total observasi. Cara menghitung nilai akurasi
adalah sebagai berikut :
(6)
4. Tahap Penggabungan
Tahap penggabungan dilakukan menggunakan uji independensi chi-square
terhadap variabel jenis hari, waktu kecelakaan, jenis kecelakaan, kendaraan terlibat,
usia korban, profesi korban, dan jenis kelamin yang sudah di kategorikan. Tahapan
ini menghasilkan nilai chi-square dan p-value pada yang ditunjukkan dalam Tabel 2.
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
218
Tabel 2. nilai Chi-square dan p-value
variabel independen terhadap variabel dependen
Variabel Independen Kategori Chi-Square P-value
Jenis Hari {1;3} dan 2 14,602 0,006
Waktu Kecelakaan 1, {2;3}, dan 4 80,581 0,000
Jenis Kecelakaan {1;4}, 2, 3, 5, dan 6 309,593 0,000
Kendaraan Terlibat {1;5}, {2;{8;10}},
{3;9}, 4, {6;11}, dan 7 376,042 0,000
Usia Korban {1;{2;3}} dan {4;5} 50,491 0,000
Profesi Korban {1;4}, 2, dan 3 22,505 0,001
Jenis Kelamin 1 dan 2 39,738 0,000
Berdasarkan Tabel 2 untuk p-value dikalikan dengan koreksi Bonferroni jenis
bebas karena variabel data kecelakaan lalu lintas termasuk data nominal. Hasil
perhitungan koreksi Bonferroni setiap variabel independen ditunjukkan dalam Tabel
3.
Tabel 3. Koreksi Bonferroni pada Variabel Independen
Variabel Koreksi Bonferroni Hasil
Jenis Hari
3
Waktu Kecelakaan
6
Jenis kecelakaan
15
Kendaraan Terlibat
179487
Usia Korban
25
Profesi Korban
6
Jenis Kelamin
1
Hasil dari perhitungan koreksi Bonferroni masing-masing variabel Independen
dikalikan dengan p-value dari masing-masing variabel independen sehingga diperoleh
p-value terkoreksi Bonferroni. Hasil p-value terkoreksi Bonferroni masing-masing
variabel ditampilkan dalam Tabel 3.
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
219
5. Tahap Pemisahan
Pada tahap pemisahan, simpul akan dipisah menggunakan sebuah variabel
independen. Simpul ini akan dibagi menjadi beberapa bagian berdasarkan kategori
variabel independen pemisah simpul. Pada bagian ini akan dijelaskan tahap
pemisahan dari root node. Uji Chi-Square yang akan digunakan dalam menentukan
variabel independen pemisah simpul, tentunya variabel independen yang memiliki
nilai Chi-Square terbesar dan signifikan terhadap variabel dependen. Hasil uji Chi-
Square dari setiap variabel independen terhadap variabel dependen dapat dilihat pada
Tabel 4.
Tabel 4. Nilai chi-square dan p-value
variabel independen terhadap variabel dependen
Variabel
Independen
Kategori Chi-Square P-value
Jenis Hari {1;3} dan 2 14,602 0,018
Waktu Kecelakaan 1, {2;3}, dan 4 80,581 0,000
Jenis Kecelakaan {1;4}, 2, 3, 5, dan
6
309,593 0,000
Kendaraan Terlibat {1;5}, {2;{8;10}},
{3;9}, 4, {6;11},
dan 7
376,042 0,000
Usia Korban {1;{2;3}} dan
{4;5}
50,491 0,000
Profesi Korban {1;4}, 2, dan 3 22,505 0,006
Jenis Kelamin 1 dan 2 39,738 0,000
*(p-value terkoreksi Bonferroni)
Berdasarkan Tabel 4 nilai uji Chi-Square terbesar terdapat pada variabel
kendaraan terlibat dan p-value variabel kendaraan terlibat kurang dari taraf
signifikansi, sehingga variabel kendaraan terlibat digunakan sebagai variabel pemisah
pada root node. Pembentukan diagram pohon dihentikan karena memenuhi satu atau
lebih kriteria penghentian.
6. Klasifikasi CHAID
Analisis dalam penelitian ini adalah metode CHAID. Dalam metode CHAID ini,
selain menggunakan aplikasi SPSS dan Microsoft excel, penelitian ini juga
menggunakan aplikasi Sipina yang akan memberi output berupa diagram pohon
klasifikasi dari data kecelakaan lalu lintas di kota Surabaya tahun 2018. Diagram
pohon hasil analisis CHAID samapai kedalam 2 disajikan di Gambar 2.
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
220
(a)
(b)
Gambar 2. Kedalaman 1 dan 2 Diagram Pohon CHAID
Berdasarkan diagram pohon hasil analisis CHAID menunjukkan bahwa seluruh
variabel bebas signifikan terhadap variabel terikatnya, yaitu variabel jenis hari
terjadinya kecelakaan lalu lintas, waktu terjadinya kecelakaan lalu lintas, jenis
kecelakaan yang terjadi, kendaraan yang terlibat dalam kecelakaan lalu lintas, usia
korban kecelakaan lalu lintas, profesi korban kecelakaan lalu lintas, dan jenis kelamin
korban kecelakaan lalu lintas.
Dari hasil diagram pohon CHAID bahwa terdapat simpul 135 buah, simpul akhir
terdapat 3 buah dan kedalaman sebanyak 6. Node teratas diketahui jumlah total
korban kecelakaan lalu lintas dikota Surabaya sebanyak 2970 yang terdiri dari 2424
korban yang mengalami luka ringan, 260 korban yang meninggal dunia, dan 286
korban yang mengalami luka berat.
Pada tahap pemisahan CHAID, variabel independen yang mempunyai asosiasi
paling kuat dengan tingkat luka korban adalah variabel kendaraan terlibat. Dari 2970
korban, sekitar 51,25% merupakan kelompok kendaraan terlibat spm-spm atau Spd-
Spm, sekitar 25,62% merupakan kelompok kendaraan terlibat spm-mbl, mbl-mbl,
atau mbl-bus/truk, sekitar 8,32% merupakan kelompok kendaraan terlibat spm-
bus/truk, sekitar 11,72% merupakan kelompok kendaraan terlibat spm atau spd-mbl,
sekitar 1,14% merupakan kelompok kendaraan terlibat bus/truk-bus/truk, dan sekitar
1,95% merupakan kelompok kendaraan terlibat mbl atau bus/truk.
Berdasarkan hasil CHAID, korban yang banyak tergolong mengalami luka ringan
yaitu berjenis kelamin perempuan berusia dewasa dan berprofesi
wiraswasta/wirausaha, kendaraan yang terlibat dalam kecelakaan adalah spm-spm
dimana kecelakaan terjadi pada pagi hari saat hari kerja dengan jenis kecelakaan
depan samping. Korban yang banyak tergolong mengalami luka berat yaitu
kecelakaan yang terjadi pada malam hari saat hari kerja dimana korban berprofesi
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
221
wiraswasta/wirausaha. Korban yang banyak tergolong meninggal dunia yaitu korban
yang berusia lansia mengalami kecelakaan di pagi hari dengan kendaraan yang
terlibat adalah spm dan jenis kecelakaan depan samping.
Metode CHAID dapat meminimalisir atau meminimumkan jumlah korban yang
mengalami luka berat dan meninggal dunia, maka peneliti memberikan rekomendasi
karakteristik korban kepada POLRESTABES Surabaya seperti berikut:
a. Jika kendaraan terlibat adalah spm-spm, spd-spm dan waktu kecelakaan di malam
hari dan jenis hari terjadinya kecelakaan saat hari libur, akhir minggu dan jenis
kecelakaan adalah depan belakang, beruntun, sendiri dan jenis kelamin
perempuan maka dari data diperoleh luka berat sebanyak 5 (100%) sehingga
korban pada segmen ini diduga akan mengalami luka berat. (Segmen 18).
b. Jika kendaraan terlibat adalah spm-spm, spd-spm dan waktu kecelakaan di malam
hari dan jenis hari terjadinya kecelakaan saat hari libur, akhir minggu dan jenis
kecelakaan adalah depan samping, depan depan dan kendaraan terlibat spd-spm
maka dari data diperoleh luka berat sebanyak 2 (100%) sehingga korban pada
segmen ini diduga akan mengalami luka berat. (Segmen 21).
c. Jika kendaraan terlibat adalah spm-spm, spd-spm dan waktu kecelakaan di dini
hari dan usia korban lansia, remaja, balita & kanak-kanak dan profesi korban
PNS TNI/POLRI, pelajar/mahasiswa dan jenis kecelakaan depan belakang maka
dari data diperoleh luka berat sebanyak 2 (100%) sehingga korban pada segmen
ini diduga akan mengalami luka berat. (Segmen 31).
d. Jika kendaraan terlibat adalah spm-mbl, mbl-mbl, mbl-bus/truk dan waktu
kecelakaan di siang hari, malam hari dan profesi korban wiraswasta/wirausaha,
PNS TNI/POLRI, pelajar/mahasiswa dan jenis hari terjadinya kecelakaan saat
hari kerja, akhir minggu dan jenis kecelakaan depan belakang, depan depan dan
kendaraan terlibat mbl-mbl maka dari data diperoleh luka ringan sebanyak 1
(25%) dan luka berat sebanyak 3 (75%) sehingga korban pada segmen ini diduga
akan mengalami luka berat. (Segmen 38).
e. Jika kendaraan terlibat adalah spm-mbl, mbl-mbl, mbl-bus/truk dan waktu
kecelakaan di pagi hari dan jenis kelamin perempuan dan usia korban lansia dan
jenis hari terjadinya kecelakaan saat hari libur maka dari data diperoleh
meninggal dunia sebanyak 4 (100%) sehingga korban pada segmen ini diduga
akan meninggal dunia. (Segmen 43).
f. Jika kendaraan terlibat adalah spm-mbl, mbl-mbl, mbl-bus/truk dan waktu
kecelakaan di dini hari dan jenis kecelakaan beruntun dan jenis hari terjadinya
kecelakaan saat hari libur maka dari data diperoleh luka berat sebanyak 5 (71%)
dan meninggal dunia sebanyak 2 (29%) sehingga korban pada segmen ini diduga
akan mengalami luka berat. (Segmen 54).
g. Jika kendaraan terlibat adalah spm-bus/truk dan waktu kecelakaan di malam hari
dan profesi korban wiraswasta/wirausaha dan jenis hari terjadinya kecelakaan
saat hari kerja, akhir minggu maka dari data diperoleh luka ringan sebanyak 13
(24%), luka berat sebanyak 40 (73%), dan meninggal dunia sebanyak 2 (4%)
sehingga korban pada segmen ini diduga akan mengalami luka berat. (Segmen
62).
h. Jika kendaraan terlibat adalah spm-bus/truk dan waktu kecelakaan di dini hari
maka dari data diperoleh luka ringan sebanyak 5 (33%) dan meninggal dunia
sebanyak 10 (67%) sehingga korban pada segmen ini diduga akan meninggal
dunia. (Segmen 65).
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
222
i. Jika kendaraan terlibat adalah spm, spd-mbl dan jenis kecelakaan depan
belakang, depan samping, depan depan dan umur dewasa dan waktu kejadian
pagi hari, malam hari maka dari data diperoleh meninggal dunia sebanyak 6
(100%) sehingga korban pada segmen ini diduga akan meninggal dunia. (Segmen
68).
j. Jika kendaraan terlibat adalah spm, spd-mbl dan jenis kecelakaan menabrak
penyeberang jalan dan waktu kejadian dini hari dan usia korban manula maka
dari data diperoleh luka ringan sebanyak 1 (10%) dan meninggal dunia sebanyak
9 (90%) sehingga korban pada segmen ini diduga akan meninggal dunia.
(Segmen 73).
k. Jika kendaraan terlibat adalah spm, spd-mbl dan jenis kecelakaan sendiri maka
dari data diperoleh luka ringan sebanyak 4 (11%), luka berat sebanyak 2 (6%),
dan meninggal dunia sebanyak 29 (83%) sehingga korban pada segmen ini
diduga akan meninggal dunia. (Segmen 76).
l. Jika kendaraan terlibat adalah bus/truk-bus/truk dan jenis kecelakaan depan
belakang dan waktu kejadian di malam hari, dini hari maka dari data diperoleh
luka berat sebanyak 7 (100%) sehingga korban pada segmen ini diduga akan
mengalami luka berat. (Segmen 79).
m. Jika kendaraan terlibat adalah mbl, bus/truk dan usia korban lansia, manula dan
jenis kelamin perempuan maka dari data diperoleh meninggal dunia sebanyak 15
(100%) sehingga korban pada segmen ini diduga akan meninggal dunia. (Segmen
83).
7. Tingkat Akurasi Dan Presisi Metode CHAID
Berdasarkan 15 segmen yang telah diuraikan sebelumnya maka dilakukan
perhitungan nilaI akurasi dan presisi agar dapat mengetahui sejauh mana model
dalam mengklasifikasikan dengan benar. Berikut adalah tingkat akurasi dan presisi
dengan menggunakan metode CHAID.
Tabel 5. Tingkat Akurasi dan Presisi Metode CHAID
Data Tingkat Luka LR MD LB
Training
LR 2381 11 32
MD 172 75 13
LB 195 3 88
Persentase 85,7%
Data Tingkat Luka
Testing
LR 612 0 0
MD 57 9 0
LB 45 0 19
Persentase 86,3%
Menurut tingkat akurasi yang dihasilkan metode CHAID pada tabel 3.4
dapat dilihat bahwa klasifikasi yang terbentuk dengan persentase data training
80% dan data testing 20% diperoleh tingkat akurasi data training sebesar
85,7% dan tingkat akurasi data testing sebesar 86,3%.
8. Validasi Sistem
Pada tahap validasi sistem, maka akan dibandingkan output dari metode CHAID,
Improve CHAID dan Improve C4.5. Dibawah ini tabel perbandingannya :
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
223
Tabel 6. Validasi Sistem
Output CHAID Improve CHAID Improve C4.5
Akurasi 86,3% 82,5% 83,8%
Berdasarkan tabel di atas dapat diambil kesimpulan bahwa metode CHAID
memiliki nilai akurasi yang berbeda dengan metode lain atau dapat dikatakan metode
CHAID memiliki akurasi yang lebih baik atau optimal untuk mengklasifikasikan data
dalam penelitian ini.
KESIMPULAN
Berdasarkan hasil analisis dan pembahasan yang telah dijelaskan sebelumnya oleh
peneliti, maka dapat ditarik kesimpulan yaitu :
1. Gambaran umum pada data kecelakaan lalu lintas di kota Surabaya pada tahun 2018
terjadi kecelakaan sebanyak 1387 korban. Korban yang mengalami kecelakaan lalu
lintas sebagian besar berjenis kelamin laki-laki, berusia dewasa, berprofesi
wiraswasta/wirausaha, waktu kejadian kecelakaan pada pagi hari, jenis hari adalah
hari kerja, kendaraan terlibat sepeda motor dengan sepeda motor, dan jenis
kecelakaan depan samping dimana masing-masing karakteristik tersebut sebagian
besar mengalami luka ringan dan sebagian kecil mengalami luka berat dan
meninggal dunia.
2. Berdasarkan hasil analisis CHAID menunjukkan bahwa seluruh variabel bebas
signifikan terhadap variabel terikatnya, yaitu variabel jenis hari terjadinya
kecelakaan lalu lintas, waktu terjadinya kecelakaan lalu lintas, jenis kecelakaan yang
terjadi, kendaraan yang terlibat dalam kecelakaan lalu lintas, usia korban kecelakaan
lalu lintas, profesi korban kecelakaan lalu lintas, dan jenis kelamin korban
kecelakaan lalu lintas. Dapat dilihat dari hasil diagram pohon CHAID bahwa
terdapat simpul 135 buah, simpul akhir terdapat 3 buah dan kedalaman sebanyak 6.
Node teratas diketahui jumlah total korban kecelakaan lalu lintas dikota Surabaya
sebanyak 2970 yang terdiri dari 2424 korban yang mengalami luka ringan, 260
korban yang meninggal dunia, dan 286 korban yang mengalami luka berat. Pada
tahap pemisahan CHAID, variabel independen yang mempunyai asosiasi paling kuat
dengan tingkat luka korban adalah variabel kendaraan terlibat. Dari 2970 korban,
sekitar 51,25% merupakan kelompok kendaraan terlibat spm-spm atau Spd-Spm,
sekitar 25,62% merupakan kelompok kendaraan terlibat spm-mbl, mbl-mbl, atau
mbl-bus/truk, sekitar 8,32% merupakan kelompok kendaraan terlibat spm-bus/truk,
sekitar 11,72% merupakan kelompok kendaraan terlibat spm atau spd-mbl, sekitar
1,14% merupakan kelompok kendaraan terlibat bus/truk-bus/truk, dan sekitar 1,95%
merupakan kelompok kendaraan terlibat mbl atau bus/truk. Klasifikasi yang
menggolongkan korban mengalami luka ringan yaitu simpul 1, 2, 3, 6, 9, 10, 11, 12,
15, 19, 20, 23, 24, 27, 32, 35, 36, 37, 40, 41, 44, 45, 49, 51, 52, 55, 56, 57, 61, 63,
66, 69, 70, 71, 72, 78, 80, 84, dan 85 dengan persentase mengalami luka ringan
diatas 60%. Klasifikasi yang menggolongkan korban mengalami luka berat yaitu
simpul 8, 13, 18, 21, 31, 38, 54, 62 dan 79 dengan persentase mengalami luka berat
diatas 60%. Klasifikasi yang menggolongkan korban yang meninggal dunia yaitu
simpul 43, 65, 68, 73, 76, dan 83 dengan persentase korban meninggal dunia diatas
60%.
3. Menurut tingkat akurasi yang dihasilkan metode CHAID dapat dilihat bahwa
klasifikasi yang terbentuk dengan persentase data training 80% dan data testing 20%
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
224
diperoleh tingkat akurasi data training sebesar 85,7% dan tingkat akurasi data testing
sebesar 86,3%.
Berdasarkan kesimpulan penelitian, maka direkomendasikan berupa saran-saran
sebagai berikut:
1. Pada penelitian selanjutnya diharapkan seluruh jenis kecelakaan lalu lintas dan
faktor-faktor penyebab kecelakaan lalu lintas yang berhubungan dengan tingkat luka
korban kecelakaan lalu lintas dapat dijadikan variabel independen.
2. Pada penelitian selanjutnya diharapkan dapat membandingkan tingkat keakuratan
metode pada analisis data yang belum di seimbangkan dan yang telah diseimbangkan
menggunakan aplikasi weka.
3. Pada penelitian selanjutnya diharapkan dapat membandingkan tingkat keakuratan
metode CHAID dengan metode lainnya sehingga dapat diperoleh model terbaik.
4. Bagi pihak kepolisian atau pihak terkait adakan pendidikan keselamatan yang terarah
dan penegakan hukum yang berefek jera, berikan hak mengemudi secara ketat,
sediakan sarana dan prasarana lalu lintas jalan yang memenuhi standar kelayakan
keselamatan, melakukan upaya pencegahan luka apabila terjadi kecelakaan,
melakukan upaya penanganan korban luka agar segera dapat ditolong untuk
meminimalkan tingkat keparahannya, pendidikan berlalu lintas sejak usia dini,
penegakkan hukum terhadap pelanggaran-pelanggaran lalu lintas yang potensial
menyebabkan fatalitas kecelakaan lalu lintas.
DAFTAR PUSTAKA
Afidah, L. N. & Susilaningrum, D. (2011). Pola Tingkatan Keparahan Korban
Kecelakaan Lalu Lintas Dengan Menggunakan Regresi Logistik Multinomial
(Studi Kasus: Kecelakaan Lalu Lintas di Surabaya). FMIPA ITS. Surabaya.
Fikri, B. A. (2018). Klasifikasi Tingkat Luka Korban Kecelakaan Lalu Lintas dengan
Metode Chi-Squared Automatic Interaction Detection (CHAID) with Synthetic
Minority Oversampling Technique (SMOTE). Universitas Islam Indonesia.
Yogyakarta.
Gallagher, C.A. (2000). An Iterative Approach to Classification Analysis.
https://www.casact.org/pubs/dpp/dpp90/90dpp237.pdf diakses pada 28 Februari
2019
Kunto, Y. S. (2006). Analisis CHAID Sebagai Alat Bantu Statistika Untuk Segmentasi
Pasar. Jurnal Manajemen Pemasaran, Vol. 1, No. 2, Oktober 2006: 88-98.
Milana, N. & Abadyo. (2013). CHAID untuk Mengklasifikasi Status Mahasiswa Setelah
Lulus Perkuliahan. Jurnal Online Universitas Negeri Malang, Vol. 1 No. 2 (2012)
Nugraha J. (2014). Pengantar Analisis Data Kategorik: Metode dan Aplikasi
Menggunakan Program R. Deepublish.
Permana, H. (2011). Klasifikasi dengan Metode CHAID (Chi-Squared Automatic
Interaction Detection). UNY. Yogyakarta.
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP
“Manajemen Bencana di Era Revolusi Industri 5.0”
ISBN 978-602-6697-38-7
Purwokerto, 10 Agustus 2019
225
Situmorang. (2016). WHO: Angka Kecelakaan Lalu Lintas di Indonesia Tertinggi se-
Asia. http://entertainment.analisadaily.com/read/who-angka-kecelakaan-lalu-
lintas-di-indonesia-tertinggi-se-asia/240063/2016/05/29. Diakses pada tanggal 13
Mei 2019.
Suma'mur. (2009). Higiene Perusahaan Dan Kesehatan Kerja. CV. Sagung Seto.
Yogyakarta.
Undang-Undang Republik Indonesia No 22 tahun 2009. Tentang Lalu Lintas dan
Angkutan Jalan.
Witten, I. H. dan Frank, E. (2005). Data Mining : Pratical Machine Learning Tools and
Techniques Second Edition. Morgan Kauffman. San Francisco.
Recommended