13
Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 KLASIFIKASI SINYAL EEG MENGGUNAKAN KOEFISIEN AUTOREGRESIF, FSCORE, DAN LEAST SQUARES SUPPORT VECTOR MACHINE Moch. Anang Karyawan 1 , Agus Zainal Arifin 2 dan Ahmad Saikhu 3 1, 2, 3 Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, 60111 Email : [email protected] ABSTRAK Elektroensefalografi (EEG) banyak digunakan untuk penelitian fungsi otak dan gangguan neurologis. Analisis secara visual tidak mungkin dilakukan secara rutin, sehingga sistem komputer telah diusulkan. Analisis sinyal EEG yang telah dikembangkan adalah menggunakan koefisien Autoregresif (AR) dan LeastSquare Support Vector Machine (LSSVM). Tiga masalah pada SVM yaitu; bagaimana memilih fungsi kernel, berapa jumlah fitur input yang optimal, dan bagaimana menentukan parameter kernel terbaik. Jumlah fitur dan nilai parameter kernel saling mempengaruhi, sehingga seleksi fitur diperlukan dalam membangun sistem klasifikasi. Pada penelitian ini diajukan metode klasifikasi sinyal EEG menggunakan koefisien AR, FScore, dan LSSVM. Koefisien AR diperoleh dari hasil proses ekstraksi fitur sinyal EEG menggunakan Burg AR. Fiturfitur hasil ekstraksi tersebut diseleksi dengan FScore. FScore diperoleh dengan menghitung nilai diskriminan fiturfitur dari dua kelas pada data training. Nilai FScore masingmasing fitur diurutkan secara descending dan hasilnya digunakan untuk membuat kombinasi fitur. Kombinasi fitur tersebut digunakan sebagai input LSSVM. Berdasarkan hasil uji coba, metode yang diusulkan tersebut mampu meningkatkan ratarata hasil akurasi klasifikasi sinyal EEG sebesar 0,07% dari 99,57% menjadi 99,64%. Kata kunci : Sinyal EEG, BurgAutoregresive, Least Square Support Vector Machine, Features Selection ABSTRACT Electroencephalogram (EEG) is widely used to study brain function and neurological disorders. Visual analysis may not be done routinely, so that the computer system has been proposed. The autoregressive (AR) coefficient and the LeastSquare Support Vector Machine (LSSVM) has been used to analyze EEG signal. Three problems in the SVM, namely: how to choose a kernel function, how the optimal number of input features, and how to determine the best kernel parameters. The number of features and the value of required kernel parameters influence each other, so that feature selection is needed in building a classification system. In this study we propose a method of classification of EEG signals using AR coefficients, FScore, and LSSVM. AR coefficients obtained from the EEG signal feature extraction process using the Burg AR. The extracted features are selected with FScore. FScore is obtained by calculating the discriminant value of the features in the two classes of training data. FScore values of each feature are sorted in descending order and the results is used to make the combination of features. The combination of these features are used as input to LSSVM. Based on the results experiment, the proposed method was able to increase the average results of the EEG signal classification accuracy rate of 0.07% from 99.57% to 99.64%. Keyword : EEG Signal, BurgAutoregresive, Least Square Support Vector Machine, Features Selection PENDAHULUAN Aktivitas pada otak manusia menunjukkan berbagai pola aktivasi baik dalam kondisi normal maupun abnormal. Kondisi normal mencakup kondisi fisik (seperti tidur, terjaga, dan bekerja) dan kondisi mental (seperti ketenangan, kebahagiaan, dan kemarahan). Kondisi abnormal terutama diamati pada gangguan neurologis dan ketidak

KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

  • Upload
    lecong

  • View
    222

  • Download
    0

Embed Size (px)

Citation preview

Page 1: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Jurnal TIF, Vol. 2 No. 1, Juli 2011 

1

KLASIFIKASI SINYAL EEG MENGGUNAKAN KOEFISIEN AUTOREGRESIF,  F‐SCORE, DAN LEAST SQUARES SUPPORT VECTOR MACHINE 

 Moch. Anang Karyawan1, Agus Zainal Arifin2 dan Ahmad Saikhu3 

1, 2, 3 Jurusan Teknik Informatika, Fakultas Teknologi Informasi,  Institut Teknologi Sepuluh Nopember, Surabaya, 60111 

Email : [email protected]  

 ABSTRAK 

 Elektroensefalografi (EEG) banyak digunakan untuk penelitian fungsi otak dan gangguan neurologis. 

Analisis  secara  visual  tidak mungkin  dilakukan  secara  rutin,  sehingga  sistem  komputer  telah  diusulkan. Analisis sinyal EEG yang telah dikembangkan adalah menggunakan koefisien Autoregresif (AR) dan Least‐Square  Support Vector Machine  (LS‐SVM). Tiga masalah  pada  SVM    yaitu;  bagaimana memilih  fungsi kernel, berapa jumlah fitur input yang optimal, dan bagaimana menentukan parameter kernel terbaik. Jumlah fitur dan nilai parameter kernel saling mempengaruhi, sehingga seleksi fitur diperlukan dalam membangun sistem klasifikasi. Pada penelitian ini diajukan metode klasifikasi sinyal EEG menggunakan koefisien AR, F‐Score, dan LS‐SVM. Koefisien AR diperoleh dari hasil proses ekstraksi fitur sinyal EEG menggunakan Burg AR. Fitur‐fitur hasil ekstraksi tersebut diseleksi dengan F‐Score. F‐Score diperoleh dengan menghitung nilai diskriminan fitur‐fitur dari dua kelas pada data training. Nilai F‐Score masing‐masing fitur diurutkan secara descending  dan  hasilnya  digunakan untuk membuat  kombinasi  fitur. Kombinasi  fitur  tersebut  digunakan sebagai  input LS‐SVM. Berdasarkan hasil uji coba, metode yang diusulkan  tersebut mampu meningkatkan rata‐rata hasil akurasi klasifikasi sinyal EEG sebesar 0,07% dari 99,57% menjadi 99,64%.  Kata  kunci  :  Sinyal  EEG,  Burg‐Autoregresive,  Least  Square  Support  Vector Machine,  Features Selection  

ABSTRACT  

  Electroencephalogram (EEG) is widely used to study brain function and neurological disorders. Visual analysis may not be done routinely, so that the computer system has been proposed. The autoregressive (AR) coefficient and  the Least‐Square Support Vector Machine  (LS‐SVM) has been used  to analyze EEG signal. Three  problems  in  the SVM, namely:  how  to  choose  a  kernel  function,  how  the  optimal number  of  input features, and how to determine the best kernel parameters. The number of features and the value of required kernel parameters influence each other, so that feature selection is needed in building a classification system. In this study we propose a method of classification of EEG signals using AR coefficients, F‐Score, and LS‐SVM. AR  coefficients  obtained  from  the EEG  signal  feature  extraction  process  using  the Burg AR. The extracted features are selected with F‐Score. F‐Score is obtained by calculating the discriminant value of the features in the two classes of training data. F‐Score values of each feature are sorted in descending order and the results is used to make the combination of features. The combination of these features are used as input to LS‐SVM. Based on the results experiment, the proposed method was able to increase the average results of the EEG signal classification accuracy rate of 0.07% from 99.57% to 99.64%.  Keyword  :  EEG  Signal,  Burg‐Autoregresive,  Least  Square  Support  Vector  Machine,  Features Selection 

 PENDAHULUAN 

 Aktivitas  pada  otak  manusia  menun‐

jukkan  berbagai  pola  aktivasi  baik  dalam kondisi  normal maupun  abnormal. Kondisi 

normal  mencakup  kondisi  fisik  (seperti tidur, terjaga, dan bekerja) dan kondisi men‐tal (seperti ketenangan, kebahagiaan, dan ke‐marahan).  Kondisi  abnormal  terutama  dia‐mati pada gangguan neurologis dan ketidak‐

Page 2: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM 

seimbangan  akibat  pengaruh  obat‐obatan, termasuk kejang pada epilepsi dan demensia [1]. Penelitian aktivitas otak memerlukan ci‐tra  fungsional  yang  dihasilkan  dari  pengu‐kuran  sinyal  otak  dengan  electroencephalo‐gram (EEG), Magneto‐Enchepalography (MEG), dan  functional  Magnetic  Resonance  Imaging (fMRI).  

Pengukuran  sinyal  otak  dengan  EEG adalah  salah  satu  teknik yang  relatif paling murah  dibandingkan  dengan  MEG  dan fMRI.  EEG  mempunyai  resolusi  temporal yang tinggi dan cepat merespon segala peru‐bahan  aktivitas  otak  dibandingkan  dengan MEG  dan  fMRI  [2],  sehingga  penelitian  si‐nyal EEG berkembang cepat. Perkembangan yang  cepat  ini  karena  EEG  bersifat  non‐invasif dan merupakan alat diagnostik yang praktis  untuk  penelitian  berbagai  kondisi otak, terutama kondisi abnormal pada kasus gangguan neurologis. Popularitas EEG kare‐na dua kelebihan utama: 1) biaya tenaga ahli khusus  dan  peralatan  yang  digunakan  ren‐dah,  dan  2)  kenyamanan  yang  dirasakan oleh pasien [1]. 

Sinyal  EEG  merupakan  sinyal  yang sangat kompleks dan menjadi sumber  infor‐masi utama untuk penelitian fungsi otak dan gangguan neurologis. Epilepsi adalah gang‐guan  neurologis  yang mempengaruhi  lebih dari 50  juta orang di seluruh dunia. Epilepsi dianggap  sebagai  gangguan  neurologis  ke‐dua yang paling umum  setelah  stroke. Epi‐lepsi  ditandai dengan  kelebihan  jumlah  lis‐trik yang keluar dari  sel‐sel otak, yang bisa menyebabkan kejang dan gerakan abnormal. Teknik  pencitraan  seperti MRI  dapat  digu‐nakan untuk mendiagnosis gangguan struk‐tural otak,  tapi EEG  telah menjadi prosedur rutin  untuk  memeriksa  fungsi  otak  pada epilepsi [3]. 

Sinyal EEG pada serangan epilepsi me‐miliki  pola  karakteristik  yang memungkin‐kan profesional kesehatan untuk membeda‐kannya  dari  kondisi  normal  (nonseizure). Tetapi, analisis  secara visual  tidak mungkin dilakukan  secara  rutin,  karena  sinyal  EEG yang dihasilkan dari sistem monitoring EEG sangat besar dan cukup memakan waktu [4]. Masalah  yang  lain  yang  muncul  adalah kurangnya perbedaan yang jelas pada sinyal EEG antara serangan epilepsi dan nonepilep‐si.  Beberapa  teknik  deteksi  otomatis  telah 

diuji coba untuk mempercepat dan mening‐katkan  akurasi  identifikasi  bentuk  gelom‐bang EEG  patologis  yang dihubungkan  de‐ngan serangan epilepsi, dan diusulkan untuk mendeteksi  lonjakan  dalam  EEG  untuk memprediksi kejadian epilepsi [3]. 

Pang dkk. 2003, membandingkan kiner‐ja classifier berbasis jaringan saraf tiruan (JST) dan menyimpulkan  bahwa  antara  JST  yang dilatih  dengan  fitur  yang  dipilih  menggu‐nakan algoritma seleksi fitur dan sinyal EEG asli dapat menghasilkan akurasi yang sama, dan  berkisar  dari  82,83%  sampai  dengan 86,61%.  Bigan,  1998,  menggunakan  teknik wavelet untuk mengekstraksi fitur dari sinyal EEG  untuk  mengembangkan  suatu  sistem analisis  otomatis  dan  identifikasi  serangan epilepsi. Karakteristik EEG  epilepsi menun‐jukkkan  jumlah  perubahan  frekuensi  yang lebih banyak dari EEG nonepilepsi. Jaringan saraf dengan multilayer perceptron digunakan untuk proses analisisnya [3]. 

Nigam  dan  Graupe,  2004  mengguna‐kan  multistage  nonlinear  preprocessing  filter yang  digabungkan  dengan  artificial  neural network  (ANN) untuk deteksi otomatis sera‐ngan  epilepsi pada  sinyal EEG. Güler dkk., 2005 menggunakan  recurrent neural networks (RNNs)  dan  ekstraksi  fitur  Lyapunov  yang di‐training dengan algoritma Levenberg–Mar‐quardt. Übeyli, 2006 menggunakan multilayer perceptron  neural  network  (MLPNN). Übeyli, 2010 menggunakan Least‐Square Support Vec‐tor Machine  (LS‐SVM)  dan  koefisien Autore‐gressive  (AR).  Data  sinyal  EEG  yang  digu‐nakan adalah data sinyal EEG set A dan set E  [4].  Sinyal  EEG  set A  adalah  sinyal  EEG yang  direkam  dari  sukarelawan  sehat  de‐ngan mata terbuka. Sinyal EEG set E adalah sinyal  EEG  yang  direkam  dari  penderita epilepsi saat terjadi serangan [5] ( http://epi‐leptologie‐bonn.de/cms/front_content.php?i dcat=193&lang=3&changelang=3). Proses ek‐straksi  fitur menggunakan  analisis  spektral Burg  Autoregressive  (Burg AR).  Sebelas  dari dua belas fitur hasil ekstraksi digunakan se‐bagai  fitur  input  LS‐SVM.  Tingkat  akurasi yang dihasilkan adalah 99,56% [4]. 

Seleksi fitur adalah salah teknik terpen‐ting dan sering digunakan dalam pre‐proces‐sing  aplikasi  machine  learning.  Seleksi  fitur adalah  proses memilih  subset  dari  fitur  asli sehingga jumlah fitur berkurang secara opti‐

Page 3: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Jurnal TIF, Vol. 2 No. 1, Juli 2011 

3

mal sesuai dengan kriteria yang ditentukan. Teknik ini terbukti efektif  mengurangi fitur‐fitur yang tidak relevan dan  berlebihan, me‐ningkatkan  efisiensi  dalam  proses  learning, dan  meningkatkan  kinerja  learning  seperti akurasi prediksi. Data dimensi  tinggi dapat berisi banyak sekali informasi yang tidak re‐levan dan  berlebihan  yang  sangat mungkin menurunkan kinerja dari algoritma  learning. Oleh karena  itu, seleksi fitur menjadi sangat diperlukan oleh aplikasi machine learning ke‐tika menghadapi data dengan dimensi yang tinggi [6]. 

Chen & Lin, 2005 mengusulkan metode kombinasi seleksi  fitur dengan SVM  [7]. Sa‐lah satu metode seleksi fitur yang diusulkan adalah F‐Score. F‐Score adalah sebuah  teknik sederhana  untuk  menghitung  diskriminan dari dua himpunan bilangan real [7]. Kombi‐nasi metode SVM dan F‐Score digunakan un‐tuk mendiagnosis penyakit kanker payudara dan menghasilkan tingkat akurasi yang lebih baik dari LS‐SVM  [8]. Polat dan Gunes me‐ngusulkan seleksi fitur yang disebut kernel F‐Score feature selection (KFFS). KFFS terdiri da‐ri dua  tahap,  pertama  fitur  input ditransfor‐masikan ke ruang kernel dengan fungsi ker‐nel, kedua nilai F‐Score dalam ruang dimensi tinggi dihitung menggunakan rumus F‐score sehingga  mean  F‐score  dihasilkan.  Hanya fitur dengan F‐score  lebih besar dari mean F‐score yang dipilih [9]. 

Jumlah fitur yang optimal adalah salah satu  dari  tiga  masalah  yang  muncul  pada SVM. Tiga masalah pada SVM termasuk juga LS‐SVM  adalah:  bagaimana memilih  fungsi kernel, dan menentukan berapa  jumlah fitur input yang optimal, dan bagaimana menen‐tukan  parameter  kernel  terbaik.  Masalah‐masalah tersebut penting karena jumlah fitur dan nilai parameter kernel yang diperlukan saling mempengaruhi. Dengan demikian, se‐leksi fitur diperlukan dalam membangun sis‐tem klasifikasi, karena dengan pembatasan/ pengurangan  jumlah  fitur  input dalam  clas‐sifier  maka  akan  mengurangi  kompleksitas komputasi [8].  

Pada  penelitian  ini  diajukan  metode kombinasi  seleksi  fitur  dengan  F‐Score, analisis spektral Burg AR,   dan LS‐SVM un‐tuk mengklasifikasikan sinyal EEG set A dan set  E.  Metode  kombinasi  seleksi  fitur menggunakan  F‐Score. Penambahan metode 

kombinasi  seleksi  fitur  tersebut  diharapkan mampu  meningkatkan  hasil  akurasi  dan mendapatkan  kombinasi  fitur  dengan  aku‐rasi  terbaik  di  antara  kombinasi  fitur  yang ada.  

 TINJAUAN PUSTAKA 

 Sinyal EEG 

Elektroensefalografi  (EEG)  adalah metode  yang  digunakan  dalam  mengukur aktivitas listrik spontan dari otak yang dipe‐roleh dengan menembakkan sinyal listrik ke neuron  dalam  otak  [10].  Proses  perekamam sinyal EEG dilakukan dalam waktu singkat, biasanya selama 20‐40 menit. Rekaman dipe‐roleh dengan menempatkan  elektroda pada berbagai posisi pada kulit kepala [11]. 

Terdapat  dua  pendekatan  untuk men‐dapatkan  sinyal  EEG  yaitu  pendekatan invasif dan non invasif [10]. Pendekatn non‐invasif  dapat  diterapkan  berulang‐ulang untuk  pasien,  orang  dewasa  normal,  dan anak‐anak  dengan  hampir  tidak  ada  risiko atau  pembatasan  [11],  sehingga  hampir semua  rekaman  EEG  dewasa  ini  dilakukan secara non‐invasif [10].  Data Sinyal EEG  

Data sinyal EEG digital dapat diperoleh dari  database  yang  tersedia  di  Universitas Bonn yang  tersedia secara online dan dibuat oleh Dr. Ralph Andrzejak dari Pusat Epilepsi di Universitas Bonn,  Jerman  (http://epilepto logie‐bonn.de/cms/front_content.php?idcat= 193&lang=3&changelang=3).  Selain  itu  data sinyal EEG dalam bentuk digital dapat dipe‐roleh di http://sccn.ucsd.edu/~arno/fam2data /publicly_available_EEG_data.html [5].  

Data sinyal EEG dari  Universitas Bonn terdiri atas lima kelas dataset yaitu A, B, C, D, dan  E.  Tiap  dataset  berisi  100  segmen  EEG saluran  tunggal  dengan  durasi  selama  23.6 detik.  Setiap  segmen  dipilih  dan  dipotong dari rekaman EEG multichannel secara konti‐nyu  setelah  inspeksi  artefak  secara  visual, misalnya gerakan mata atau aktivitas otot.  

Set A dan B adalah sinyal yang diambil dari rekaman EEG yang dilakukan pada lima sukarelawan sehat dengan skema penempat‐an elektroda standar  (International 10‐20  sys‐tem).  Relawan  dalam  kondisi  santai  dan terjaga  dengan mata  terbuka  (untuk  set A) 

Page 4: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM 

dan  mata  tertutup  (untuk  set  B).  Set  C‐E berasal dari arsip EEG diagnosis presurgical. EEG  dari  lima  pasien  dipilih,  dan  semua telah mencapai kontrol kejang yang lengkap, setelah reseksi dari salah satu formasi hippo‐campal,  sehingga didiagnosis dengan benar masuk  zona  epileptogenic.  Sinyal  set D dire‐kam saat zona epileptogenic, dan berada pada interval  tanpa kejang dan set C berasal dari pembentukan  hippocampus  pada  belahan yang berlawanan dari otak. Sementara set C dan  D  berisi  aktivitas  yang  hanya  diukur selama  interval  tanpa kejang, sedangkan set E  hanya  berisi  aktivitas  kejang. Data  set A dan  set  E  tersebut  yang  digunakan  dalam penelitian ini. 

Sesuai  dengan  referensi  yang  ada, semua  sinyal  EEG  direkam  dengan  sistem amplifier dengan kanal 128. Digitalisasi data dengan  frekuensi  173,61  sampel  per  detik menggunakan A/D converter 12 bit. Band pass filter diatur pada 0,53 40 Hz (12 dB / oct) [5]. Masing‐masing  data  sinyal  EEG  digital tersebut  terdiri  atas  4097  data  diskrit.  Plot potongan  sinyal EEG  set A dan  set E  yang digunakan  dalam  penelitian  ini dalam  ben‐tuk gelombang ditunjukkan Gambar 1.   Model Autoregresif 

Model  autoregresif  adalah  salah  satu dari kelompok  formula prediksi  linier yang mencoba  untuk  memprediksi  output  dari suatu  sistem  berdasarkan  input  dan  output sebelumnya. Model yang hanya bergantung pada  output  sistem  sebelumnya  disebut model  autoregressive  (AR),  sementara model yang  hanya  bergantung  pada  masukan sistem  disebut model moving  average  (MA), dan model yang bergantung pada input dan output  disebut model  autoregressive‐moving‐average  (ARMA).  Sesuai dengan  arti  autore‐gresif, model  ini melakukan  proses  regresi pada  dirinya  sendiri.  Model  autoregresif orde p  (AR (p)), didefinisikan dengan persa‐maan: Y(t) = β0 + β1Y(t‐1) +... + βPY(t‐p) + et,  (1)  di mana: Y   = variabel dependen Yt‐1, Yt‐p  = kelambanan (lag) dari Y еt   = residual (kesalahan pengganggu) p  = orde (tingkat) AR 

0 50 100 150 200 250 300-100

-80

-60

-40

-20

0

20

40

60

80

100

Samples

μ V

Plot of EEG Signal (Set-A)

(a) 

0 50 100 150 200 250 300-2000

-1500

-1000

-500

0

500

1000

Samples

μ V

Plot of EEG Signal (Set-E)

 (b) 

Gambar 1. Bentuk Gelombang Potongan Sinyal EEG dengan Panjang 256 untuk Set A (a) dan  

Set E (b)  

Terdapat tiga metode estimasi parame‐ter/koefisien  autoregresif  dari  sampel  data yaitu  pendekatan  least  squares  (LS),  Yule‐Walker  (YW) dan Burg  (Burg). Metode Burg adalah pendekatan estimasi parameter yang saat  ini dianggap sebagai yang paling  tepat. Berbeda  dengan  metode  least  squares  dan Yule‐Walker, yang memperkirakan parameter autoregresif  langsung, metode Burg  terlebih dahulu  memperkirakan  koefisien  refleksi, yang didefinisikan sebagai estimasi parame‐ter  autoregresif  terakhir  untuk masing‐ma‐sing  model  orde  p.  Dengan  demikian, estimasi  parameter  ditentukan  mengguna‐kan  algoritma  Levinson‐Durbin.  Koefisien refleksi  merupakan  estimasi  bias  dari koefisien korelasi parsial [12]. 

 Metode Burg Autoregresif 

Metode  Burg  adalah  dikembangkan dari estimasi  spektrum yangdikenal  sebagai maximum  entropy  method  (metode  entropi maksimum). Bagian dari metode  ini  adalah 

Page 5: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Jurnal TIF, Vol. 2 No. 1, Juli 2011 

5

koefisien  refleksi  dihitung  secara  berurutan dengan  meminimalkan  mean‐squares  error (MSE) prediksi maju dan mun‐dur [13]. 

 F‐Score 

F‐score  adalah  teknik  sederhana  yang mengukur diskriminan dua  himpunan  bila‐ngan real. Pada vektor training xk, dengan k = 1,  2,  .  .  .  , m,  jika  jumlah  kasus  positif  dan negatif  adalah  n+  dan  n‐, maka  F‐score ma‐sing‐masing fitur i didefinisikan sebagai : 

∑∑−+

=

−−

+=

++

+

−+

−−

+−−

−+−=

n

kiik

n

kiik

iiiii

xxn

xxn

xxxxF

1

2)()(,

1

2)()(,

2)(2)(

)(1

1)(1

1)()(

,  (2)  di mana xi, xi(+), xi(‐) adalah rata‐rata dari fitur ke‐i keseluruhan, dataset positif, dan negatif, xk,i(+) adalah  fitur ke‐i dari kasus positif ke‐k, dan xk,i(‐) adalah  fitur ke‐i dari kasus negatif ke‐k.  Pembilang menunjukkan  diskriminasi antara  himpunan  positif  dan  negatif,  dan penyebut  menunjukkan  fitur‐fitur  dalam dua  himpunan.  Semakin  besar  F‐score,  ke‐mungkinan fitur lebih diskriminatif semakin besar pula [7].  Support Vector Machines (SVM) 

SVM yang diusulkan oleh Vapnik  [14] telah dipelajari secara ekstensif untuk klasifi‐kasi,  regresi  dan  estimasi  kepadatan. Gam‐bar 2 adalah arsitektur SVM. SVM memeta‐kan pola  input ke  ruang  fitur dimensi yang lebih  tinggi  melalui  pemetaan  nonlinier berdasar  teori yang dipilih. Bidang pemisah linier  ini  kemudian  dibangun  dalam  ruang fitur dimensi tinggi. Dengan demikian, SVM adalah  linear  classifier  di  ruang  parameter, tapi  itu  menjadi  nonlinear  classifier  sebagai akibat  dari  pemetaan  nonlinear  dari  ruang pola input ke ruang fitur dimensi tinggi. Bila data pelatihan berdimensi m adalah xi (i = 1, ...,  M)  dan  masing‐masing  kelas  labelnya adalah  yi, di mana  yi  =  1 dan  yi  =  ‐1  untuk kelas 1 dan 2. Jika data input terpisah secara linier di ruang fitur, maka fungsi keputusan dapat ditentukan: D(x) = wtg(x) + b,  (3)  di mana  g(x)  adalah  fungsi  pemetaan  yang memetakan x  ke  dalam ruang  dimensi 1,  w  adalah  vektor  dimensi  dan  1,  dan b adalah

Gambar 2. Arsitektur SVM 

skalar. Untuk memisahkan data secara linier, fungsi keputusan memenuhi kondisi berikut: yi(wtg(xi) + b) > 1 untuk i = 1, ..., M.  (4)  

Jika  masalah  terpisah  secara  linier dalam  ruang  fitur, maka  fungsi  keputusan yang  memenuhi  persamaan  (4)  jumlahnya tak terbatas. Di antara fungsi‐fungsi tersebut, diperlukan hyperplane dengan margin  terbe‐sar antara dua kelas. Margin adalah jarak mi‐nimum  yang memisahkan  hyperplane  terha‐dap  data  input  dan  ini  dihasilkan  dari |D(x)|/||w||.  Sehingga  didapatkan  hyper‐plane  pemisah  dengan  margin  maksimal yang optimal memisahkan hyperplane. 

Dengan  asumsi  bahwa margin  adalah ρ, kondisi berikut harus memenuhi: 

ρ≥||||

)(w

xDy ii  untuk i = 1, ..., M.  (5) 

 Hasil  perkalian  produk  dari  ρ  dan  ||w|| adalah tetap: ρ ||w|| =1.  (6)  Untuk  mendapatkan  hyperplane  pemisah yang  optimal  dengan  margin  maksimal,  w dengan  ||w||  yang  memenuhi  persamaan (5) harus ditemukan. Persamaan  (6) menga‐rahkan  ke  pemecahan  masalah  optimasi berikutnya. Dengan meminimalkan 

wwt

21 ,  (7) 

 dan mengikuti batasan: yi(wtg(xi) + b) > 1 untuk i = 1, ..., M.  (8)  Bila  data  pelatihan  tidak  linier  dipisahkan, digunakan slack variable ξi ke persamaan (8): yi(wtg(xi) + b) > 1‐ ξi, ξi > 0, untuk i = 1, ..., M.  (9) Hyperplane  pemisah  yang  optimal  telah ditentukan  sehingga  maksimalisasi  dari 

Page 6: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM 

margin  dan meminimalisasi  dari  kesalahan training didapatkan. Dengan meminimalkan 

∑=

+n

ii

t Cww122

1 ρξ ,  (10) 

 mengikuti batasan: yi(wtg(xi) + b) > 1‐ ξi, ξi > 0 untuk i = 1,  ..., M,  (11) di mana  C  adalah  parameter  yang menen‐tukan tradeoff antara margin maksimum dan kesalahan klasifikasi minimum, dan ρ adalah 1  atau  2.  Jika  ρ  =  1,  SVM  disebut  SVM dengan soft margin L1 (L1‐SVM), dan jika ρ = 2,  SVM  dengan  soft  margin  L2  (L2‐SVM). Pada SVM konvensional, hyperplane pemisah yang  optimal  diperoleh  dengan  memecah‐kan masalah pemrograman kuadratik.  

Fungsi  kernel  memungkinkan  operasi yang  akan dilakukan di  ruang  input bukan di  ruang  fitur  dimensi  tinggi.  Beberapa contoh  fungsi  kernel  adalah  K(u,  v)  =  vTu (SVM  linier);  K(u,  v)  =  (vTu  +  1)n  (SVM polinomial  derajat  n);  K(u,  v)  =  exp(‐||u  ‐ v||2  /  2σ2)  (SVM  fungsi  radial  bases  –  SVM RBF);  K(u,  v)  =  tanh(KvTy  +  ο)  (neural  SVM dua  layer) di mana  σ,  ĸ,  ο adalah konstanta [14,  15].  Namun,  fungsi  kernel  yang  tepat untuk  suatu  masalah  tertentu  tergantung pada  data,  dan  sampai  saat  ini  belum  ada metode yang dianggap  terbaik  tentang  cara memilih fungsi kernel.  

 Least Squares Support Vectors Machine (LS‐SVM) 

Least  Squares  Support  Vectors  Machine (LS‐SVM)  adalah  salah  satu modifikasi dari SVM [16]. Jika SVM dikarakteristik oleh per‐masalahan  konveks  quadratic  programming dengan  pembatas  berupa  pertidaksamaan, LS‐SVM  sebaliknya,  diformulasikan  meng‐gunakan pembatas yang hanya berupa per‐samaan. Sehingga solusi LS‐SVM dihasilkan dengan menyelesaikan persamaan linier. Hal ini  tentulah berbeda dengan SVM yang ma‐na solusinya dihasilkan melalui penyelesaian quadratic  programming.  Saat  ini, LS‐SVM  ba‐nyak dilakukan pada klasifikasi dan estimasi fungsi [16]. 

LS‐SVM  di‐training  dengan  memini‐malkan 

∑=

+n

ii

t Cww1

2

221 ξ ,  (12) 

dan mengikuti batasan persamaan: 

yi(wtg(xi) + b) > 1‐ ξi, ξi > 0 untuk i = 1,  ..., M.  (13) 

 Pada  LS‐SVM,  batasan  persamaan  di‐

gunakan  sebagai pengganti pertidaksamaan yang  digunakan  pada  SVM  konvensional. Karena  itu,  solusi yang optimal dapat dipe‐roleh  dengan  menyelesaikan  sekumpulan persamaan  linier  bukan dengan  penyelesai‐an  quadratic  programming.  Untuk menurun‐kan  dua  masalah  persamaan  (12)  dan  (13) digunakan Lagrange multiplier, yaitu : 

∑∑==

+−+−+

=n

iii

tii

n

ii

t bxgwyCww

bwQ

11

2 }1))(({22

1),,,(

ξαξ

ξα ,

  (14) di  mana  α  =  (α1,  ...,  αM)t  adalah  Lagrange multiplier  yang  bisa  bernilai positif  atau ne‐gatif  pada  rumus  LS‐SVM.  Kondisi  yang optimum diperoleh dengan mendifferensial‐kan persamaan di atas terhadap w, ξi, b, dan αi  dan  persamaan  dihasilkan  sama  dengan nol [16, 17]. 

Seperti pada SVM konvensional, fungsi kernel  memungkinkan  operasi  yang  akan dilakukan  di  ruang  input  bukan  di  ruang fitur  dimensi  tinggi.  Beberapa  penelitian menggunakan  LS‐SVM  dan  fungsi  kernel RBF  (LS‐SVM RBF)  secara  empiris mengha‐silkan hasil yang optimal [4, 9, 16, 18]. Untuk masalah  klasifikasi  dua‐spiral  yang  kom‐pleks dapat ditemukan dengan LS‐SVM RBF dengan kinerja yang sangat baik dan kompu‐tasi rendah [16]. 

 METODE PENELITIAN 

 Tahapan  dalam metodologi  penelitian 

terdiri  atas  tiga,  yaitu  ekstraksi  fitur  data sinyal EEG, seleksi fitur dengan F‐Score, dan klasifikasi kombinasi fitur dengan LS‐SVM.  Ekstraksi Fitur Data Sinyal EEG 

Ekstraksi  fitur adalah  salah  satu  tahap yang penting pada  sistem pengenalan pola. Ekstraksi  fitur  tidak  dilakukan  pada  data sinyal EEG secara langsung, tetapi dilakukan melalui  dua  tahap.  Tahap  pertama  adalah memecah data menjadi  segmen‐segmen de‐ngan ukuran 256 data dari dua dataset sinyal EEG  set  A  dan  set  E  yang masing‐masing terdiri  atas  100  buah  segmen.  Tiap  segmen berisi 4097 buah data diskrit yang kemudian 

Page 7: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Jurnal TIF, Vol. 2 No. 1, Juli 2011 

7

dilakukan  windowing  (pemotongan)  dengan panjang  256,  seperti  yang  dilakukan  oleh Übeyli  [4],  didapatkan  segmen  data  yang lebih kecil  sebanyak 4097/256 =   16  segmen. Jumlah  segmen  data  keseluruhan  yang diperoleh dari pemotongan sinyal EEG set A dan  E  adalah  2  x  100  x  16  =  3200  segmen data. 

Tahap kedua adalah melakukan proses ekstraksi  fitur  pada  potongan  segmen  data tersebut  menggunakan  Burg  AR  orde  10. Proses ekstraksi  fitur dengan Burg AR orde 10  menghasilkan  11  koefisien  AR,  dan  1 residual  (noise).  Dua  belas  koefisien  AR tersebut  selanjutnya  disebut  sebagai  fitur hasil  ekstraksi. Koefisien AR  yang  pertama tidak  digunakan  karena  nilainya  selalu  1, sehingga  jumlah  fitur  yang  digunakan adalah 11. Jadi  jumlah data yang digunakan adalah 3200 yang terdiri atas 11 fitur.  

Data  hasil  ekstraksi  fitur  tersebut dibagi  secara  random  untuk  training  dan testing menggunakan metode  cross validation dengan prosorsi 50%   data  training dan 50%  data  testing. Pemilihan data  training dan  tes‐ting dilakukan baik untuk uji coba penentu‐an  parameter  LSV‐RBF  maupun  untuk  uji coba dengan kombinasi seleksi fitur.  

 Seleksi Fitur 

Seleksi  fitur  adalah  tahap  kedua  dari metode penelitian. Proses seleksi  fitur  inilah yang  membedakan  penelitian  ini  dengan penelitian  Übeyli  [4].  Proses  seleksi  fitur dilakukan  dengan menghitung  nilai  F‐Score dari  data  training.  Perhitungan  nilai  F‐Score dari  data  training  tersebut  berbeda  dengan metode  yang  kombinasi  seleksi  fitur  yang diusulkan oleh Chen & Lin [7]. Pada metode Chen & Lin, perhitungan  F‐Score dilakukan baik data  training maupun  testing,  sehingga kombinasi  seleksi  fitur yang dihasilkan dari beberapa  uji  coba  adalah  sama.  Sedangkan pada penelitian ini kemungkinan akan dida‐patkan kombinasi yang berbeda dari tiap uji coba yang dilakukan.  

Perhitungan nilai F‐Score menggunakan rumus  (2). Nilai  F‐Score  tersebut  diurutkan secara descending untuk membuat kombinasi fitur  yang  akan  digunakan  baik  untuk training  maupun  testing.  Kombinasi  fitur pertama  dibuat  dari  fitur  dengan  nilai  F‐Score terbesar. Kombinasi fitur kedua dibuat 

dari fitur dengan nilai F‐Score terbesar perta‐ma  dan  terbesar  kedua,  dan  seterusnya  se‐hingga didapatkan sebelas macam kombina‐si fitur. Sebagai contoh, misal hasil pengurut‐an  secara descending untuk F‐Score dari data training adalah Fitur 4 (F4), Fitur 1 (F1), Fitur 3  (F3), Fitur 7  (F7), Fitur 5  (F5), Fitur 10  (F10), Fitur 8 (F8), Fitur 2 (F2), Fitur 11 (F11), Fitur 6 (F6), dan Fitur 9  (F9). Urutan  tersebut dapat ditulis (F4, F1, F3, F7, F5, F10, F8, F2, F11, F6, F9). Berdasarkan hasil pengurutan tersebut dapat dibuat  11  kombinasi  fitur  yaitu  F4,  F4F1, F4F1F3, F4F1F3F7, ..., F4F1F3F7F5F10F8F2F11F6F9.  

Sebelas  macam  kombinasi  tersebut menjadi  input  pada  LS‐SVM  dengan  RBF kernel (LS‐SVM RBF). Kombinasi fitur model #1  digunakan  sebagai  input  pada  LS‐SVM RBF  baik  untuk  proses  training  mapun testing. Proses training mapun testing tersebut kemudian  diulang  lagi  untuk  kombinasi fitur model #2, #3, #4, dan seterusnya sampai dengan  model  #11.  Kombinasi  fitur  model #11, yaitu F4F1F3F7F5F10F8F2F11F6F9 merupakan kombinasi  input  LS‐SVM  pada  penelitian Übeyli  [4].  Jadi hasil proses klasifikasi pada model  kombinasi  #11 merupakan  represen‐tasi hasil klasifikasi untuk penelitian Übeyli.  

 Klasifikasi  Kombinasi  Fitur  dengan  LS‐SVM 

Tahap  ketiga  dari  metode  penelitian adalah melakukan klasifikasi kombinasi fitur dengan  LS‐SVM  RBF.  LS‐SVM  RBF  juga digunakan  pada  penelitian Übeyli  [4]. Data training  untuk  masing‐masing  kombinasi fitur yang dihasilkan di‐training dengan LS‐SVM RBF. Proses  training dilakukan dengan nilai parameter LS‐SVM RBF (γ dan σ2) yang ditentukan  secara  trial  and  error melalui  uji coba  penentuan  parameter  percobaan.  γ adalah  adalah  parameter  regulerisasi,  yang menentukan  trade‐off  antara  margin  maksi‐mum  dan  kesalahan  klasifikasi  minimum. Pada beberapa penelitian  lain nilai γ disebut sebagai C penalty [4, 8]. Sedangkan σ2 adalah bandwidth  untuk  fungsi  kernel  RBF. Penentuan nilai awal dan akhir parameter  γ dan σ2 secara trial and error dengan merujuk pada  nilai  yang  terdapat  pada  manual toolbox Matlab LS‐SVMlab1.5  [19,  20]. Nilai parameter γ dan σ2 yang dipilih untuk proses training  tiap  kombinasi  fitur  adalah  yang menghasilkan  akurasi  tertinggi  dan  waktu 

Page 8: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM 

komputasi terendah. Hasil training dari masing‐masing kom‐

binasi  fitur pada classifer LS‐SVM RBF digu‐nakan  untuk  menguji  kombinasi  fitur  data testing.  Hasil  prediksi  class  label  tersebut dibandingkan dengan class  label sebenarnya, sehingga  penelitian  ini  termasuk  supervised learning.  Pengujian  dilakukan  dengan  nilai parameter  γ dan σ2  yang  sama dengan  saat training.  Parameter Percobaan 

Nilai  parameter  γ  ditentukan  pada variasi  antara  1  sampai  dengan  10,  dengan interval  1. Nilai  σ2  ditentukan  pada  variasi antara  1,0  sampai  dengan  2,0  dengan interval  0,1.  Penentuan  parameter  ini menggunakan  seluruh  fitur  hasil  ekstraksi dengan pembagian data 50% untuk  training dan 50% untuk testing menggunakan metode cross  valudation.  Tingkat  akurasi  dan waktu komputasi  yang  dihasilkan  dari  gabungan nilai  γ  dan  σ2  tersebut  disimpan  dalam bentuk  tabel  (matriks).  Tingkat  akurasi adalah perbandingan  jumlah class  label yang benar  hasil  prediksi  dibandingkan  dengan jumlah  class  label  sesungguhnya. Sedangkan waktu  komputasi  adalah  waktu  yang diperlukan untuk proses training dan testing. Data  nilai  γ,  σ2,  tingkat  akurasi  dan waktu komputasi  tersebut  kemudian  diurutkan secara  descending  berdasarkan  tingkat akurasi,  dan  ascending  berdasarkan  waktu komputasi.  Gabungan  nilai  γ  dan  σ2  yang menghasilkan  tingkat  akurasi  tertinggi  dan membutuhkan  waktu  komputasi  terendah akan digunakan dalam uji coba. 

 Uji Coba 

Uji  coba  klasifikasi  dari  kombinasi seleksi  fitur  dilakukan  sebanyak  sepuluh kali. Beberapa penelitian tidak menyebutkan secara  eksplisit  jumlah  uji  coba  yang dilakukan,  tetapi  hanya menampilkan  hasil terbaik dari uji coba yang telah dilakukan [4, 8]. Uji  coba dimulai dengan pemilihan data training  dan  testing  mengunakan  metode cross  validation  sebanyak  sepuluh  kali. Selanjutnya  adalah  seleksi  fitur  dengan  F‐Score dilakukan sebanyak sepuluh kali. Lalu dilakukan  proses  training  dan  testing  dari kombinasi  seleksi  fitur  F‐Score  dengan  LS‐SVM   RBF.   Data   yang   dihasilkan   selama 

Tabel 1.  Matriks Konfusi  

Prediksi Aktual 

Positif  Negatif 

Positif Negatif 

True Positive (TP) False Positive (TP) 

False Negative (FN) True Negative (TN) 

proses  uji  coba  adalah  tingkat  akurasi,  sensitivitas, spesifitas, waktu komputasi, dan kombinasi fitur. 

 Evaluasi 

Evaluasi  dilakukan  dengan  tujuan untuk mengevaluasi  efektivitas metode dan sistem  yang  telah dibuat.  Ukuran atau para‐ meter yang digunakan untuk evaluasi antara lain  akurasi  klasifikasi,  sensitivitas,  spesifi‐sitas,  nilai  prediksi  positif,  nilai  prediksi negatif,  kurva  ROC  dan  matriks  konfusi (confusion matrix). Matriks  konfusi  berisi  in‐formasi  tentang klasifikasi yang  sebenarnya dan  yang  diperkirakan  dari  hasil  sistem klasifikasi.  Tabel  1  adalah  matriks  konfusi untuk dua  kelas  klasifikasi. Akurasi  klasifi‐kasi,  sensitivitas,  spesifisitas,  nilai  prediksi positif dan nilai prediksi negatif dapat dide‐finisikan menggunakan  elemen‐elemen ma‐triks konfusi sebagai berikut: • Akurasi (%) = 

TNFNFPTPTNTP

++++ , 

• Sensitivitas (%) = FNTP

TP+

• Spesifisitas (%) = TNFP

TN+

• Nilai prediksi positif =  100×+ FPTPTP , 

• Nilai prediksi negatif =  100×+TNFN

TN . 

Kurva ROC  adalah  teknik  yang  dapat diandalkan  karena  didasarkan  pada  nilai‐nilai  true  positive  dan  false  positive  sehingga menunjukkan trade‐off antara sensitivitas dan spesifisitas [8]. 

 HASIL DAN PEMBAHASAN 

 Implementasi dilakukan menggunakan 

Matlab  7.4.0  (R2007a)  yang  dilengkapi toolbox LS‐SVMlab1.5 [19, 20].  Ekstraksi Fitur 

Proses  ekstraksi  fitur  dilakukan terhadap 3200 segmen data sinyal EEG set A 

Page 9: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Jurnal TIF, Vol. 2 No. 1, Juli 2011 

9

dan  set  E.  Proses  ekstraksi  fitur  pada masing‐masing  segmen  data menggunakan Burg AR orde 10. Contoh hasil ekstraksi fitur untuk  sinyal  EEG  set A  dapat  dilihat  pada Tabel 2 dan set E pada Tabel 3. Rekapitulasi statistik  koefisien  AR  dapat  dilihat  pada Tabel 4.   Seleksi Fitur 

Seleksi  fitur  dilakukan  dengan menghitung  nilai  F‐Score  dari  data  training. Contoh hasil perhitungan nilai F‐Score dapat dilihat  pada  Tabel  5.  Berdasarkan  tabel  F‐Score yang  sudah diurutkan  tersebut dibuat kombinasi fitur seperti terlihat pada Tabel 6.  

 Uji  Coba  Penentuan  Parameter  LS‐SVM RBF 

Data  hasil  uji  coba  penentuan parameter  LS‐SVM  berisi  data  akurasi  dan waktu  komputasi.  Data  tersebut  kemudian diurutkan  berdasarkan  tingkat  akurasi secara  descending  dan  waktu  komputasi secara  ascending.  Lima  besar  data  hasil  uji coba  yang  sudah  diurutkan  dapat  dilihat pada Tabel  7. Tingkat  akurasi  tertinggi dan waktu  komputasi  terendah  diperoleh dengan nilai γ = 3 dan nilai σ2 = 2. Nilai  γ dan σ2  tersebut  digunakan  dalam  uji  coba  klasifikasi dengan kombinasi seleksi fitur.  

 Uji  Coba  Klasifikasi  dengan  Kombinasi Seleksi Fitur 

Hasil  uji  coba  sebanyak  sepuluh  kali dengan γ = 3 dan σ2 = 2. Hasil sepuluh kali uji coba  tersebut  dapat  dilihat  pada  Tabel  8. Klasifikasi  sinyal  EEG  dengan  akurasi terbaik  sebesar  99,81%  didapatkan  untuk model kombinasi #8.  Evaluasi 

Evaluasi  terhadap  efektivitas  metode yang  dikembangkan  dilakukan melalui  pe‐ngukuran tingkat akurasi, waktu komputasi, dan  model  kombinasi  yang  dihasilkan. Evaluasi dilakukan dengan membandingkan hasil  uji  coba  dengan  penelitian‐penelitian sebelumnya.  Parameter  pengukuran  yang digunakan adalah akurasi klasifikasi, sensiti‐vitas,  spesifisitas,  nilai  prediksi  positif  dan  nilai  prediksi  negatif,  matriks  konfusi  dan kurva ROC. 

Tabel  2.  Hasil  Ekstraksi  Fitur  dengan  Burg  AR Orde 10 untuk Sinyal EEG Set A 

 Koefisien AR  Nilai 

a(0) a(1) a(2) a(3) a(4) a(5) a(6) a(7) a(8) a(9) a(10) E 

1,000 ‐1,805 1,020 0,031 ‐0,324 0,293 ‐0,209 ‐0,269 0,839 ‐0,731 0,215 47,751 

 Tabel  3.  Hasil  Ekstraksi  Fitur  dengan  Burg  AR Orde 10 untuk Sinyal EEG Set E 

 Koefisien AR  Nilai 

a(0) a(1) a(2) a(3) a(4) a(5) a(6) a(7) a(8) a(9) a(10) E 

1,000 ‐2,171 1,566 0,151 ‐0,724 ‐0,062 0,753 ‐0,572 0,078 0,047 0,010 

5319,029  Tabel 4. Rekapitulasi Statistik Hasil Ekstraksi Fitur dengan Burg AR Orde 10 untuk Sinyal EEG Set E  

Varians  Mean Koefisien AR  Set A  Set E  Set A  Set E 

a(0) a(1) a(2) a(3) a(4) a(5) a(6) a(7) a(8) a(9) a(10) E 

0,0000,049 0,131 0,049 0,022 0,043 0,036 0,026 0,133 0,090 0,013 

7.826,407

0,0000,0800,3780,2870,1490,1490,0850,1030,0910,0550,009

7.758.810,035

1,000‐1,694 0,795 0,271‐0,355 0,049 0,050‐0,217 0,409‐0,309 0,058

101,590

1,000  ‐2,285 1,716  0,129  ‐0,825 0,045  0,609  ‐0,334 ‐0,156 0,207  ‐0,048

1.884,096

Page 10: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM 

10 

Tabel 5. Nilai F‐Score untuk masing‐masing Fitur  

No. Fitur  F‐Score 1 2 3 4 5 6 7 8 9 10 11 

1,3705 0,8384 0,0345 0,6031 0,0005 1,3472 0,0524 0,7199 0,8994 0,2252 0,2092 

 Tabel 6. Kombinasi Fitur untuk F‐Score 

 

Model Jumlah Fitur 

F‐Score  Kombinasi Fitur 

#1 #2 #3 #4 #5 #6 #7 #8 #9 #10 #11 

1 2 3 4 5 6 7 8 9 10 11 

1.3705 1.3472 0.8994 0.8384 0.7199 0.6031 0.2252 0.2092 0.0524 0.0345 0.0005 

F1 F1F6 F1F6F9 F1F6F9F2 F1F6F9F2F8 F1F6F9F2F8F4 F1F6F9F2F8F4F10 F1F6F9F2F8F4F10F11 F1F6F9F2F8F4F10F11F7 F1F6F9F2F8F4F10F11F7F3 F1F6F9F2F8F4F10F11F7F3F5 

 Tabel 7. Lima Besar Data Hasil Uji Coba Penentu‐an Parameter LS‐SVM RBF  γ  σ  Akurasi (%)  Waktu (detik) 3  2,0  99,50  51,47 3  1,9  99,50  51,61 4  1,8  99,50  56,73 4  1,9  99,50  57,59 4  2,0  99,50  59,61 

  Tingkat Akurasi Klasifikasi 

Tabulasi data tingkat akurasi klasifikasi terhadap model kombinasi dari sepuluh kali uji  coba  untuk  F‐Score  dapat  dilihat  pada Tabel 8. Rata‐rata  tingkat akurasi klasifikasi terbaik  didapatkan  untuk  model  #8  yaitu 99,64%. Pada model #11  (tanpa seleksi  fitur) tingkat  akurasi  klasifikasi  rata‐rata  adalah 99,57%. Perbandingan tingkat akurasi  dalam bentuk grafik antara metode yang diusulkan dengan   metode  peneliti  sebelumnya  dapat  

Tingkat Akurasi Klasifikasi

99,00

99,10

99,20

99,30

99,40

99,50

99,60

99,70

99,80

99,90

1 2 3 4 5 6 7 8 9 10

Uji Coba

%

Übeyli#8 F-Score

 Gambar 3. Grafik Perbandingan Akurasi 

Klasifikasi antara Übeyli, #8 F‐Score 

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Receiver Operating Characteristic curve, area=0.99813, std = 0.0012492

1 - Specificity

Sen

sitiv

ity

Gambar 4. Kurva ROC untuk Hasil Klasifikasi 

Terbaik Model #8 F‐Score  

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Receiver Operating Characteristic curve, area=0.9975, std = 0.001442

1 - Specificity

Sen

sitiv

ity

Gambar 5. Kurva ROC untuk Hasil Klasifikasi 

Terbaik Model #11 (Übeyli)  

Grafik Perbandingan Waktu Komputasi

46,00

48,00

50,00

52,00

54,00

56,00

58,00

60,00

62,00

1 2 3 4 5 6 7 8 9 10

Uji Coba

Wak

tu K

ompu

tasi

(det

ik)

Übeyli

F-Score

 Gambar 6. Grafik Perbandingan Waktu Komptasi 

antara Übeyli, #8 F‐Score, dan #8 P‐Score  dilihat pada Gambar 3. Peningkatan akurasi juga  dihasilkan  pada  penelitian Akay,  2009 [8].  Matriks  konfusi  hasil  klasifikasi  sinyal  

Page 11: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Jurnal TIF, Vol. 2 No. 1, Juli 2011 

11

Tabel 9.  Matriks Konfusi untuk Hasil Klasifikasi Terbaik Model #8 F‐Score  

Prediksi Aktual 

Set A  Set E 

Set A Set E 

799 2 

1 798 

 Tabel 10.  Matriks Konfusi untuk Hasil Klasifikasi Terbaik Model #11 (Übeyli)  

Prediksi Aktual 

Set A  Set E 

Set A Set E 

799 3 

1 797 

Tabel 11. Model Kombinasi #8 pada F‐Score 

No.  Model  Akurasi (%)  Kombinasi 

1 #8  99,63  F6F1F9F2F4F8F10F11 2 #8  99,69  F1F6F9F2F8F4F10F11 3 #8  99,50  F1F6F9F2F8F4F10F11 4 #8  99,56  F1F6F9F2F8F4F10F11 5 #8  99,81  F6F1F9F2F8F4F10F11 6 #8  99,44  F1F6F2F9F8F4F10F11 7 #8  99,75  F1F6F9F2F4F8F10F11 8 #8  99,63  F1F6F9F2F8F4F10F11 9 #8  99,69  F6F1F9F2F8F4F10F11 10 #8  99,69  F1F6F9F2F8F4F10F11 

Rata‐rata  99,64 

 EEG  yang  terbaik  untuk model  #8  F‐Score dan #11  (Übeyli) dapat dilihat pada Tabel 9 dan  10,  dalam  bentuk  kurva  ROC  dapat dilihat pada Gambar 4 dan 5. 

 Waktu Komputasi 

Perbandingan  waktu  antara  metode yang diusulkan dengan metode Übeyli dapat dilihat  pada  Gambar  6.  Waktu  komputasi adalah waktu yang dibutuhkan untuk proses training  dan  testing.  Model  kombinasi  #8 membutuhkan  rata‐rata  waktu  komputasi lebih lama dibandingkan dengan model #11, karena  nilai  parameter  untuk  LS‐SVM  RBF yang  digunakan  adalah  nilai  parameter untuk sebelas fitur (model #11).. 

Penelitian  yang  dilakukan  oleh  Akay, 2009  menggunakan  F‐Score  untuk  kasus kanker payudara  tidak menunjukkan  secara eksplisit waktu komputasi yang diperlukan. Sedangkan salah satu alasan yang mendasari penelitian tersebut adalah membatasi jumlah fitur  yang  digunakan  dalam  classifier  dapat meningkatkan  akurasi  dan  mengurangi komputasi [8]. 

 Model Kombinasi 

Evaluasi model kombinasi ini bertujuan untuk  menguji  apakah  model  kombinasi dengan  tingkat  akurasi  tertinggi  tersebut merupakan  kombinasi  fitur  yang  tetap. Model  kombinasi  #8  dari  sepuluh  kali  uji coba  dapat  dilihat  pada  Tabel  11.  Model kombinasi  #8  selama  sepuluh  kali  uji  coba 

Tabel 8. Tabulasi Tingkat Akurasi Klasifikasi (%) terhadap Model Kombinasi pada F‐Score  

Model No 

#1  #2  #3  #4  #5  #6  #7  #8  #9  #10  #11 

1  89,31   97,06   97,94   98,63  98,50  99,38  99,06  99,63  99,50   99,69   99,50 

2  88,50   97,38   97,94   98,69  99,13  99,13  99,13  99,69  99,63   99,75   99,75 

3  89,06   97,56   97,94   98,50  99,00  99,00  99,13  99,50  99,50   99,50   99,50 

4  88,06   97,31   97,94   98,31  98,94  98,94  99,06  99,56  99,56   99,63   99,56 

5  89,38   98,19   98,44   99,00  99,31  99,56  99,31  99,81  99,69   99,63   99,75 

6  88,31   97,13   97,75   98,00  98,75  98,75  99,06  99,44  99,44   99,50   99,50 

7  88,56   97,56   98,06   98,63  98,81  99,13  99,13  99,75  99,56   99,63   99,69 

8  89,31   97,56   98,31   98,69  99,19  98,81  98,94  99,63  99,63   99,63   99,50 

9  88,63   97,75   98,06   98,75  99,06  99,31  99,25  99,69  99,25   99,38   99,31 

10  88,06   97,69   98,19   98,81  99,19  99,50  99,56  99,69  99,50   99,56   99,63 

Rata2  88,72   97,52   98,06   98,60  98,99  99,15  99,16  99,64  99,53   99,59   99,57 

Page 12: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM 

12 

adalah tetap yaitu F1F6F9F2F8F4F10F11.  

KESIMPULAN  

Penambahan metode kombinasi seleksi fitur F‐Score  terbukti mampu meningkatkan tingkat  akurasi  rata‐rata  klasifikasi  sinyal EEG  set A  dan  set  E.  Tingkat  akurasi  rata‐rata  yang  dihasilkan  oleh  F‐Score  adalah 99,64%.  Tingkat  akurasi  rata‐rata  klasifikasi tanpa kombinasi seleksi fitur adalah 99,57%. Pengurangan jumlah fitur pada LS‐SVM RBF tidak  secara  langsung  mengurangi  waktu komputasi  yang  diperlukan  untuk  proses klasifikasi sinyal EEG set A dan set E, karena parameter  classifier  yang  digunakan  adalah untuk sebelas fitur. Hasil uji coba menunjuk‐kan bahwa model kombinasi dengan tingkat akurasi klasifikasi terbaik adalah tetap. 

Penelitian  tentang pengaruh parameter γ dan σ2 terhadap tingkat akurasi dan wak‐tu  komputasi LS‐SVM RBF dapat diperluas dengan menambah  rentang  nilai  γ  dan  σ2  yang digunakan.   Optimasi parameter classi‐fier (LS‐SVM RBF) dengan  jumlah fitur yang berbeda‐beda dapat digunakan untuk meng‐uji  pengaruh  pengurangan  fitur  terhadap tingkat akurasi dan waktu komputasi. 

 DAFTAR PUSTAKA 

 [1]  Ghosh‐Dastidar,  S.  (2007).  Models  of 

EEG  data  mining  and  classification  in temporal  lobe  epilepsy:  wavelet‐chaos‐neural  network  methodology  and  spiking neural  networks. Dissertation, The Ohio State University. 

[2]  Ningrum, R.M., Purwananto, Y. & Soe‐laiman, R. (2010). Ekstraksi fitur EEG de‐ngan  menggunakan  faktorisasi  kernel matriks nonnegatif, Tugas Akhir, Teknik Informa‐tika,  Fakultas  Teknologi Informasi, ITS. 

[3]  Begg, R., Lai, D.T.H. & Palaniswami, M. (2008).  Computational  intelligence  in biomedical  engineering.  First  Edition. CRC Press.  

[4]  Übeylï,  E.  D.  (2010a).  Least  squares support vector machines employing model‐based me‐thods  coefficients  for  analysis  of 

EEG  signals,  Expert  Systems  with Applications 37, (2010), 233–239. 

[5]  Andrzejak,  R.  G.,  Lehnertz,  K., Mormann,  F.,  Rieke,  C.,  David,  P.,  & Elger, C.  E.  (2001).  Indications  of  nonli‐near  deterministic  and  finite‐dimensional structures  in  time  series of brain  electrical activity:  Dependence  on  recording  region and  brain  state.  Physical  Review  E,  64, 061907. 

[6]  Yu, L. & Liu, H. (2003). Feature selection for  high‐dimensional  data:  a  fast  correlati‐on‐based  filter  solution.  Proceedings  of the Twentieth International Conference on  Machine  Learning  (ICML‐2003), Washington DC. 

[7]  Chen, Y. W., & Lin, C. J. (2005). Combi‐ning  SVMs with  various  feature  selection strategies.  Available  from  http://www. csie.ntu.edu.tw/~cjlin/papers/features.pdf. 

[8]  Akay, M.F. (2009). Support vector machi‐nes  combined  with  feature  selection  for breast  cancer  diagnosis.  Expert  Systems with Applications 36, 3240–3247. 

[9]  Polat,  K.,  &  Günes,  S  (2009).  A  new feature selection method on classification of medical  datasets:  Kernel  F‐score  feature selection. Expert Systems with Applica‐tions, 36, 10367–10373. 

[10]  Talwar, D.  (2004). Primer of EEG with a Mini‐Atlas 31, 378. 

[11]  Teplan, M.  (2002), Fundamentals of EEG measurements, Measmt. Sci. Rev., Vol. 2. 

[12]  De  Hoon,  M.J.L.,  Van  Der  Hagen, T.H.J.J.,  Schoonewelle,  H.,  and  Van Dam, H. Why Yule‐Walker  should not be used  for autoregressive modelling,  Interfa‐culty Reactor Institute, Delft University of  Technology,  Delft,  Netherlands, Unpublished. 

[13]  Kamel, N. & Baharudin, Z. (2007). Short term  load  forecast  using  Burg  autoregre‐ssive technique, International Conference on  Intelligent  and  Advanced  Systems 2007, 912‐916. 

[14]  Vapnik,  V.  (1995).  The  nature  of statistical  learning  theory.  New  York: 

Page 13: KLASIFIKASI SINYAL EEG MENGGUNAKAN … · Jurnal TIF, Vol. 2 No. 1, Juli 2011 1 ... ngan serangan epilepsi, dan diusulkan untuk

Jurnal TIF, Vol. 2 No. 1, Juli 2011 

13

Springer‐Verlag. 

[15]  Cortes, C., & Vapnik, V  (1995). Support vector  networks.  Machine  Learning, 20(3), 273–297.  

[16]  Suykens,  J.  A.  K.,  &  Vandewalle,  J (1999).  Least  squares  support  vector machine  classifiers.  Neural  Processing Letters, 9 (3), 293–300. 

[17]  Tsujinishi, D., & Abe,  S.  (2003).  Fuzzy least  squares  support  vector machines  for multiclass  problems.  Neural  Networks, 16, 785–792. 

[18]  Übeylï,  E.  D.,  Cvetkovic,  D., Holland, G.,  Cosic,  I.  (2010b).  Analysis  of  sleep EEG activity during hypopnoea episodes by least  squares  support  vector machine  em‐ploying  AR  coefficients,  Expert  Systems with Applications 37, 4463–4467. 

[19]  Pelckmans  K.,  Suykens  J.A.K.,  Van Gestel  T.,  De  Brabanter  J.,  Lukas  L., Hamers B., De Moor B. & Vandewalle J. (2002). LS‐SVMlab: a Matlab/C toolbox for Least  Squares  Support  Vector  Machines. Internal  Report  02‐44,  ESAT‐SISTA, K.U.Leuven  (Leuven,  Belgium),  (pre‐sented  at  NIPS2002  Vancouver  in  the demo track). 

[20]  Pelckmans,  K.,  Suykens,  J.A.K.,  Van Gestel,  T., De  Brabanter,  J.,  Lukas,  L., Hamers B., De Moor, B. & Vandewalle, J.  (2003).  LS‐SVMlab  Toolbox  User’s Guide  version  1.5.  Katholieke  Univer‐siteit  Leuven Department  of  Electrical Engineering,  ESAT‐SCD‐SISTA  Kas‐teelpark  Arenberg  10,  B‐3001  Leuven‐Heverlee, http://www.esat.kuleuven.ac. be/sista/lssvmlab/,  ESAT‐SCD‐SISTA Technical Report 02‐145.