Upload
fauns
View
2
Download
0
Embed Size (px)
Citation preview
Terdapat banyak jenis pola:◦ Pola visual◦ Pola temporal◦ Pola logikal
Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola
Terdapat model standar yang dapat dijadikan teori acuan◦Statistik atau Fuzzy◦Syntatic atau Struktur◦Berbasis pengetahuan
2
Model Pengenalan Pola
Statistical Patter
n Recognition
Problem pengenalan pola didefinisikan sebagai problem klasifikasi
Daftar kata kunci :◦ Klasifikasi◦ Fitur◦ Vektor fitur◦ Model klasifikasi standar
3
Pengenalan Pola Klasifikasi
Diperlukan suatu sistem untuk melakukan pengenalan◦Sistem mengenali data kemudian mengklasifikasi data tersebut berdasarkan pola tertentu ke suatu klas
Contoh aplikasi yang melakukan …◦Pengenalan suara◦Identifikasi sidik jari◦Pengenal karakter secara optik (OCR)◦Identifikasi urutan DNA
4
Aplikasi Pengenalan Pola
Terdapat data dengan pola visual Data merepresentasikan karakter 26 huruf alfabet
Definisi problem:◦ Pengenalan pola data yang diklasifikasikan ke 26 kelas
◦ Data kelas 1 adalah huruf A dengan segala variasi penulisannya, dst
5
Contoh: Pengenalan Huruf
Data merepresentasikan karakter 26 huruf alfabet
Definisi tujuan sistem mengklasifikasikan data ke 26 kelas yang ada berdasarkan standar polanya
Problem yang muncul◦ Q1: Apa yang akan dibandingkan? FITUR◦ Q2: Bagaimana mengukur tingkat kesamaan pola? 6
Model Klasifikasi Hurufstandar pola kelas
1
Array nilai tingkat terang
pixel
Data dengan pola visual
standar pola kelas
2standar pola kelas
4
DITERIMA
DITERIMA
DITOLAK
Fitur adalah suatu nilai yang dapat membantu sebagai pembeda
Contoh dalam klasifikasi huruf cetak◦ Dalam penentuan fitur untuk pembandingan perlu …
tahu luas area huruf tahu daerah perbatasan luar huruf
◦ Dalam pengukuran tingkat kesamaan huruf dilakukan … Berdasarkan rasio kepadatan luas area penulisan huruf dengan area batas luar huruf (disebut perimeter) Huruf B lebih padat daripada huruf O
Berdasarkan tingkat simetri area huruf bagian atas dengan bawah Huruf B lebih simetri daripada huruf P
Beberapa fitur dapat sensitif akan perubahan nilai◦ Fitur tingkat kelurusan sisi kiri huruf
Pola untuk membedakan huruf D atau O
7
Penentuan Fitur
Set nilai sejumlah d fitur dihasilkan dari pengukuran setiap data yang akan diklasifikasikan◦x1 = area◦x2 = perimeter, …, ◦xd = panjang garis melengkung / jarak garis lurus
Nilai sejumlah d fitur dari suatu data disimpan sebagai sebuah matrik baris x Vektor Fitur◦Vektor x memiliki d baris = suatu data memiliki d dimensi
◦Vektor x digambarkan sebagai suatu titik pada ruang fitur dimensi d
8
Vektor Fitur
Pola suatu data hasil dari pengukuran direpresentasikan dalam sebuah vektor
Pada pengenalan pola terjadi pengurangan jumlah informasi, pemetaan atau pelabelan informasi
9
Pola dan Pengenalan Pola
Sekumpulan ikan diletakkan pada ban berjalan Berdasarkan sensor optik, mesin dapat mengelompokkan ikan-ikan tersebut sebagai SeaBass dan Salmon
Analisa problem◦ Set posisi kamera untuk mengambil gambar ikan-ikan◦ Dari gambar akan diekstrak informasi fitur:
Panjang ikan Tingkat kecerahan warna sisik ikan Lebar badan ikan Jumlah dan bentuk sirip ikan Posisi mulut ikan, dll.
10
Contoh: Pengelompokkan Ikan
11
Diagram Sistem Pengenalan Pola
sensor optik
kumpulan ikan
pada ban berjalan pra
pemrosesangambar
ikan-ikanoperasi
segmentasi gambar untuk
membedakan setiap ikan
ekstraksi fitur
peng-klasifikas
i
hasil pengelom-pokkan ikan
salmon
seabass
• lebar badan ikan
• tingkat kecerahan warna sisik ikan
13
Pilihan Fitur 2 : Tingkat Kecerahan Sisik Ikan
ERROR SEAB
ASS ERROR SALMON
NILAI AMBANG BATAS
fitur lightness lebih baik dibanding fitur length
Penentuan nilai ambang batas (threshold decision boundary) menentukan nilai biaya (cost function)
Solusi◦ Menambah atau mengurangi nilai ambang batas
14
Problem yang Muncul
TEORI KEPUTUSAN
ERROR SALMONERROR SEABASS
Jika nilai ambang batas dikurangi:
• seabass masuk klas salmon berkurang
• salmon masuk klas seabass bertambah
Pilihan Fitur 3: Lebar + Tingkat Kecerahan Sisik Digunakan fitur lebar ikan dan tingkat kecerahan sisik ikan
15
xT = [x1, x2]LIGHTNESS WIDTH
Batas Pemisah Terbaik
Batas pemisah (decision boundary) terbaik memberikan hasil klasifikasi yang optimal
16
17
Issue Generalisasi
Sistem pengenalan tidak memiliki sifat generalisasi jika◦ Sistem hanya dapat mengklasifikasi data pelatihan◦ Sistem tidak dapa mengklasifikasi dengan baik data baru
GENERALISASI
18
Alur Proses Sistem Pengenalan Pola
SENSING : • menggunakan alat optik untuk
menangkap pola visual (mis: kamera)
• sistem pengenalan pola sensitif akan resolusi alat optik untuk mengurangi data terdistorsi
xT = [x1, x2]
salmonseabas
s
SEGMENTASI : • pola – pola yang ada harus
terpisah, tidak bertumpuk
POST PROCESSING : • melakukan evaluasi tingkat
kesalahan (error rate)• mempertimbangkan mengganti
jenis fitur untuk pengenalan
Langkah-langkah Pengerjaan Sistem Pengenalan Pola
Collect data: mengumpulkan data untuk pelatihan dan uji coba
Feature choice: memilih fitur yang akan digunakan berdasarkan data dan menentukan informasi prior
Model choice: memilih model klasifikasi. (catatan: telah ditetapkan model pengenalan pola berdasarkan teori statistik)
Train classifier: dengan data pelatihan, informasi prioir akan berubah sampai performa fungsi klasifikasi optimal
Evaluate classifier: melakukan evaluasi tingkat kesalahan kemudian mempertimbangkan untuk mengganti fitur
19
KOMPLEKSITAS KOMPUTASI
Trade-off antara kemudahan komputasi
dengan performa
Pembelajaran Supervised◦Terdapat kategori/klas/label sebagai hasil klasifikasi
◦Terdapat fungsi biaya untuk setiap pola pada data pelatihan
Pembelajaran Unsupervised◦Sistem akan membentuk cluster/kelompok/gugus data berdasarkan pola yang ada
20
Jenis Pembelajaran
Ekstraktor Fitur Melakukan ekstraksi fitur data asal untuk mendapat set fitur d; x1, x2, …, xd
Desain ekstraktor fitur tergantung pada problem Keinginan
◦ Ekstraktor fitur menghasilkan vektor fitur yang sama untuk setiap data pada suatu klas
Kenyataan◦ Ekstraktor fitur menghasilkan vektor fitur yang relatif sama untuk setiap data pada suatu klas
◦ Variasi vektor fitur data pada satu kelas lebih kecil dibanding data pada lain kelas
21
22
Pengklasifikasi Sederhana
Membuat solusi hipotesa awal, kemudian diadaptasi modelnya sampai optimal◦CARA INTUITIF
Menurunkan fungsi pengklasifikasi optimal dari model matematisnya◦Membahas teori:
Pencocokan template (template matching) Pengklasifikasian mencari jarak terdekat (minimum-distance classifiers)
Pengukuran (metrics) Perkalian inner product Diskriminan linear Decision boundaries
23
Definisi Template Matching
Contoh huruf alfabet D dan O dengan variasi penulisannya
Gambar D dan O kiri dijadikan acuan/template karena bebas distorsi
Data-data gambar sebelah kanan akan dicocokkan dengan template yang ada dan dihitung tingkat kecocokannya
Ada beberapa pendekatan yaitu:◦ Maximum Correlation = jumlah kesamaan
Menghitung jumlah pixel hitam atau putih yang sama antar data dengan template
Pilih kelas dengan nilai kesamaan terbesar◦ Minimum Error = jumlah ketidaksamaan
Menghitung jumlah pixel yang tidak sama (pixel hitam pada data dengan pixel putih pada template atau sebaliknya)
Pilih kelas dengan nilai ketidaksamaan terkecil Digunakan jika variasi pada setiap kelas tergantung pada ada tidaknya tambahan noise◦ Pada pengenalan huruf tidak terdapat distorsi akibat
translation, rotation, shearing, warping, expansion, contraction, atau occlusion
24
Pelaksanaan Template Matching
Ekspresi Matematika dari Template Matching sebagai berikut:◦ Terdapat vektor fitur x untuk data input◦ Ditentukan sejumlah c klas◦ Ditentukan template untuk setiap klas, m1, m2, …, mc
Error template matching antara x dan template ke k, mk dihitung dari norm vektor (x - mk) = || x - mk || dan k = {1…c}
Penghitungan || x - mk || = menghitung jarak antara vektor x dan vektor mk
Pengklasifikasi akan mencari error terkecil = mencari jarak terdekat◦ Pengklasifikasi dengan Template Matching = Minimum-Distance
Classifier
25
Minimum-Distance Classifiers
Ada banyak cara untuk mendefinisikan Norm ||u||. Contoh sebagai berikut :◦ Manhattan (taxicab) metric || u || = |u1| + |u2|+ |u3| + ... + |ud|
Contoh: digunakan pada template matching pengenalan huruf dengan menghitung jumlah ketidaksamaan
◦ Euclidean metric || u || = sqrt( u1
2 + u22 + ... + ud
2 )
Untuk selanjutnya akan digunakan model ini 27
Metrics