28
Model Sistem Pengenalan Pola

Pengenalan Pola 2 Model Sistem Pengenalan Pola OK

  • Upload
    fauns

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Model Sistem Pengenalan Pola

Terdapat banyak jenis pola:◦ Pola visual◦ Pola temporal◦ Pola logikal

Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola

Terdapat model standar yang dapat dijadikan teori acuan◦Statistik atau Fuzzy◦Syntatic atau Struktur◦Berbasis pengetahuan

2

Model Pengenalan Pola

Statistical Patter

n Recognition

Problem pengenalan pola didefinisikan sebagai problem klasifikasi

Daftar kata kunci :◦ Klasifikasi◦ Fitur◦ Vektor fitur◦ Model klasifikasi standar

3

Pengenalan Pola Klasifikasi

Diperlukan suatu sistem untuk melakukan pengenalan◦Sistem mengenali data kemudian mengklasifikasi data tersebut berdasarkan pola tertentu ke suatu klas

Contoh aplikasi yang melakukan …◦Pengenalan suara◦Identifikasi sidik jari◦Pengenal karakter secara optik (OCR)◦Identifikasi urutan DNA

4

Aplikasi Pengenalan Pola

Terdapat data dengan pola visual Data merepresentasikan karakter 26 huruf alfabet

Definisi problem:◦ Pengenalan pola data yang diklasifikasikan ke 26 kelas

◦ Data kelas 1 adalah huruf A dengan segala variasi penulisannya, dst

5

Contoh: Pengenalan Huruf

Data merepresentasikan karakter 26 huruf alfabet

Definisi tujuan sistem mengklasifikasikan data ke 26 kelas yang ada berdasarkan standar polanya

Problem yang muncul◦ Q1: Apa yang akan dibandingkan? FITUR◦ Q2: Bagaimana mengukur tingkat kesamaan pola? 6

Model Klasifikasi Hurufstandar pola kelas

1

Array nilai tingkat terang

pixel

Data dengan pola visual

standar pola kelas

2standar pola kelas

4

DITERIMA

DITERIMA

DITOLAK

Fitur adalah suatu nilai yang dapat membantu sebagai pembeda

Contoh dalam klasifikasi huruf cetak◦ Dalam penentuan fitur untuk pembandingan perlu …

tahu luas area huruf tahu daerah perbatasan luar huruf

◦ Dalam pengukuran tingkat kesamaan huruf dilakukan … Berdasarkan rasio kepadatan luas area penulisan huruf dengan area batas luar huruf (disebut perimeter) Huruf B lebih padat daripada huruf O

Berdasarkan tingkat simetri area huruf bagian atas dengan bawah Huruf B lebih simetri daripada huruf P

Beberapa fitur dapat sensitif akan perubahan nilai◦ Fitur tingkat kelurusan sisi kiri huruf

Pola untuk membedakan huruf D atau O

7

Penentuan Fitur

Set nilai sejumlah d fitur dihasilkan dari pengukuran setiap data yang akan diklasifikasikan◦x1 = area◦x2 = perimeter, …, ◦xd = panjang garis melengkung / jarak garis lurus

Nilai sejumlah d fitur dari suatu data disimpan sebagai sebuah matrik baris x Vektor Fitur◦Vektor x memiliki d baris = suatu data memiliki d dimensi

◦Vektor x digambarkan sebagai suatu titik pada ruang fitur dimensi d

8

Vektor Fitur

Pola suatu data hasil dari pengukuran direpresentasikan dalam sebuah vektor

Pada pengenalan pola terjadi pengurangan jumlah informasi, pemetaan atau pelabelan informasi

9

Pola dan Pengenalan Pola

Sekumpulan ikan diletakkan pada ban berjalan Berdasarkan sensor optik, mesin dapat mengelompokkan ikan-ikan tersebut sebagai SeaBass dan Salmon

Analisa problem◦ Set posisi kamera untuk mengambil gambar ikan-ikan◦ Dari gambar akan diekstrak informasi fitur:

Panjang ikan Tingkat kecerahan warna sisik ikan Lebar badan ikan Jumlah dan bentuk sirip ikan Posisi mulut ikan, dll.

10

Contoh: Pengelompokkan Ikan

11

Diagram Sistem Pengenalan Pola

sensor optik

kumpulan ikan

pada ban berjalan pra

pemrosesangambar

ikan-ikanoperasi

segmentasi gambar untuk

membedakan setiap ikan

ekstraksi fitur

peng-klasifikas

i

hasil pengelom-pokkan ikan

salmon

seabass

• lebar badan ikan

• tingkat kecerahan warna sisik ikan

12

Pilihan Fitur 1 : Panjang Ikan

ERROR SEAB

ASS ERROR SALMON

NILAI AMBANG BATAS

13

Pilihan Fitur 2 : Tingkat Kecerahan Sisik Ikan

ERROR SEAB

ASS ERROR SALMON

NILAI AMBANG BATAS

fitur lightness lebih baik dibanding fitur length

Penentuan nilai ambang batas (threshold decision boundary) menentukan nilai biaya (cost function)

Solusi◦ Menambah atau mengurangi nilai ambang batas

14

Problem yang Muncul

TEORI KEPUTUSAN

ERROR SALMONERROR SEABASS

Jika nilai ambang batas dikurangi:

• seabass masuk klas salmon berkurang

• salmon masuk klas seabass bertambah

Pilihan Fitur 3: Lebar + Tingkat Kecerahan Sisik Digunakan fitur lebar ikan dan tingkat kecerahan sisik ikan

15

xT = [x1, x2]LIGHTNESS WIDTH

Batas Pemisah Terbaik

Batas pemisah (decision boundary) terbaik memberikan hasil klasifikasi yang optimal

16

17

Issue Generalisasi

Sistem pengenalan tidak memiliki sifat generalisasi jika◦ Sistem hanya dapat mengklasifikasi data pelatihan◦ Sistem tidak dapa mengklasifikasi dengan baik data baru

GENERALISASI

18

Alur Proses Sistem Pengenalan Pola

SENSING : • menggunakan alat optik untuk

menangkap pola visual (mis: kamera)

• sistem pengenalan pola sensitif akan resolusi alat optik untuk mengurangi data terdistorsi

xT = [x1, x2]

salmonseabas

s

SEGMENTASI : • pola – pola yang ada harus

terpisah, tidak bertumpuk

POST PROCESSING : • melakukan evaluasi tingkat

kesalahan (error rate)• mempertimbangkan mengganti

jenis fitur untuk pengenalan

Langkah-langkah Pengerjaan Sistem Pengenalan Pola

Collect data: mengumpulkan data untuk pelatihan dan uji coba

Feature choice: memilih fitur yang akan digunakan berdasarkan data dan menentukan informasi prior

Model choice: memilih model klasifikasi. (catatan: telah ditetapkan model pengenalan pola berdasarkan teori statistik)

Train classifier: dengan data pelatihan, informasi prioir akan berubah sampai performa fungsi klasifikasi optimal

Evaluate classifier: melakukan evaluasi tingkat kesalahan kemudian mempertimbangkan untuk mengganti fitur

19

KOMPLEKSITAS KOMPUTASI

Trade-off antara kemudahan komputasi

dengan performa

Pembelajaran Supervised◦Terdapat kategori/klas/label sebagai hasil klasifikasi

◦Terdapat fungsi biaya untuk setiap pola pada data pelatihan

Pembelajaran Unsupervised◦Sistem akan membentuk cluster/kelompok/gugus data berdasarkan pola yang ada

20

Jenis Pembelajaran

Ekstraktor Fitur Melakukan ekstraksi fitur data asal untuk mendapat set fitur d; x1, x2, …, xd

Desain ekstraktor fitur tergantung pada problem Keinginan

◦ Ekstraktor fitur menghasilkan vektor fitur yang sama untuk setiap data pada suatu klas

Kenyataan◦ Ekstraktor fitur menghasilkan vektor fitur yang relatif sama untuk setiap data pada suatu klas

◦ Variasi vektor fitur data pada satu kelas lebih kecil dibanding data pada lain kelas

21

22

Pengklasifikasi Sederhana

Membuat solusi hipotesa awal, kemudian diadaptasi modelnya sampai optimal◦CARA INTUITIF

Menurunkan fungsi pengklasifikasi optimal dari model matematisnya◦Membahas teori:

Pencocokan template (template matching) Pengklasifikasian mencari jarak terdekat (minimum-distance classifiers)

Pengukuran (metrics) Perkalian inner product Diskriminan linear Decision boundaries

23

Definisi Template Matching

Contoh huruf alfabet D dan O dengan variasi penulisannya

Gambar D dan O kiri dijadikan acuan/template karena bebas distorsi

Data-data gambar sebelah kanan akan dicocokkan dengan template yang ada dan dihitung tingkat kecocokannya

Ada beberapa pendekatan yaitu:◦ Maximum Correlation = jumlah kesamaan

Menghitung jumlah pixel hitam atau putih yang sama antar data dengan template

Pilih kelas dengan nilai kesamaan terbesar◦ Minimum Error = jumlah ketidaksamaan

Menghitung jumlah pixel yang tidak sama (pixel hitam pada data dengan pixel putih pada template atau sebaliknya)

Pilih kelas dengan nilai ketidaksamaan terkecil Digunakan jika variasi pada setiap kelas tergantung pada ada tidaknya tambahan noise◦ Pada pengenalan huruf tidak terdapat distorsi akibat

translation, rotation, shearing, warping, expansion, contraction, atau occlusion

24

Pelaksanaan Template Matching

Ekspresi Matematika dari Template Matching sebagai berikut:◦ Terdapat vektor fitur x untuk data input◦ Ditentukan sejumlah c klas◦ Ditentukan template untuk setiap klas, m1, m2, …, mc

Error template matching antara x dan template ke k, mk dihitung dari norm vektor (x - mk) = || x - mk || dan k = {1…c}

Penghitungan || x - mk || = menghitung jarak antara vektor x dan vektor mk

Pengklasifikasi akan mencari error terkecil = mencari jarak terdekat◦ Pengklasifikasi dengan Template Matching = Minimum-Distance

Classifier

25

Minimum-Distance Classifiers

26

Diagram Minimum-Distance Classifier

Ada banyak cara untuk mendefinisikan Norm ||u||. Contoh sebagai berikut :◦ Manhattan (taxicab) metric || u || = |u1| + |u2|+ |u3| + ... + |ud|

Contoh: digunakan pada template matching pengenalan huruf dengan menghitung jumlah ketidaksamaan

◦ Euclidean metric || u || = sqrt( u1

2 + u22 + ... + ud

2 )

Untuk selanjutnya akan digunakan model ini 27

Metrics

Metrics Contour dari jarak konstan Euclidean berbentuk

circles/spheres Contour dari jarak konstan Manhattan berbentuk

squares/boxes Contour dari jarak konstan Mahalanobis berbentuk

ellipses/ellipsoids

Untuk selanjutnya pengukuran jarak akan menggunakan metric Euclidean atau Mahalanobis

28