Upload
vokien
View
219
Download
0
Embed Size (px)
Citation preview
i
IDENTIFIKASI PENULIS PADA DOKUMEN TULISAN TANGAN AKSARA
LAMPUNG BERDASARKAN KARAKTER TERPILIH
(Skripsi)
Oleh
SYIFA TRIANINGSIH
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2019
iii
ABSTRACT
WRITER IDENTIFICATION OF LAMPUNG HANDWRITTEN
DOCUMENTS BASED ON CHOSEN CHARACTERS
BY
SYIFA TRIANINGSIH
Handwriting recognition is becoming more popular for the forensic and knowledge
development purposes, because from handwriting every human can save and
transmission an information to other people. Traditional characters from Lampung,
one of region in Indonesia was chosen as media in this experiment, called Had
Lampung. They have 20 main characters and 11 diacritics that used in every word
or sentence. Based on those selected characters, the authors would be identified
using Principal Component Analysis (PCA). PCA is one of the linear feature
extraction method for recognize a pattern with high dimensional data. PCA extract
the features by reducing the dimension of images. Dataset used in this experiment
called Lampung Dataset and available on Technische Universität’s website for free.
This dataset consists of 82 documents written by hands in Lampung characters. In
the experiment, almost 12500 Lampung characters was chosen from 82 different
writers are used to train and test the performances of the proposed method.
iv
Lampung characters that used in this experiment have gone through a pre-
processing before. The highest accuracy that PCA got in identification the authors
is 82,92% whilst the lowest accuracy in this experiment is 28,9%.
Keywords: feature extraction; lampung characters; principal component analysis;
pca; writer identification.
i
ABSTRAK
IDENTIFIKASI PENULIS PADA DOKUMEN TULISAN TANGAN AKSARA
LAMPUNG BERDASARKAN KARAKTER TERPILIH
Oleh
SYIFA TRIANINGSIH
Pengenalan tulisan tangan menjadi topik yang popular untuk bidang forensik dan
pengembangan ilmu pengetahuan. Karena dari tulisan tangan, setiap manusia dapat
menyimpan dan mentrasmisikan sebuah informasi kepada orang lain. Karakter
tradisional daerah Lampung, salah satu daerah di Indonesia terpilih sebagai media
dalam penelitian ini, karakter tradisional daerah Lampung biasa disebut dengan
Had Lampung. Had Lampung memiliki 20 karakter utama dan 11 anak huruf yang
digunakan pada kata atau padanan kalimat. Berdasarkan karakter terpilih, penulis
akan diidentifikasi menggunakan Principal Component Analysis (PCA). PCA
merupakan salah satu metode fitur ekstraksi linear untuk mengenali pola dengan
dimensi yang tinggi. PCA mengekstraksi fitur dengan mengurangi dimensi gambar.
Dataset yang digunakan pada penelitian ini disebut dengan Lampung Dataset yang
tersedia secara gratis di situs Technische Universität. Dataset tersebut memiliki 82
dokumen tulisan tangan Aksara Lampung. Pada penelitian ini, hampir 12.500
ii
Aksara Lampung dari 82 dokumen terpilih untuk digunakan sebagai data train dan
data test untuk menunjang performa metode yang diusulkan. Sebelumnya, Aksara
Lampung pada dataset yang telah tersedia telah mengalami preprocessing. Hasil
akhirnya, akurasi tertinggi hasil identifikasi yang didapatkan pada identifikasi
penulis adalah 82,92% sedangkan akurasi terendah yang didapatkan adalah sebesar
28,29%.
Kata kunci: aksara Lampung, fitur ekstraksi, identifikasi penulis, principal
component analysis.
v
IDENTIFIKASI PENULIS PADA DOKUMEN TULISAN TANGAN AKSARA
LAMPUNG BERDASARKAN KARAKTER TERPILIH
Oleh:
SYIFA TRIANINGSIH
Skripsi
Sebagai Salah Satu Syarat untuk Mencapai Gelar
SARJANA KOMPUTER
Pada
Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2019
ix
RIWAYAT HIDUP
Penulis dilahirkan pada tanggal 20 Sepetember 1996 di Kota Bekasi,
sebagai anak kedua dari dua bersaudara, dari bapak Suparyanto dan
Ibu Raras Wigati. Pendidikan formal yang ditempuh penulis adalah
Sekolah Taman Kanak-kanak (TK) Shandy Putra Telkom Bandar
Lampung diselesaikan tahun 2002, Sekolah Dasar (SD) diselesaikan
di SD Kartika II-5 Bandar Lampung pada tahun 2008. Sekolah Menengah Pertama
(SMP) diselesaikan di SMP Negeri 5 Bandar Lampung pada tahun 2011, dan Sekolah
Menengah Atas (SMA) YP Unila Bandar Lampung pada tahun 2014.
Pada tahun 2014, penulis terdaftar sebagai mahasiswa Jurusan Ilmu Komputer Fakultas
Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Lampung melalui jalur
SBMPTN. Semasa kuliah, penulis terdaftar dalam organisasi Organisasi Himpunan
Mahasiswa Jurusan Ilmu Komputer (HIMAKOM) FMIPA Unila sebagai anggota
Keilmuan periode 2015/2016.
Selama menjadi mahasiswa beberapa kegiatan yang pernah dilakukan penulis antara
lain:
x
1. Pada bulan Januari 2015 penulis melaksanakan Karya Wisata Ilmiah (KWI) di
Desa Sidokaton, Gisting, Kabupaten Tanggamus.
2. Pada pernah Semester Ganjil Tahun Akademik 2016/2017 penulis menjadi
asisten praktikum mata kuliah Grafika Komputer
3. Pada Bulan Januari 2017, penulis melakukan kerja Praktik di Kantor Badan
Pengawasan Keuangan dan Pembangunan (BPKP) Perwakilan Provinsi
Lampung.
4. Pada Bulan Juli 2017 penulis melakukan kegiatan Kuliah Kerja Nyata (KKN) di
Desa Banjarmasin Kecamatan Penengahan, Kabupaten Lampng Selatan.
xi
PERSEMBAHAN
Kuucapkan syukurku kepada Allah Subhanahuwata’ala, kujadikan setiap proses
pembuatan karya kecilku ini sebagai salah satu bentuk ibadahku kepada Allah
Kudedikasikan buku ini menjadi beberapa bagian:
Untuk Ibuku Sayang,
Untuk Pahlawan Super-ku
Untuk Si K-Drama Lovers
Dan, untuk “The wiser yet the most patience person”
xii
MOTTO
“Sesungguhnya bersama kesulitan, ada kemudahan. Dan hanya kepada Tuhanmulah engkau berharap”
(Q. S. Al – Insyirah (94): 6&8)
“Nothing’s gone forever, only out of place” (Mary Poppins)
xiii
SANWACANA
Puji syukur kehadirat Allah Subhannahu wata ‘ala, atas limpahan rahmat dan hidayah-
Nya sehingga penulis dapat menyelesaikan skripsi yang berjudul “Identifikasi Penulis
Pada Dokumen Tulisan Tangan Aksara Lampung Berdasarkan Karakter
Terpilih”. Skripsi ini merupakan salah satu syarat untuk memperoleh gelar Sarjana
Komputer di Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan
Alam Universitas Lampung.
Pada saat pelaksanaan dan penyusunan skripsi penulis sangat berterima kasih kepada
seluruh pihak yang membantu penulis menyelesaikan skripsi ini. Oleh karena itu,
penulis mengucapkan terima kasih kepada:
1. Kedua orangtua tercinta, Bapak Suparyanto dan Ibu Raras Wigati yang selalu
memberikan doa, nasihat dan semangat dukungan berupa moril, dan materil.
2. Kakak perempuan penulis satu-satunya, Aryanti Dwiastuti yang selalu
memberikan semangat, kritik, saran, motivasi, pengalaman, dan masukannya.
3. Dr. rer. nat. Akmal Junaidi, M. Sc. selaku dosen pembimbing utama yang telah
memberikan kesediaan waktunya, kesabaran, motivasi semangat, kritik, dan
saran sehingga penulisan skripsi ini dapat diselesaikan.
xiv
4. Bapak Muhammad Iqbal, S. Kom., M. Kom. selaku pembimbing kedua yang
telah membimbing penulis serta memberikan saran dan motivasi dalam
pembuatan skripsi.
5. Bapak Dr. Eng. Admi Syarif selaku dosen pembahas. Terima kasih atas masukan,
kritik, semangat, serta bimbingan dalam penyelesaian skripsi ini.
6. Bapak Prof. Warsito, S. Si., D.E.A., Ph.D. selaku Dekan FMIPA Universitas
Lampung.
7. Bapak Dr. Ir. Kurnia Muludi, M. S. Sc. selaku Ketua Jurusan Ilmu Komputer
Universitas Lampung.
8. Bapak Didik Kurniawan, S. Si., M. T. selaku Sekretaris Jurusan Ilmu Komputer
Universitas Lampung.
9. Bapak Rico Andrian, S. Si., M. Kom. selaku Pembimbing Akademik selama
penulis terdaftar sebagai mahasiswa Ilmu Komputer Universitas Lampung.
10. Bapak dan Ibu Dosen Jurusan Ilmu Komputer yang telah memberikan ilmu dan
pengalaman yang bermanfaat bagi penulis.
11. Seluruh staff yang ada di Jurusan Ilmu Komputer.
12. Partner sharing terbaik Nuha Hanifah, Devi Ranita, Tri Lestari, Noni Kurniasih,
dan Maria Regina Caeli terima kasih untuk bantuan, masukan, saran, kritik,
energi positif yang disampaikan, dalam pembuatan skripsi.
13. Kolega selama Kuliah Kerja Nyata (KKN) Tri, Siska, Aldi, dan Darius terima
kasih atas kebersamaan, kerja sama, semoga tali silaturahmi tetap terjaga.
xv
14. Teman-teman Ilmu Komputer angkatan 2014, khususnya kelas ganjil yang
menjadi teman satu angkatan selama menjalankan masa studi di Jurusan Ilmu
Komputer.
15. Almamater tercinta, Universitas Lampung.
Penulis menyadari bahwa penyusunan skripsi ini masih banyak kekurangan dan masih
jauh dari kesempurnaan. Semoga Allah melimpahkan rahmat dan berkenan membalas
semua budi baik yang diberikan kepada penulis, serta semoga skripsi ini dapat
bermanfaat bagi kita semua, Aamiin.
Bandar Lampung, Januari 2019
Penulis,
Syifa Trianingsih
xvi
DAFTAR ISI
Halaman
SANWACANA ......................................................................................................... xiii
DAFTAR ISI ............................................................................................................. xvi
DAFTAR TABEL .................................................................................................... xix
DAFTAR GAMBAR ................................................................................................. xx
I. PENDAHULUAN .............................................................................................. 1
1.1. Latar Belakang ......................................................................................... 1
1.2. Rumusan Masalah .................................................................................... 3
1.3. Batasan Masalah ...................................................................................... 4
1.4. Tujuan ...................................................................................................... 4
1.5. Manfaat .................................................................................................... 5
II. LANDASAN TEORI ......................................................................................... 6
2.1. Aksara Lampung ...................................................................................... 6
2.1.1. Induk Huruf (Kelabai Surat) ........................................................ 8
2.1.2. Anak Huruf (Benah Surat) ......................................................... 10
2.1.3. Tanda Baca ................................................................................. 16
2.2. Pengenalan Pola ..................................................................................... 16
xvii
2.2.1. Tujuan dan Implementasi Pengenalan Pola ............................... 17
2.3. Identifikasi Penulis ................................................................................ 18
2.4. Preprocessing ........................................................................................ 20
2.4.1. Reduksi Noise ............................................................................ 21
2.4.2. Binerisasi Gambar ...................................................................... 22
2.4.3. Normalisasi Gambar .................................................................. 23
2.5. Ekstraksi Fitur ........................................................................................ 24
2.5.1. Principal Component Analysis (PCA) ....................................... 25
2.6. Euclidean Distance ................................................................................ 30
III. METODOLOGI PENELITIAN ..................................................................... 32
3.1. Pra Penelitian ......................................................................................... 32
3.1.1. Studi Literatur ............................................................................ 32
3.1.2. Dataset ....................................................................................... 33
3.2. Preprocessing ........................................................................................ 33
3.3. Identifikasi Penulis ................................................................................ 34
3.3.1. Pembagian Karakter ................................................................... 35
3.3.2. Ekstraksi Fitur Menggunakan PCA ........................................... 35
3.3.3. Training Identifikasi Penulis ...................................................... 36
3.3.4. Identifikasi Penulis ..................................................................... 37
3.3.5. Pengukuran Hasil Identifikasi .................................................... 38
3.4. Analisis Singkat Kesalahan Identifikasi Penulis ................................... 38
IV. HASIL DAN PEMBAHASAN ........................................................................ 39
4.1. Dataset ................................................................................................... 39
4.2. Ekstraksi Fitur Menggunakan PCA ....................................................... 40
4.3. Training Identifikasi Penulis ................................................................. 52
4.4. Identifikasi Penulis ................................................................................ 53
4.5. Pengukuran Hasil Identifikasi ................................................................ 61
4.6. Analisis Singkat Hasil Identifikasi ........................................................ 63
xviii
V. SIMPULAN DAN SARAN.............................................................................. 66
5.1. Simpulan ................................................................................................ 66
5.2. Saran ...................................................................................................... 66
DAFTAR PUSTAKA ................................................................................................ 68
LAMPIRAN ............................................................................................................... 71
xix
DAFTAR TABEL
Tabel Halaman
4.1. Pembagian Sampel Trainingset dan Testingset.................................................... 40
4.2. Tabel Ukuran Matriks Train. ............................................................................... 42
4.3. Tabel Susunan Ordo Hasil Rata-Rata Matriks Train (m). ................................... 44
4.4. Tabel Ukuran Matriks Substraksi (A). ................................................................. 46
4.5. Tabel Ukuran Matriks Kovarians untuk Setiap Sampel (L). ............................... 48
4.6. Ukuran Matriks Hasil Eigenvalue dan Eigenvektor. ............................................ 49
4.7. Hasil Eliminasi Elemen Matriks Eigenvalue. ...................................................... 50
4.8. Hasil Proses Perkalian Mendapatkan PCA dari Setiap Sampel Penelitian. ......... 52
4.9. Ukuran Matriks Proyeksi Gambar Train dari Setiap Sampel Penelitian. ............ 53
4.10. Ukuran Matriks Hasil dari Baca Gambar Uji untuk Setiap Sampel. ................. 55
4.11. Ukuran Matriks Proyeksi Gambar Uji dari Setiap Sampel Penelitian. .............. 57
4.12. Jumlah Prediksi Benar yang Didapatkan pada Pengujian Identifikasi Penulis. . 61
xx
DAFTAR GAMBAR
Gambar Halaman
2.1. Induk huruf yang belum disempurnakan (Pudjiastuti, 2014). ................................ 8
2.2. Induk huruf yang sudah disempurnakan (Junaidi, et al., 2011). ............................ 9
2.3. Contoh induk huruf yang condong mengarah ke kanan-atas. ................................ 9
2.4. Contoh bentuk huruf yang terdiri dari dua komponen huruf utama..................... 10
2.5. Bentuk-bentuk benah surat pada Aksara Lampung. ............................................ 11
2.6. Bentuk-bentuk benah surat yang terletak di bagian atas huruf. .......................... 12
2.7. Bentuk-bentuk anak huruf yang terletak di bagian bawah huruf. ........................ 13
2.8. Bentuk anak huruf yang dapat diletakkan di samping kanan huruf. .................... 14
2.9. Kumpulan tanda baca yang ada di Aksara Lampung. .......................................... 16
2.10. Gambar sebelum noise dihilangkan (kiri) dan gambar sesudah noise dihilangkan
(kanan) (Garnett, et al., 2005). ........................................................................... 22
2.11. Contoh perangko Jerman yang dikonversi ke dalam format biner, (Junaidi, 2016).
........................................................................................................................... 22
2.12. Contoh proses normalisasi kemiringan pada bentuk tulisan (proses slant)
(Virajitha, et al., 2012). ...................................................................................... 23
2.13. Contoh proses normalisasi kemiringan pada arah tulisan (proses skew) (Virajitha,
et al., 2012). ....................................................................................................... 23
xxi
2.14. Ilustrasi perubahan matrik (𝑀 × 𝑁) menjadi vektor kolom (𝑀 × 𝑁) × 1 (Paul &
Al Sumam, 2012). .............................................................................................. 26
3.15. Metode penelitian identifikasi penulis pada dokumen tulisan tangan Aksara
Lampung. ........................................................................................................... 34
3.16. Tahapan fitur ekstraksi PCA (Paul & Al Sumam, 2012). .................................. 36
3.17. Tahapan training identifikasi penulis (Paul & Al Sumam, 2012). .................... 37
3.18. Tahapan identifikasi penulis (Paul & Al Sumam, 2012). .................................. 37
4.19. Salah satu dataset gambar tulisan tangan aksara Lampung yang sudah mengalami
preprocessing, (Junaidi, et al., 2011). ................................................................ 40
4.20. Code program untuk memroses gambar aksara Lampung menjadi matriks dan
mengubahnya ke dalam vektor kolom. .............................................................. 41
4.21. Ilustrasi proses code program dalam mengubah dua gambar aksara Lampung
menjadi matriks vektor kolom. .......................................................................... 42
4.22. Tahapan proses ekstraksi fitur menggunakan PCA. .......................................... 43
4.23. Potongan code program untuk menghitung nilai rata-rata matriks train. .......... 44
4.24. Ilustrasi gambar untuk proses mendapatkan nilai rata-rata matriks train dari dua
gambar aksara Lampung. ................................................................................... 44
4.25. Potongan code program untuk menghitung substraksi matriks train. ............... 45
4.26. Ilustrasi proses untuk mendapatkan nilai substraksi dari dua buah gambar train.
........................................................................................................................... 45
4.27. Potongan code program matriks kovarians. ....................................................... 46
4.28. Ilustrasi gambar untuk proses mendapatkan matriks kovarians dari dua gambar
aksara Lampung. ................................................................................................ 47
xxii
4.29. Potongan code program untuk mendapatkan matriks eigenvalue dan eigenvektor.
........................................................................................................................... 48
4.30. Ilustrasi proses matriks kovarians dari dua gambar train aksara Lampung
mendapatkan matriks eigenvalue dan eigenvektor. ........................................... 49
4.31. Potongan code program untuk mengeliminasi elemen matriks eigenvalue. ...... 50
4.32. Ilustrasi proses eliminasi elemen matriks eigenvalue. ....................................... 50
4.33. Potonga code program untuk menghitung nilai PCA. ....................................... 51
4.34. potongan code program untuk menghitung proyeksi gambar train. .................. 52
4.35. Potongan code program untuk membaca satu gambar dalam bentuk matriks serta
mengubahnya ke dalam bentuk vektor kolom. .................................................. 54
4.36. Proses code program dalam membaca sebuah gambar uji dan mengubahnya ke
dalam bentuk vektor kolom. .............................................................................. 54
4.37. Potongan code program untuk membaca satu folder yang berisi beberapa gambar
uji. ...................................................................................................................... 55
4.38. Potongan code program untuk mencari nilai proyeksi gambar uji. ................... 56
4.39. Ilustrasi proses operasi hitung untuk mendapatkan nilai proyeksi gambar uji dari
satu buah gambar pengujian. ............................................................................. 56
4.40. Potongan code program untuk menghitung jarak Euclidean distance pada satu
buah gambar uji. ................................................................................................ 58
4.41. Potongan code program untuk menghitung jarak Euclidean distance pada
beberapa gambar uji. .......................................................................................... 58
4.42. Matriks hasil dari perhitungan jarak Euclidean untuk beberapa gambar uji. ..... 59
xxiii
4.43. Potongan code program untuk menampilkan hasil jarak Euclidean distance yang
paling kecil......................................................................................................... 60
4.44. Hasil output prediksi identifikasi penulis. .......................................................... 60
4.45. Bentuk aksara Lampung yang memiliki kemiripan. .......................................... 64
4.46. Contoh gaya tulisan yang serupa dari penulis yang berbeda. ............................ 64
1
I. PENDAHULUAN
1.1. Latar Belakang
Biometrik telah menjadi topik penelitian dalam waktu yang lama, karena
penelitian biometrik memiliki tujuan yang berkaitan tentang pengenalan identitas
berdasarkan karakteristik individu. Tulisan tangan merupakan salah satu ciri
biometrik, karena tulisan tangan dapat mewakili karakteristik pribadi dari
masing-masing individu. Identifikasi tulisan tangan termasuk ke dalam
pendekatan perilaku biometrik, karena tulisan tangan seseorang memiliki gaya
yang berbeda, sehingga identitas dapat diukur berdasarkan tulisan tangan yang
bisa merepresentasikan pribadi setiap manusia (Zuo, et al., 2002).
Identifikasi tulisan tangan juga termasuk topik riset pada bidang pengenalan pola
yang telah berkembang beberapa tahun terakhir. Salah satu faktor yang menarik
perhatian sebagian besar peneliti pada bidang pengenalan pola tulisan tangan
karena adanya penemuan tulisan tangan yang dapat memfasilitasi manusia agar
dapat menyimpan dan mentransmisikan informasi (Junaidi, 2016). Pola teks
tulisan tangan menjadi alat penting yang dapat digunakan oleh para ahli forensik
dalam mengidentifikasi pemilik tulisan tangan (Bulacu & Lambert, 2005). Media
yang dijadikan bahan untuk identifikasi adalah dokumen-dokumen tulisan tangan
2
dari skrip aksara modern dan/atau dari skrip aksara tradisional. Penelitian ini
bukan ditujukan untuk kepentingan forensik, melainkan untuk pengembangan
ilmu pengetahuan. Sebagai media identifikasi, penulis menggunakan dokumen
tulisan tangan aksara tradisional dari daerah Lampung.
Lampung merupakan sebuah provinsi yang letaknya berada di ujung selatan
Pulau Sumatera, Indonesia. Lampung mempunyai ciri aksara khas daerah yang
bernama Aksara Lampung. Daerah lain yang memiliki aksara khas adalah Rejang
Bengkulu, Rencong, Sunda, Jawa, dan Bali. Aksara Lampung memiliki dua
puluh huruf induk yang ditulis dari kiri ke kanan dan sebelas tanda baca.
Keunikan Aksara Lampung tersebut yang menjadi salah satu latar belakang dari
penelitian ini.
Secara teknis Aksara Lampung akan diidentifikasi siapa penulisnya dengan
menggunakan beberapa langkah penelitian. Pada tahapan penelitian ini, salah
satu proses yang harus dilakukan adalah ekstraksi fitur. Penelitian ini akan
melakukan analisis apakah fitur tersebut mampu mengenali penulis pada
dokumen Aksara Lampung atau tidak. Pembahasan secara komprehensif
bagaimana proses identifikasi penulis pada dokumen Aksara Lampung yang
dibahas lebih lengkap lagi dibagian berikutnya.
Pada penelitian ini penulis menggunakan fitur Principal Component Analysis
(PCA) dalam mengidentifikasi penulis pada tulisan dokumen Aksara Lampung.
PCA dipilih karena adanya kecocokan metode dengan penelitian sebelumnya,
3
yaitu Identifikasi Tulisan Tangan Berdasarkan PCA milik Zuo dan rekan pada
tahun 2002 yang menggunakan PCA untuk mengidentifikasi penulis melalui
potongan kata dalam Bahasa Tiongkok (Zuo, et al., 2002). Selain itu, PCA dipilih
karena adanya gagasan ide yang relevan berasal dari pengenalan wajah milik
Kaur dan rekan (Kaur, et al., 2015). Perbedaannya, penelitian ini menggunakan
PCA sebagai metode utamanya dan diaplikasikan untuk potongan huruf Akasara
Lampung. PCA mengidentifikasi potongan kata dalam Bahasa Tiongkok dengan
melakukan reduksi dimensi sebagai teknik ekstraksi fitur pada beberapa kata
terpilih untuk mengidentifikasi penulis. Hal ini juga akan diberlakukan pada
tulisan Aksara Lampung. Dalam penelitian tersebut, PCA yang digunakan untuk
mengidentifikasi penulis pada Aksara Tiongkok berhasil mengenali penulis
dengan presentase hingga 97. 5% (Zuo, et al., 2002). Dengan latar belakang
tersebut, penulis ingin menjadikan skrip Aksara Lampung sebagai objek
penelitian identifikasi penulis Aksara Lampung menggunakan PCA. Dataset
yang digunakan sebanyak 82 dokumen skrip Aksara Lampung yang dapat
diakses secara gratis pada link http://patrec.cs.tu-
dortmund.de/cms/en/home/Resources/index.html.
1.2. Rumusan Masalah
Berdasarkan latar belakang yang telah dijelaskan pada subbab sebelumnya, maka
dapat dirumuskan beberapa masalah antara lain:
1. Bagaimana mengimplementasikan PCA pada identifikasi penulis dokumen
tulisan tangan Aksara Lampung?
4
2. Berapa besar hasil akurasi identifikasi penulis pada dokumen tulisan tangan
Aksara Lampung dengan menggunakan ekstraksi fitur tersebut?
1.3. Batasan Masalah
Batasan masalah dalam penelitian identifikasi pengenalan tulisan tangan
dokumen Aksara Lampung adalah sebagai berikut:
1. Dataset yang digunakan adalah gambar yang telah melalui tahapan
preprocessing dan dapat diunduh secara bebas pada link
http://patrec.cs.tu-dortmund.de/cms/en/home/Resources/index.html.
2. Dataset terdiri dari 82 dokumen tulisan tangan Aksara Lampung.
3. Ekstraksi fitur dan identifikasi penulis menggunakan PCA berdasarkan
karakter yang telah diproses sebelumnya.
4. Hasil identifikasi yang akan didapatkan adalah berupa tabulasi data hasil
akurasi kebenaran dalam identifikasi penulis dokumen tulisan tangan
Aksara Lampung.
1.4. Tujuan
Penelitian ini bertujuan untuk mengimplementasikan PCA dalam identifikasi
penulis pada dokumen tulisan tangan Aksara Lampung. Hasil implementasi ini
digunakan untuk mengukur akurasi PCA dalam mengenali penulis pada
dokumen tulisan tangan Aksara Lampung.
5
1.5. Manfaat
Penelitian ini bermanfaat untuk menambah pengetahuan dasar PCA dan
implementasinya dalam mengidentifikasi penulis pada dokumen tulisan tangan
Aksara Lampung. Selain itu, manfaat penelitian ini adalah untuk mengukur
tingkat akurasi PCA dalam mengidentifikasi penulis pada dokumen tulisan
tangan Aksara Lampung.
6
II. LANDASAN TEORI
2.1. Aksara Lampung
Definisi aksara menurut Kamus Besar Bahasa Indonesia adalah sistem tanda
grafis yang digunakan manusia untuk berkomunikasi dan sedikit banyaknya
mewakili ujaran atau perkataan. Lampung merupakan salah satu daerah di
Indonesia yang diketahui memiliki aksara khas atau yang bisa disebut dengan
aksara Lampung. Aksara ini dikenal juga dengan sebutan aksara “Ka-Ga-Nga”
yang diambil dari tiga huruf pertamanya. Orang-orang suku Lampung biasa
menyebut Aksara Lampung dengan sebutan Had Lampung (Pudjiastuti, 2014).
Menurut Miller tahun 2011, Aksara Lampung termasuk ke dalam varietas
Aksara di daerah Sumatera Selatan yang dikenal dengan nama Surat Ulu atau
tulisan dari hulu. Surat Ulu terdiri dari Aksara Rejang, Aksara Kerinci, dan
Aksara Lampung. Aksara-aksara tersebut telah dikenal pada awal masa
kolonial (Miller, 2010). Orang-orang Ulu menulis aksara di atas kulit kayu,
kulit binatang, kepingan logam, tanduk kerbau, dan batu, yang dibuktikan
dengan adanya Naskah Ulu yang dituliskan pada tanduk kerbau. Naskah
7
tersebut merupakan warisan keturunan Ompu Pernong yang berasal dari Skala
Beghak (Andhifani, 2013).
Aksara Lampung memiliki kekerabatan dengan aksara yang digunakan di
India Selatan. Selain itu, struktur tulisan Bahasa Arab juga turut
mempengaruhi sistem penulisan pada Aksara Lampung. Tanda bahwa adanya
pengaruh tulisan Arab pada sistem Aksara Lampung adalah penggunaan anak
huruf. Perbedaan anak huruf Aksara Lampung dengan anak Huruf Arab
terdapat pada peletakkan dan bunyi anak hurufnya. Bila anak Huruf Arab
hanya terletak di bagian atas yang bernama fathah dan dhommah, serta di
bagian bawah yang bernama kasrah, maka anak huruf Aksara Lampung
terletak di bagian atas, bawah, dan samping kanan huruf utama dengan
berbagai macam nama dan bunyi. Anak huruf atau bisa disebut dengan benah
surat ini memiliki fungsi dan peran masing-masing yang akan dijelaskan di
subbab berikutnya.
Aksara Lampung juga memiliki kekerabatan dengan Aksara Rejang, Rencong,
Sunda, sehingga Aksara Lampung terlihat mirip dengan aksara khas daerah
tersebut. Sebelum mengalami penyempurnaan, Aksara Lampung memiliki
sembilan belas karakter utama atau disebut dengan induk huruf atau kelabai
surat, anak huruf atau benah surat, dan tanda baca. Namun aksara yang
digunakan sebagai bahan ajar di sekolah dan yang digunakan saat ini telah
mengalami penyempurnaan, sehingga Aksara Lampung memiliki dua puluh
karakter kelabai surat, enam karakter benah surat di bagian atas, tiga karakter
8
benah surat di bagian bawah, tiga karakter benah surat di bagian kanan, dan
tanda baca.
2.1.1. Induk Huruf (Kelabai Surat)
Induk huruf adalah huruf-huruf utama yang digunakan pada Aksara Lampung,
sama halnya dengan huruf alfabet. Seperti yang dijelaskan pada bagian
sebelumnya, Aksara Lampung sebelum disempurnakan, induk huruf hanya
terdiri dari sembilan belas karakter yang terbagi menjadi tiga elemen, yaitu
elemen karakter utama atau disebut kelabai surat, kemudian anak huruf atau
disebut benah surat, dan tanda baca (Pudjiastuti, 2014). Saat ini aksara yang
digunakan masyarakat suku Lampung menggunakan aksara yang lebih
sederhana yang sudah mengalami penyempurnaan. Perbedaannya ada pada
karakter tambahan baru bernama “Gha” (H). Bentuk induk huruf yang belum
disempurnakan dijelaskan pada ilustrasikan Gambar 2.1.
Gambar 2.1. Induk huruf yang belum disempurnakan (Pudjiastuti, 2014).
9
Sedangkan bentuk induk huruf yang telah disempurnakan dan saat ini
digunakan oleh masyarakat suku Lampung dijelaskan pada Gambar 2.2 di
bawah ini.
Gambar 2.2. Induk huruf yang sudah disempurnakan (Junaidi, et al., 2011).
Struktur Aksara Lampung memiliki bentuk yang mirip dengan kurva terutama
bentuk kuadrat dan kurva tersebut mendominasi setiap huruf. Hururf-huruf
pada Aksara Lampung condong mengarah ke kanan-atas. Satu suku kata dapat
terbentuk dari satu aksara tanpa perlu menambahkan anak huruf, karena
komponen setiap induk huruf terdiri dari satu huruf konsonan dan satu huruf
vokal. Selain bentuk hurufnya yang unik, Aksara Lampung memiliki pelafalan
huruf yang mengganti bunyi hururf “r” dengan bunyi “gha” atau “kha”.
Bentuk induk huruf diperlihatkan pada Gambar 2.3. di bawah ini.
Gambar 2.3. Contoh induk huruf yang condong mengarah ke kanan-atas.
K g G
10
Sedangkan contoh huruf Aksara Lampung yang memiliki dua komponen
huruf induk dijelaskan pada Gambar 2.4. di bawah ini.
Gambar 2.4. Contoh bentuk huruf yang terdiri dari dua komponen huruf utama.
2.1.2. Anak Huruf (Benah Surat)
Anak huruf atau yang disebut dengan benah surat merupakan elemen dari
Aksara Lampung yang dapat mengubah bunyi pelafalan huruf induk. Seperti
penjelasan sebelumnya bahwa salah satu elemen Aksara Lampung adalah
anak huruf atau benah surat. Benah surat diletakkan disekitar induk huruf.
Benah surat dibedakan berdasarkan peletakkannya dan bunyinya. Setiap satu
induk huruf, Aksara Lampung memiliki pasangan berupa sebuah huruf
konsonan dengan sebuah huruf vokal a dalam satu kesatuan, sehingga semua
huruf akan diakhiri oleh huruf vokal a.
Benah surat pada Aksara Lampung diperlukan untuk mengubah bunyi huruf
vokal a yang memiliki satu kesatuan dengan huruf dasar menjadi bunyi huruf
vokal lain. Sehingga, pada Aksara Lampung, benah surat berperan penting
sebagai pengganti bunyi vokal dasar menjadi bunyi vokal yang lain. Oleh
karena itu, benah surat mempunyai peran tersendiri untuk membangun sebuah
r H
11
padanan kata. Benah surat memiliki sebelas bentuk yang dapat dilihat pada
ilustrasi Gambar 2.5. di bawah ini.
Gambar 2.5. Bentuk-bentuk benah surat pada Aksara Lampung.
Aksara Lampung yang berdiri sendiri tanpa benah surat disekitarnya,
menghasilkan bunyi huruf yang tidak mengalami perubahan. Benah surat
dapat dibedakan berdasarkan peletakan huruf, ada benah surat yang terletak
di bagian atas huruf, benah surat yang terletak di bagian bawah huruf, dan
benah surat yang terletak di samping kanan huruf. Ragam benah surat
tersebut dijelaskan pada subbab berikut.
2.1.2.1. Benah Surat Bagian Atas
Anak huruf atau benah surat merupakan sebagian benah surat yang terletak
di bagian atas huruf. Setiap benah surat memiliki nama-namanya tersendiri
dan bunyi tersendiri. Terdapat tiga dari enam benah surat yang memiliki
pelafalan yang sama dengan huruf vokal yang digunakan dalam alfabet yaitu
i, e (lafal huruf e lemah), dan é (lafal huruf e lebar). Bentuk-bentuk benah
surat beserta penjelasannya dapat dilihat pada ilustrasi Gambar 2.6 di halaman
selanjutnya.
12
Gambar 2.6. Bentuk-bentuk benah surat yang terletak di bagian atas huruf.
a. Ulan é (---e)
Ulan é memiliki bunyi e lebar seperti pada kata “enak” (aenk/) dan “elok”
(aeloK/).
b. Bicek e (---E)
Anak huruf bicek e memiliki keterkaitan dengan anak huruf ulan é namun
memiliki pelafalan yang berbeda. Bicek e memiliki bunyi e yang lemah
seperti pada kata “berat” (BErT/) dan “pesan” (FEsA).
c. Ulan i (---i)
Pelafalan anak huruf ulan i apabila bertemu dengan induk huruf akan
berubah menjadi huruf vokal i. Contoh pada huruf “ka” (q) apabila diberi
anak huruf ulan i akan berubah menjadi “ki” (ki).
d. Tekelubang (--X-), Redatas (--A-), dan Rejunjung (--R-)
Anak huruf tekelubang, redatas, dan rejunjung merupakan anak huruf yang
digunakan pada padanan kata yang berakhiran huruf konsonan seperti -ang,
13
-an, dan -ar, seperti pada kata “ruang” (ruaX), “bukan” (BukA), dan
“belajar” (BElJR).
2.1.2.2. Benah Surat Bagian Bawah
Benah surat bagian bawah adalah sebagian anak huruf Aksara Lampung yang
bisa diletakkan di bagian bawah huruf induk atau kelabai surat. Bentuk-
bentuk dasar anak huruf bagian bawah dijelaskan pada Gambar 2.7. berikut
ini.
Gambar 2.7. Bentuk-bentuk anak huruf yang terletak di bagian bawah huruf.
a. Bitan u (---U) dan Bitan o (---O)
Anak huruf bitan u dan bitan o memiliki beberapa persamaan, seperti nama
yang sama yaitu “bitan”, bentuk anak huruf yang sama-sama berupa garis
pendek, dan sama-sama terletak di bagian bawah huruf. Perbedaannya
hanya terletak pada bunyi pelafalannya saja. Apabila bitan u mengubah
bunyi huruf vokal a menjadi bunyi huruf vokal u, maka bitan o mengubah
bunyi huruf vokal a menjadi huruf vokal o. Contohnya untuk anak huruf
bitan u terdapat pada kata “lugu” (lugu) dan untuk anak huruf bitan o
terdapat pada kata “polos” (Folos/) dalam Bahasa Indonesia.
14
b. Tekelungau au (--W-)
Anak huruf tekelungau berbeda dengan kedua anak huruf lainnya, ketika
bitan u dan bitan o mengubah bunyi huruf vokal a menjadi bunyi huruf
vokal lain yaitu u dan o, maka tekelungau mengganti bunyi huruf vokal a
menjadi huruf vokal lain yang terdiri dari dua komponen huruf yaitu au
atau bisa disebut sebagai huruf diftong. Tekelungau digunakan pada sebuah
kata yang memiliki akhiran -au seperti pada contoh kata “ranjau” (rAZW).
2.1.2.3. Benah Surat Bagian Kanan
Anak huruf bagian kanan merupakan sebagian benah surat yang terletak di
bagian sebelah kanan huruf. Benah surat bagian kanan juga memiliki nama-
namanya tersendiri dan bunyi tersendiri. Benah surat yang dapat diletakkan
di samping kanan huruf memiliki tiga bentuk yang dapat dilihat pada ilustrasi
Gambar 2.8. di bawah ini.
Gambar 2.8. Bentuk anak huruf yang dapat diletakkan di samping kanan huruf.
a. Tekelingai ai (---I)
Tekelingai merupakan anak huruf yang mengganti bunyi huruf vokal a
menjadi huruf diftong yang terdiri dari dua komponen huruf vokal yaitu a
dan i. Anak huruf tersebut mengganti huruf vokal a menjadi -ai untuk kata
15
yang berakhiran huruf -ai. Contoh pada padanan kata “keledai” (qElEDI)
dan “ramai” (rMI).
b. Keleniah ah (---x)
Anak huruf keleniah merupakan salah satu anak huruf yang menggantikan
huruf vokal a menjadi dua komponen huruf yaitu a dan h yang bukan huruf
diftong. Keleniah menggnatikan huruf vokal a menjadi -ah pada padanan
kata yang terdapat huruf -ah. Keleniah memiliki keunikan bentuk yang
mirip dengan induk huruf “ha” (h). Contoh penggunaan keleniah terdapat
pada kata “lemah” (lEmx) dan “susah” (susx).
c. Nengen (/)
Tanda nengen merupakan tanda istimewa yang menyebabkan adanya
perbedaan pendapat. Pendapat pertama dinyatakan oleh Pudjiastuti dalam
Junaidi tahun 2016 bahwa nengen tergolong ke dalam anak huruf,
sedangkan pendapat kedua dinyatakan oleh Sabaruddin Sa dalam Junaidi
tahun 2016 bahwa nengen termasuk ke dalam tanda baca (Junaidi, 2016).
Nengen berfungsi untuk mematikan karakter a (vowel silencer) pada induk
huruf seperti pada kata “redatas” (rEDTS/) dan “padat” (gDT/).
Nengen dapat digunakan pada huruf-huruf tertentu saja seperti pada huruf
“sa” (s), “la” (l), “ka” (k), dan “ta” (t). Nengen tidak dapat digunakan
pada induk huruf “nga” (G), “na” (n), “ra” (r), “ya” (y), “wa” (w), dan
16
“ha” (h), karena karakter a (vowel silencer) pada huruf-huruf tersebut
dapat dimatikan dengan menggunakan tanda baca yang sudah ada dalam
sistem penulisan Aksara Lampung. Ragam tanda baca akan dijelaskan pada
subbab berikut.
2.1.3. Tanda Baca
Aksara Lampung memiliki tanda baca sama seperti sistem penulisan pada
umumnya. Aksara Lampung memiliki sepuluh tanda baca termasuk tanda
baca khas Lampung bernama “tanda mula” yang digunakan untuk memulai
tulisan pada saat menulis Aksara Lampung. Tanda baca tersebut memiliki
peran yang sama dengan tanda baca pada sistem penulisan pada umumnya.
Ilustrasi pada Gambar 2.9. merupakan bentuk tanda baca yang terdapat pada
sistem Aksara Lampung.
Gambar 2.9. Kumpulan tanda baca yang ada di Aksara Lampung.
2.2. Pengenalan Pola
Pengenalan pola merupakan salah satu cabang dari bidang kecerdasan buatan
(artificial intelegence). Menurut Duda dan Hart, pengenalan pola adalah
penentuan suatu objek fisik atau kejadian ke dalam salah satu atau beberapa
17
sampel (Duda, et al., 2000). Pengenalan pola mengelompokkan data
berdasarkan pola kelompoknya, yang tujuannya adalah proses belajar deteksi
pola-pola eksplisit dan mengklasifikasikan objek ke dalam sejumlah kategori.
Rancangan sistem pengenalan pola pada dasarnya melibatkan tiga aspek yaitu
akuisisi data dan preprocessing, representasi data, dan pengambilan
keputusan. Pengenalan pola akan belajar dari satu set contoh atau disebut
dengan training dengan menggunakan empat pendekatan yaitu pencocokan
template, klasifikasi statistik, dan jaringan saraf. Namun, model-model
pendekatan tersebut tidak selalu independent karena terdapat metode
pengenalan pola yang sama tetapi menggunakan interpretasi yang berbeda
(Anil K, et al., 2000).
Banyak peneliti yang menjadikan pengenalan pola sebagai topik utama
penelitian mereka, karena pengenalan pola dapat digunakan untuk
menyelesaikan beberapa persoalan yang dihadapi oleh manusia. Contoh yang
sering ditemukan dalam kehidupan sehari-hari misalnya pengenalan pola sidik
jari yang sekarang digunakan sebagai absensi automatis di kantor-kantor,
kemudian pengenalan pola nomor polisi sebagai alat yang membantu polisi
dalam pengwasan lalu lintas.
2.2.1. Tujuan dan Implementasi Pengenalan Pola
Pengenalan pola bertujuan untuk menentukan kelompok atau sampel pola
berdasarkan ciri-ciri yang dimiliki oleh pola tersebut. Dengan kata lain,
pengenalan pola membedakan suatu objek dengan objek lain. Selain itu,
18
pengenalan pola bertujuan untuk mengklarifikasikan beberapa mekanisme
yang sulit saat pembuatan keputusan dan mengautomasikan fungsi-fungsi
tersebut menggunakan komputer.
Oleh sebab itu, pengenalan pola dapat diimplementasikan menjadi beberapa
konsentrasi untuk menyelesaikan masalah yang lebih kompleks lagi
(Fukunaga, 1990). Beberapa konsentrasi tersebut adalah OCR (Optical
Character Recognition), pengenalan pola pada sistem biometrik, diagnosa
penyakit di bidang medis, pengenalan suara, identifikasi sidik jari, dan
aplikasi pada bidang militer.
2.3. Identifikasi Penulis
Identifikasi penulis merupakan pengenalan penulis berbasis tulisan tangan
dengan memproses mencocokan tulisan tangan yang tidak diketahui terhadap
data sampel yang penulisnya telah diketahui sebelumnya (Louloudis, et al.,
2011). Menurut Al-Maadeed, dua konsep dasar yang dianggap penting pada
identifikasi penulis adalah tidak ada dua orang yang menulis dengan sama
persis dan tidak ada seorangpun yang menulis dengan gaya tulisan yang sama
sebanyak dua kali (Al-Madeed, 2012). Tujuan dari identifikasi Penulis adalah
untuk menentukan penulis teks tulisan tangan di antara sejumlah penulis yang
dikenal dengan syarat database fitur khusus setiap penulis harus dibangun
sebelumnya. Teksnisnya ketika dilakukan proses identifikasi akan dihitung
dan dibandingkan dengan database yang telah disimpan. Hasil identifikasi
penulis yang cocok akan memiliki tingkat kesamaan yang tinggi. Terdapat dua
19
pendekatan yang dapat dilakukan untuk mengidentifikasi penulis, yaitu
dengan analisis berdasarkan karakter dan pendekatan kedua dengan analisis
tekstur dari dokumen (Fiel & Sablatnig, 2012). Pada penelitian ini pendekatan
yang dilakukan adalah dengan menggunakan karakter yang akan dibahas
secara lengkap pada bab selanjutnya.
Pengenalan penulis dengan menggunakan sampel teks yang belum diketahui
penulisnya berkaitan dengan identifikasi penulis dan verifikasi penulis.
Identifikasi penulis secara umum dibedakan menjadi dua bagian, yaitu
identifikasi penulis dan verifikasi penulis. Identifikasi penulis berkaitan
dengan pencarian secara “one-to-many” (Siddiqi & Vincent, 2009). Pencarian
“one-to-many” adalah pencarian pada sebuah dokumen yang tidak diketahui
penulisnya, dengan tujuan untuk menentukan penulisnya berdasarkan
referensi dokumen-dokumen yang telah diketahui penulisnya. Sedangkan
verifikasi penulis adalah membandingkan dokumen secara “one-to-one”
dengan dua sampel tulisan tangan yang akan diketahui bahwa penulis tersebut
ditulis oleh orang yang sama atau bukan.
Menurut Schlapbach (2007) yang dikutip oleh Awaida et. al tahun 2012,
identifikasi penulis merupakan proses menentukan beberapa kandidat penulis
pada set dokumen melalui beberapa contoh karakteristik tulisan tangan.
Sedangkan menurut pernyataan Bradford (1992) dalam Awaida et. al tahun
2012 menjelaskan bahwa verifikasi penulis adalah proses membandingkan
tulisan tangan yang tidak diketahui penulisnya dengan beberapa sampel
20
tulisan tangan yang diperoleh dari sumber yang diketahui. Verifikasi penulis
mencakup diterima atau tidaknya keputusan tersebut terhadap kriteria,
sedangkan identifikasi penulis adalah mencakup hal menklasifikasi “one-to-
many” yaitu mencari penulisnya siapa berdasarkan tulisan tangan tersebut
(Awaida & Mahmoud, 2012).
2.4. Preprocessing
Preprocessing adalah serangkaian proses yang dilakukan setelah akuisisi data
untuk mencapai tingkat kualitas gambar tertentu. Citra mentah dari dokumen
tulisan tangan dalam langkah ini diubah menjadi citra perantara, bisa berupa
citra grayscale maupun citra biner. Dari citra perantara tersebut akan
didapatkan fitur-fitur yang akan diekstraksi di langkah selanjutnya. Citra
perantara tersebut dapat meminimalkan variasi fitur yang tidak penting,
sehingga fitur-fitur yang berpengaruh dapat dipertahankan sehingga dapat
meningkatkan akurasi pengenalan (Junaidi, 2016).
Seperti yang sudah dijelaskan di paragraf sebelumnya, salah satu tujuan dari
melakukan preprocessing adalah untuk mereduksi kuantitas fitur yang tidak
penting sehingga proses ekstraksi fitur dapat berjalan secara efisien. Namun
tujuan lain melakukan tahap preprocessing adalah sebagai berikut:
1. Untuk mengurangi noise atau titik-titik yang bukan bagian citra utama.
2. Untuk menurunkan kompleksitas representasi citra menjadi channel
tunggal dengan melakukan binerisasi.
21
3. Untuk menormalisasi citra aktual sesuai dengan keperluan proses
selanjutnya.
2.4.1. Reduksi Noise
Menurut Umbaugh (1999) dalam Jamil et. al tahun 2008 menjelaskan
mengenai pengertian noise dalam bidang olah citra adalah informasi gangguan
yang tidak diinginkan dan dapat mencemari gambar. Pada proses akuisisi citra
digital, adanya perubahan gambar optik menjadi sinyal listrik merupakan
sumber utama noise. Faktor yang mempengaruhi adanya noise yaitu
menyimpangnya data digital yang diterima oleh kamera, ukuran megapixel
dan resolusi yang rendah (Jamil, et al., 2008) Kualitas dari citra yang
diakuisisi akan berdampak pada baik atau tidaknya hasil dari akurasi pada saat
melakukan pengenalan objek. Variabel noise yang merupakan salah satu
variabel yang tidak diinginkan, sehingga perlu dikurangi atau dihilangkan
agar tidak menghambat proses ekstraksi fitur dan mengurangi kualitas citra.
Keadaan dokumen seperti tinta yang sudah pudar dan umur dokumen yang
sudah tua juga merupakan faktor pendukung adanya noise pada citra. Contoh
gambar sebelum noise dibersihkan dan gambar setelah noise dibersihkan
diilustrasikan pada Gambar 2.10. di halaman selanjutnya.
22
Gambar 2.10. Gambar sebelum noise dihilangkan (kiri) dan gambar sesudah
noise dihilangkan (kanan) (Garnett, et al., 2005).
2.4.2. Binerisasi Gambar
Binerisasi gambar dilakukan untuk mengkonversi gambar mentah menjadi
gambar hitam dan putih. Binerisasi gambar juga dilakukan pada bagian
background. Tujuan dari binerisasi adalah untuk menajamkan objek sebagai
latar depan dari background-nya. Binerisasi gambar dapat dibedakan menjadi
dua, yaitu global dan local binarization. Binersiasi dengan global binarization
menggunakan single threshold yang bisa dihitung secara heuristik dan secara
statistik terhadap keseluruhan gambar. Sedangkan local binarization
menggunakan pixel terdekat untuk menghitung threshold dan diaplikasikan
hanya ke pixel yang dihitung. Contoh dari binerisasi gambar terdapat pada
ilustrasi Gambar 2.11.
Gambar 2.11. Contoh perangko Jerman yang dikonversi ke dalam format
biner, (Junaidi, 2016).
23
2.4.3. Normalisasi Gambar
Normalisasi data pada tulisan tangan perlu dilakukan karena adanya
keberagaman pada bentuk tulisan, sehingga perlu dilakukan standarisasi
tulisan dengan melakukan transformasi agar tulisan tangan tersebut menjadi
seragam. Terdapat tipe-tipe normalisasi, seperti normalisasi terhadap
kemiringan tulisan, kemiringan arah penulisan, dan normalisasi ukuran tulisan.
Normalisasi kemiringan atau kemencongan tulisan dilakukan apabila tulisan
tangan tersebut terlalu miring. Contoh normalisasi kemiringan pada bentuk
tulisan tangan, terdapat pada ilustrasi Gambar 2.12 di bawah ini.
Gambar 2.12. Contoh proses normalisasi kemiringan pada bentuk tulisan
(proses slant) (Virajitha, et al., 2012).
Sedangkan contoh proses normalisasi pada arah tulisan terdapat pada ilustrasi
Gambar 2.13 di bawah ini.
Gambar 2.13. Contoh proses normalisasi kemiringan pada arah tulisan (proses
skew) (Virajitha, et al., 2012).
24
2.5. Ekstraksi Fitur
Ekstraksi fitur merupakan proses pengambilan nilai ciri data yang paling
penting dari satu entitas data. Tahapan ekstraksi fitur yaitu dengan
megekplorasi bagian penting yang menentukan bentuk objek secara tepat dan
unik. Ekstraksi fitur bertujuan untuk mengekstraksi informasi yang relevan
menjadi ciri setiap kelas. Pada tahapan ekstraksi fitur, setiap objek diwakili
oleh fitur yang relevan untuk dijadikan sebagai identitasnya (Kumar & Kumar
Bhatia, 2014).
Ekstraksi fitur juga merupakan salah satu tahapan pada metodologi
identifikasi penulis dengan mengambil nilai ciri dari sebuah objek. Pada
umumnya, ekstraksi fitur memiliki masalah yang kompleks tergantung pada
domain masalah utamanya. Bagian ekstraksi fitur membutuhkan banyak
pengetahuan tentang domain masalah tersebut dikarenakan ekstraksi fitur
dapat dilakukan berulang kali untuk mendapatkan nilai ciri tersebut. Sebagai
contoh, sebuah ekstraksi fitur yang sangat bagus untuk identifikasi jenis ikan,
pasti tidak akan cocok untuk mengidentifikasi sidik jari (Duda, et al., 2000).
Tujuan melakukan tahapan ekstraksi fitur adalah untuk mendapatkan nilai-
nilai ciri karakteristik dari objek untuk dapat dikenali pada saat proses
pengenalan pola. Selain itu untuk mengukur atribut pola yang bersangkutan
pada objek. Ada banyak jenis ekstraksi fitur untuk mendapatkan nila-nilai ciri
sebuah objek, seperti ekstraksi fitur berdasarkan feature direction,
transformasi Hough, transformasi Fourier, representasi Line-Based,
25
transformasi linear, aproksimasi bentuk, dan sebagainya (Cheriet, et al., 2007).
Pada penelitian ini digunakan salah satu metode ekstraksi fitur berdasarkan
transformasi linear, yaitu PCA (Pincipal Component Analysis).
2.5.1. Principal Component Analysis (PCA)
Principal Component Analysis (PCA) adalah teknik yang termasuk dalam
sampel metode analisis faktor yang dapat ditemukan dalam berbagai kajian
seperti neural networks, pemrosesan gambar dan sinyal, serta machine
learning (Jain & Ko, 2008). PCA juga dikenal dengan nama Karhunen-Loeve
Transformation (KLT) dan Eigenscape Projection yang merupakan ekstraksi
fitur klasik dan teknik representasi data yang banyak digunakan dalam bidang
pengenalan pola dan computer vision. PCA digunakan untuk mengurangi
vektor dimensi dalam mengenali gambar. PCA merupakan teknik umum
untuk mengenali pola dengan data dimensi yang tinggi (Karamizadeh, et al.,
2013).
Transformasi linear pada PCA biasanya digunakan untuk mengurangi dimensi
fitur, dan juga dapat meningkatkan akurasi pada klasifikasi. Dimensi fitur
yang dikurangi merupakan penyederhanaan “seperangkat fitur” yang akan
dilakukan identifikasi menjadi “subset fitur” yang ukurannya lebih kecil dari
fitur aslinya. “Seperangkat fitur” yang telah ditransformasikan menjadi
“subset fitur” pada dasarnya memiliki informasi yang sama seperti
“seperangkat fitur” aslinya (Cheriet, et al., 2007). Penyederhanaan
26
“seperangkat fitur” dimensi dalam metode PCA disebut sebagai metode
reduksi dimensi.
Reduksi dimensi digunakan untuk mengompres kumpulan informasi yang
“sama” dan merekognisi objek melalui informasi utamanya. Hasil reduksi
dimensi tersebut merupakan “subset fitur” yang didapatkan dari perolehan
vektoreigen, berdasarkan perhitungan matriks kovarian (Kaur, et al., 2015).
Secara teori sebuah objek train memiliki matriks (matriks A) dengan dimensi
𝑀 𝑏𝑎𝑟𝑖𝑠 × 𝑁 𝑘𝑜𝑙𝑜𝑚 yang direpresentasikan ke dalam bentuk matriks vektor
kolom (𝑀 × 𝑁) × 1. Objek pada trainingset berjumlah P gambar, sehingga
objek-objek pada trainingset harus direpresentasikan dalam bentuk matriks
vektor kolom berukuran (𝑀 × 𝑁) × 𝑃 . Hal tersebut juga dilakukan pada
testingset. Matriks X yang berisi matriks-matriks vektor kolom tersebut
memiliki peran untuk menghitung besaran vektoreigen. Proses mengubah
sebuah matriks dari gambar train akan dijelaskan pada ilustrasi Gambar 2.14
di bawah ini.
Gambar 2.14. Ilustrasi perubahan matrik (𝑀 × 𝑁) menjadi vektor kolom
(𝑀 × 𝑁) × 1 (Paul & Al Sumam, 2012).
27
2.5.1.1. Algoritma Principal Component Analysis (PCA)
Menurut Paul dan Suman pada (2012), algoritma yang digunakan pada metode
ekstraksi fitur menggunakan PCA memiliki tujuan untuk mencari nilai eigen.
Tahapan mencari nilai eigen dijelaskan pada uraian algoritma berikut ini (Paul
& Al Sumam, 2012):
a. Langkah 1: Menyiapkan objek gambar yang akan digunakan
Objek gambar yang akan digunakan adalah gambar I1, I2, I3, I4, …………, IM.
objek gambar yang digunakan harus memiliki ukuran yang sama.
b. Langkah 2: Menyiapkan dataset
Setiap objek-objek gambar Ii, di transformasikan ke dalam bentuk vektor dan
dijadikan sebagai data training set S.
𝑆 = {Γ1, Γ2, Γ3, Γ4, ……… , Γ𝑀}
Misalnya, sebuah gambar (M) memiliki ukuran (N2) sebesar 1024 piksel,
maka setiap gambar ditransformasikan bentuknya menjadi vektor berukuran
𝑁2 × 1 dan disesuaikan ke dalam data training set. Untuk alasan
kesederhanaan, objek-objek gambar diasumsikan berukuran 𝑁 × 𝑁 dan akan
menghasilkan titik pada ruang dimensi N2. Gabungan objek gambar tersebut
setelah disatukan kemudian akan dipetakan pada kumpulan titik-titik N2 di
ruang yang besar.
c. Langkah 3: Menghitung rata-rata vektor dataset
Rata-rata vektor dataset (Ψ) dapat dihitung dengan menggunakan formula (2.1)
di halaman selanjutnya:
28
Ψ = 1
𝑀∑Γ𝑛
𝑀
𝑛=1
(2.1)
Catatan:
Ψ ∶ rata-rata vektor dataset 𝑀 ∶ jumlah dataset
𝑛 ∶ indeks data N dari 1 s.d. n Γ𝑛 ∶ gambar train ke n
d. Langkah 4: Mensubstraksi dengan rata-rata vektor dataset
Rata-rata vektor dataset disubstraksi dari gambar aslinya ( Γ𝑖 ) dan akan
disimpan di dalam variabel Φ𝑖, dengan menggunakan formula (2.2) di bawah
ini:
Φ𝑖 = Γ𝑖 − Ψ (2.2)
Catatan:
Φ𝑖 ∶ substraksi mean vektor dataset ke-i
Γ𝑖 ∶ vektor gambar ke-I
Ψ ∶ mean vektor dataset
e. Langkah 5: Menghitung matriks kovarians
Cara untuk mendapatkan matriks kovarians C dengan menggunakan formula
di bawah ini:
𝐶 =1
𝑀∑Φ𝑛
𝑀
𝑛=1
Φ𝑛𝑇 (2.3)
Catatan:
𝐶 ∶ substraksi rata-rata vektor dataset
𝑀 ∶ jumlah dataset
Φ𝑛 ∶ substraksi rata-rata vektor dataset ke-n
Φ𝑛𝑇 ∶ substraksi rata-rata vektor dataset ke-n ditranspose
29
Formula (2.2) dapat disederhanakan menjadi 𝐶 = 𝐴 × 𝐴𝑇 dimana 𝐴 =
[Φ1, Φ2, Φ3, Φ4, ……… ,Φ𝑀].
Untuk memudahkan proses komputasi dalam mencari nilai eigen agar lebih
efisien rumus 𝐶 = 𝐴 × 𝐴𝑇dapat diubah menjadi 𝐶 = 𝐴𝑇 × 𝐴. Karena apabila
gambar berukuran 256 × 256 menggunakan rumus matriks kovarians 𝐶 =
𝐴 × 𝐴𝑇 , maka akan membutuhkan perhitungan yang besar. Serta, saat
menghitung nilai eigen akan ada 65,356 eigen yang dihasilkan. Sehingga
untuk meminimalisir nilai eigen yang dihasilkan dari bantuan matriks
kovarians, digunakan rumus 𝐶 = 𝐴𝑇 × 𝐴 dimana 𝐴 =
[Φ1, Φ2, Φ3, Φ4, ……… ,Φ𝑀].
f. Langkah 6: Menghitung vektoreigen dan eigenvalues menggunakan matriks
kovarians.
Vektoreigen dan eigenvalue dihitung dengan bantuan nilai kovarians C, yaitu
dengan menggunakan formula (2.4) di bawah ini:
𝑢𝑖 = 𝐴 × 𝐶 (2.4)
Catatan:
u𝑖 ∶ vektoreigen
𝐴 ∶ [Φ1, Φ2, Φ3, Φ4, ……… ,Φ𝑀] 𝐶 ∶ matriks kovarians
g. Langkah 7: Eliminasi elemen matriks vektoreigen
Hasil vektoreigen yang telah dihitung dari rumus
𝑢𝑖 = 𝐴 × 𝐶 dieliminasi elemen matriksnya, agar fitur yang digunakan hanya
fitur-fitur tertentu yang dapat merepresentasikan objek.
30
h. Langkah 8: Menghitung proyeksi dataset menjadi eigenspace
Gambar-gambar train yang telah melewati proses hitung rata-rata hingga
proses hitung nilai vektoreigen, tahapan selanjutnya adalah menghitung
proyeksi dataset menjadi eigenspace dengan menggunakan formula di bawah
ini.
𝜔𝑖 = 𝑢𝑖𝑇 × (Γ𝑖 − Ψ) (2.5)
Catatan:
𝜔𝑖 ∶ proyeksi gambar
𝑢𝑖𝑇 ∶ vektoreigen ditranspose
Γ𝑖 ∶ vektor gambar ke-i
Ψ ∶ rata-rata vektor dataset
2.6. Euclidean Distance
Teknik pengenalan pola bertujuan untuk mengklasifikasikan berdasarkan
pengukuran kuantitatif fitur atau ciri khusus dari suatu objek. Metode yang
digunakan pada pengenalan pola terdiri dari metode supervised, metode
unsupervised, metode jarak, dan lain-lain. Metode jarak digunakan untuk
menentukan derajat kesamaan atau ketidaksamaan pada dua fitur vektor
(Wurdianarto, et al., 2014). Terdapat berbagai macam jenis metode jarak yaitu
City Block Distance, Manhattan Distance, Euclidean Distance, Minkowski
Distance, dan lain-lain. Metode jarak yang penelitian ini gunakan adalah
Euclidean distance. Euclidean distance digunakan karena metode jarak
tersebut yang paling sederhana sehingga dapat meminimalisir proses
komputasi.
31
Euclidean distance adalah pengukuran yang digunakan untuk menghitung
kemiripan dua vektor, yang mempresentasikan dua objek dengan menghitung
jarak antara keduanya. Euclidean distance dapat dihitung dengan
menggunakan persamaan (2.6) di bawah ini.
𝑒𝑢𝑐 = √∑(Γ𝑖𝑛 − Γ𝑗𝑛)2
𝑀
𝑛=1
(2.6)
Catatan:
𝑒𝑢𝑐 ∶ jarak Euclidean
𝑀 ∶ jumlah data dalam bentuk vektor
Γ𝑖𝑛 ∶ vektor gambar trainingset
Γ𝑗𝑛 ∶ vektor gambar testingset
Seperti penjelasan sebelumnya, Euclidean distance termasuk ke dalam bagian
klasifikasi, karena Euclidean distance dapat menentukan kemiripan objek dan
mengelompokkannya berdasarkan jarak antar objek tetangganya. Semakin
kecil jarak yang dihasilkan oleh perhitungan Euclidean distance, maka akan
semakin mirip kedua objek tersebut. Pada penelitian ini, Euclidean deistance
menetukan derajat kemiripan penulis berdasarkan jarak antara data trainingset
dengan data testingset. Penerapan Euclidean distance pada penelitian ini
adalah dengan menggunakan proyeksi gambar trainingset dan proyeksi
gambar testingset.
32
III. METODOLOGI PENELITIAN
Tahapan penelitian akan dilakukan di Jurusan Ilmu Komputer Universitas Lampung
pada Semester Ganjil Tahun Ajaran 2018/2019. Urutan tahapan tersebut dimulai dari
preprocessing hingga post processing. Selain tahapan umum tersebut, pada bab ini juga
diuraikan tentang tahapan awal sebelum memasuki tahapan baku, yaitu pra-penelitian
dan persiapan dataset. Penjelasan secara lengkap disajikan pada subbab-subbab berikut
ini.
3.1. Pra Penelitian
Pra-penelitian merupakan tahapan awal sebelum penelitian dilakukan, dengan
mempersiapkan beberapa hal yang dibutuhkan sebagai alat pendukung proses
penelitian. Persiapan tersebut terdiri dari studi literatur dan persiapan dataset
yang dijelaskan pada subbab selanjutnya.
3.1.1. Studi Literatur
Studi literatur bertujuan untuk meningkatkan pemahaman mengenai teori-
teori yang relevan, agar dapat memberikan gagasan yang kuat untuk
menyusun kerangka konsep metodologi penelitian yang didasari oleh kajian
literatur. Pada penelitian ini studi literatur membantu mengembangkan konsep
metodologi tersebut yang sesuai dengan latar belakang masalah.
33
3.1.2. Dataset
Penelitian ini menggunakan dataset yang sudah melalui proses pengolahan
awal. Dataset tersebut merupakan Lampung Dataset (Junaidi, et al., 2011)
yang tersedia secara bebas pada situs Technische Universität Dortmund untuk
penelitian pada bidang pengenalan pola. Sumber dataset telah tersedia dalam
bentuk file image dan annotasi yang dapat di unduh pada situs
http://patrec.cs.tu-dortmund.de/cms/en/home/Resources/index.html. Dataset
tersebut berisi sebanyak 82 dokumen gambar tulisan tangan Aksara Lampung
yang sudah mengalami preprocessing (Junaidi, et al., 2011).
3.2. Preprocessing
Preprocessing merupakan salah satu bagian dari tahapan baku yang mengolah
citra gambar untuk mencapai tingkat kualitas tertentu. Hasil citra gambar yang
sudah diolah akan dijadikan sebagai citra perantara sebelum dilakukan proses
ekstraksi ciri sebagai parameter identifikasi. Sub-sub tahapan pada
preprocessing ini meliputi noise reduction, binerisasi gambar, dan normalisasi
data. Penelitian ini tidak melakukan tahapan preprocessing, dikarenakan
dataset telah menyediakan gambar yang telah dinormalisasi menjadi ukuran
32×32 piksel pada penelitian sebelumnya, (Junaidi, et al., 2011).
34
3.3. Identifikasi Penulis
Proses dalam mengidentifikasi tulisan Aksara Lampung terdiri dari beberapa
tahap. Tahapan tersebut dimulai dari pemilihan karakter secara khusus hingga
pengukuran kinerja akurasi. Tahapan secara lengkap diilustrasikan pada
Gambar 3.15.
Gambar 3.15. Metode penelitian identifikasi penulis pada dokumen tulisan
tangan Aksara Lampung.
35
3.3.1. Pembagian Karakter
Informasi jumlah karakter pada setiap dokumen Aksara Lampung telah
diketahui dan proses pemilihan dapat dilakukan secara langsung. Dataset
dibagi menjadi dua bagian, pertama adalah dataset yang dijadikan sebagai
trainingset dan bagian kedua adalah dataset yang akan digunakan untuk
identifikasi penulis. Kemudian secara random karakter dipilih dari masing-
masing dokumen yang ada di folder trainingset dan folder dataset uji.
Pemilihan karakter dilakukan sebagai salah satu cara untuk mendapatkan hasil
identifikasi yang optimal.
3.3.2. Ekstraksi Fitur Menggunakan PCA
Ekstraksi fitur merupakan suatu pengambilan nilai ciri dari sebuah objek.
Nilai yang didapatkan akan dianalisis pada tahapan selanjutnya (Duda, et al.,
2000). Nilai-nilai yang dianalisis pada tahapan selanjutnya akan menjadi
pembeda antara satu objek dengan objek yang lain. Karakter-karakter yang
sudah terpilih sebelumnya diekstraksi, dicari nilai pembedanya serta dianalisis
nilai yang sudah didapatkan dengan menggunakan Principal Component
Analysis (PCA).
Metode ekstraksi fitur menggunakan PCA adalah metode ekstraksi fitur
berdasarkan perhitungan nilai eigen dari trainingset. Terdapat beberapa
tahapan di dalam metode ekstraksi fitur menggunakan PCA sebelum
penelitian sampai pada tahap identifikasi penulis sesuai dengan algoritma
36
yang telah dijelaskan pada bab tinjauan pustaka. Tahapan-tahapan ekstraksi
fitur PCA diilustrasikan pada Gambar 3.16 di bawah ini.
Gambar 3.16. Tahapan fitur ekstraksi PCA (Paul & Al Sumam, 2012).
3.3.3. Training Identifikasi Penulis
Training identifikasi penulis dilakukan setelah tahapan ekstraksi fitur.
Training identifikasi penulis dilakukan pada saat perhitungan nilai proyeksi
gambar train terpusat berlangsung. Setiap vektoreigen yang diproyeksikan
dari setiap aksara akan menjadi fitur vektor. Fitur vektor tersebut juga
memiliki dimensi yang sudah direduksi. Kumpulan-kumpulan nilai fitur
vektor tersebut yang akan digunakan sebagai referensi untuk menentukan
kemiripan yang akan dilakukan pada tahap identifikasi penulis. Tahapan
training identifikasi penulis diilustrasikan pada Gambar 3.17.
37
Gambar 3.17. Tahapan training identifikasi penulis (Paul & Al Sumam, 2012).
3.3.4. Identifikasi Penulis
Langkah identifikasi penulis dilakukan ketika serangkaian tahapan training.
Tahapan identifikasi penulis bertujuan untuk menentukan apakah dapat
mengenali penulisnya setelah dilakukan serangkaian proses ekstraksi fitur
pada tahap sebelumnya. Proses identifikasi penulis merupakan tahapan yang
terpisah dengan melanjutkan proses training, namun secara teknis hampir
sama dengan proyeksi gambar train. Proses identifikasi penulis menggunakan
dokumen yang dipilih secara acak tanpa diketahui penulisnya. Nilai masing-
masing proyeksi gambar train dan gambar test akan dibandingkan dengan
meminimalkan nilai Euclidean distance. Tahapan identifikasi penulis
digambarkan pada Gambar 3.18 di bawah ini.
Gambar 3.18. Tahapan identifikasi penulis (Paul & Al Sumam, 2012).
38
3.3.5. Pengukuran Hasil Identifikasi
Setelah training dan identifikasi penulis dilakukan, maka akan didapatkan
hasil keakuratan identifikasi penulisnya. Hasil kinerja identifikasi penulis
menggunakan Principal Component Analysis (PCA) dapat dinyatakan dengan
membagi jumlah data prediksi yang cocok dengan jumlah data input prediksi
dan dikalikan dengan 100%, atau dalam matematika dinyatakan dengan rumus
yang tertera dibawah ini.
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 𝐾𝑒𝑐𝑜𝑐𝑜𝑘𝑎𝑛(%) = (
Σ𝐷𝑎𝑡𝑎 𝐶𝑜𝑐𝑜𝑘
ΣData Input Pencocokan) × 100% (3.1)
3.4. Analisis Singkat Kesalahan Identifikasi Penulis
Tahapan analisis singkat yang dapat dilakukan yaitu dengan mengamati faktor
yang paling memungkinkan yang menjadi penyebab tahapan identifikasi
penulis gagal mengidentifikasi penulis berdasarkan karkater yang terpilih.
66
V. SIMPULAN DAN SARAN
5.1. Simpulan
Kesimpulan yang dapat diambil berdasarkan penelitian yang telah dilakukan
adalah sebagai berikut:
1. Metode ekstraksi fitur Principal Component Analysis (PCA) telah berhasil
diaplikasikan untuk proses identifikasi penulis dokumen aksara Lampung.
2. Akurasi tertinggi didapatkan pada testingset dengan sampel gambar
tunggal, tingkat akurasi tersebut sebesar 82,92% lebih tinggi dibandingkan
akurasi testingset dengan sampel lima gambar dengan tingkat akurasi
sebesar 28,29%.
5.2. Saran
Saran yang dapat diberikan untuk penelitian selanjutnya adalah sebagai berikut:
1. Mengimplementasikan metode ekstraksi fitur Principal Component
Analysis (PCA) pada identifikasi penulis berdasarkan baris maupun
berdasarkan dokumen.
2. Menggunakan metode ekstraksi fitur Principal Component Analysis (PCA)
dengan mereduksi dimensi fitur-fiturnya.
67
3. Mengembangkan proses identifikasi penulis pada dokumen tulisan aksara
Lampung dengan menggunakan metode klasifikasi lain seperti Support
Vektor Machine (SVM), Naïve Bayes, atau Decision Tree.
68
DAFTAR PUSTAKA
Al-Madeed, S., 2012. Text-Dependent Writer Identificaion for Arabic Handwriting.
Journal of Electrical and Computer Engineering, Volume 2012, pp. 1-8.
Andhifani, W. R., 2013. Naskah Ulu Tanduk Kerbau: Sebuah Kajian Filologi. Forum
Arkeologi, 26(2), pp. 145-152.
Anil K, J., Duin, R. P. & Mao, J., 2000. Statistical Pattern Recognition: A Review.
IEEE Transactions on Pattern Anaysis and Machine Intelligence, 22(1), pp. 4-
37.
Awaida, S. M. & Mahmoud, S. A., 2012. State of The Art in off-line Writer
Identification of Handwritten Text and Survey of Writer Identification of Arabic
Text. Academic Journals: Educational Research and Revies, Volume 7, pp. 445-
463.
Bulacu, M. & Lambert, S., 2005. A Comparison of Clustering Methods for Writer
Identification and Verification. Seoul, IEEE Computer Society.
Chandra Paul, L. & Al Sumam, A., 2012. Face Recognition Using Principal
Component Analysis Method. International Journal of Advanced Research in
Computer Engineering & Technology (IJARCET), 1(9), pp. 135-139.
Cheriet, M., Kharma, N., Liu, C.-L. & Suen, C. Y., 2007. Character Recognition
Systems A Guide for Students and Practitioners. New Jersey: John
Willey&Sons .Inc.
Duda, R. O., Hart, P. E. & Stork, D. G., 2000. Pattern Classification. New York: Wiley.
Fiel, S. & Sablatnig, R., 2012. Writer Retrieval and Writer Identification using Local
Features. USA, IEEE.
Fukunaga, K., 1990. Introduction to Statistical Pattern Recognition 2nd Edition.
s.l.:Academic Press.
69
Garnett, R., Huegerich, T., Chui, C. & He, W., 2005. A Universal Noise Removal
Algorithm with an Impulse Detetctor. IEEE Transactions on Image Processing,
14(11), pp. 1747-1754.
Jain, G. & Ko, J., 2008. Handwritten Digits Recognition Project Report, Toronto: -.
Jamil, N., Sembok, T. M. T. & Abu Bakar, Z., 2008. Noise Removal and Enhancement
of Binary Images Using Morphological Operations. Kuala Lumpur, IEEE.
Junaidi, A., 2016. Lampung Handwritten Character Recognition, Dortmund.
Junaidi, A., Vadja, S. & A. Fink, G., 2011. Lampung - A New Handwritten Character
Benchmark: Database, Labeling and Recognition. Beijing.
Karamizadeh, S., Abdullah, S. M., Manaf, A. A. & Zamani, M., 2013. An Overview of
Principal Component Analysis. Journal of Signal and Information Processing,
4(3), pp. 173-175.
Kaur, A., Singh, S. & Taqdir, 2015. Face Recognition Using PCA (Principal
Component Analysis) and LDA (Linear Discriminant Analysis) Techniques.
International Journal of Advanced Research in Computer and Communication
Engineering, 4(3), pp. 308-310.
Kumar, G. & Kumar Bhatia, P., 2014. A Detailed Review of Feature Extraction in
Image Processing Systems. India, IEEE.
Louloudis, G., Stamatopoulus, N. & Gatos, B., 2011. ICDAR 2011 Writer
Identification Contest. Beijing, IEEE.
Miller, C., 2010. A Gujarati Origin for Scripts of Sumatra, Sulawesi and the
Philippines. California, Berkeley Linguistic Society.
Paul, L. C. & Al Sumam, A., 2012. Face Recognition Using Principal Component
Analysis Method. International Journal of Advanced Research in Computer
Engineering & Technology (IJARCET), I(9), pp. 135-139.
Pudjiastuti, T., 2014. Lampong Scripts: The Writing Tradition That Almost
Disappeared. Tokyo, Research Intitute for Languages and Cultures of Asia and
Africa.
Siddiqi, I. & Vincent, N., 2009. A Set of Chain Code Based Features for Writer
Recognition. Spain, IEEE.
Virajitha, Boggavarapu, L. P., Vaddi, R. & Vankayalapati, H., 2012. Simple and
Effective Techniques for Skew Correction, Slant Correction and Core-Region
Detection for Cursive. Berlin, Springer.
70
Wurdianarto, S. R., Novianto, S. & Rosyidah, U., 2014. Perbandingan Euclidean
Distance dengan Canbera Distance pada Face Recognition. Jurnal
Techno.COM, 13(1), pp. 31-37.
Zuo, L., Wang, Y. & Tan, T., 2002. Personal Handwriting Identification Based on
PCA. Beijing, SPIE.