PENGENALAN TULISAN TANGAN AKSARA …digilib.unila.ac.id/55748/3/SKRIPSI FULL TEKS TANPA BAB...Puji...
Transcript of PENGENALAN TULISAN TANGAN AKSARA …digilib.unila.ac.id/55748/3/SKRIPSI FULL TEKS TANPA BAB...Puji...
PENGENALAN TULISAN TANGAN AKSARA LAMPUNG
MENGGUNAKAN FITUR LOCAL BINARY PATTERN
(Skripsi)
Oleh
RAHMAT PURNAMA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2018
ABSTRACT
HANDWRITTEN LAMPUNG CHARACTERS RECOGNITION USING
LOCAL BINARY PATTERN FEATURE
By
RAHMAT PURNAMA
Lampung script is a cultural heritage that must be preserved. This research is an
effort to preserve Lampung script by conducting research on the recognition of
Lampung script. The image used is grayscale totaling 32140 and divided into data
groups of training, validation, and testing. The researcher uses the Local Binary
Pattern feature with a radius= 2 and radius= 3. The classifier in this research uses
the SVM method. The accuracy value generated for LBP radius= 2 is 88.93% and
the value decreases when the radius is increased to radius= 3 which is equal to
87.02%. This decrease is due to the outermost pixels of the extracted LBP image as
far as the radius used. The larger the radius, the greater the cut section, thereby
reducing the quality of the image that is recognized. LBP with R= 2 and R= 3
produces the highest number of predictions in the Pa (p) class, which is 97.5% and
96.52%. The highest prediction error when radius= 2 occurs in the script Sa (s)
which is considered as class Ga (g) as many as 40 data, and the Nga (G) character
which is considered to be class La (l) at radius= 3 as many as 51 data.
Keywords : feature extraction, handwriten character recognition, Lampung
script, local binary pattern, pattern recognition.
ABSTRAK
PENGENALAN TULISAN TANGAN AKSARA LAMPUNG
MENGGUNAKAN FITUR LOCAL BINARY PATTERN
Oleh
RAHMAT PURNAMA
Aksara Lampung adalah warisan budaya yang harus selalu dijaga kelestariannya.
Penelitian ini adalah salah satu usaha dalam melestarikan aksara Lampung dengan
melakukan penelitian pengenalan tulisan tangan aksara Lampung. Citra yang
digunakan bertipe grayscale berjumlah 32140 dan dibagi atas kelompok data
training, validation, dan testing. Peneliti menggunakan fitur Local Binary Pattern
dengan besaran radius= 2 dan radius= 3. Classifier dalam penelitian ini
menggunakan metode SVM. Nilai akurasi yang dihasilkan untuk LBP radius= 2
adalah 88.93% dan nilainya menurun saat radius ditingkatkan menjadi radius= 3
yaitu sebesar 87.02%. Penurunan ini disebabkan karena piksel terluar dari citra LBP
hasil ekstraksi terpotong sejauh radius yang digunakan. Semakin besar radius,
semakin besar pula bagian yang terpotong sehingga menurunkan kualitas citra yang
dikenali. LBP dengan R= 2 dan R= 3 menghasilkan jumlah prediksi tepat terbanyak
terdapat pada kelas Pa (p) yaitu sebesar 97,5% dan 96,52%. Kesalahan prediksi
tertinggi ketika radius= 2 terjadi pada aksara Sa (s) yang dianggap sebagai kelas
Ga (g) sebanyak 40 data, dan aksara Nga (G) yang dianggap sebagai kelas La (l) pada radius= 3 sebanyak 51 data.
Keywords : ekstraksi fitur, pengenalan tulisan tangan, aksara Lampung, local
binary pattern, pengenalan pola.
PENGENALAN TULISAN TANGAN AKSARA LAMPUNG
MENGGUNAKAN FITUR LOCAL BINARY PATTERN
Oleh:
RAHMAT PURNAMA
Skripsi
Sebagai Salah Satu Syarat untuk Memperoleh Gelar
SARJANA KOMPUTER
Pada
Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2018
Judul Skripsi : Pengenalan Tulisan Tangan Aksara Lampung
Menggunakan Fitur Local Binary Pattern
Nama Mahasiswa : Rahmat Purnama
Nomor Pokok Mahasiswa : 1417051114
Jurusan : Ilmu Komputer
Fakultas : Matematika dan Ilmu Pengetahuan Alam
MENYETUJUI
1. Komisi Pembimbing
Dr. rer. nat. Akmal Junaidi, M. Sc. M. Iqbal, S. Kom., M.Kom.
NIP. 19710129 199702 1 001 NIK. 231708870226101
2. Ketua Jurusan Ilmu Komputer
Dr. Ir. Kurnia Muludi, M.S.Sc
NIP. 19640616 198902 1001
MENGESAHKAN
1. Tim Penguji
Ketua : Dr. rer. nat. Akmal Junaidi, M. Sc.
Sekretaris : M. Iqbal, S. Kom., M.Kom.
Penguji
Bukan Pembimbing : Dr.Eng. Admi Syarif
2. Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Prof. Warsito, S.Si., D.E.A., Ph.D.
NIP. 19710210 199512 1 001
Tanggal Lulus Ujian Skripsi: 26 November 2018
PERNYATAAN
Saya yang bertanda tangan di bawah ini, menyatakan bahwa skripsi saya yang
berjudul “Pengenalan Tulisan Tangan Aksara Lampung menggunakan Fitur Local
Binary Pattern” merupakan karya saya sendiri dan bukan karya orang lain. Semua
tulisan yang tertuang di skripsi ini telah mengikuti kaidah penulisan karya ilmiah
Univeristas Lampung. Apabila dikemudian hari terbukti skripsi saya merupakan
hasil penjiplakan atau dibuat orang lain, maka saya bersedia menerima sanksi
berupa pencabutan gelar yang telah saya terima.
Bandarlampung, 26 November 2018
RAHMAT PURNAMA
NPM. 1417051114
RIWAYAT HIDUP
Penulis dilahirkan pada 20 Maret 1996 di Bandar Lampung
sebagai anak kelima dari tujuh bersaudara dengan Ayah bernama
Ali Bahrul dan Ibu Liyana.
Penulis menyelesaikan Pendidikan formal pertama kali di SD
Negeri 1 Raja Basa pada tahun 2007. Sekolah Menengah Pertama (SMP)
diselesaikan di SMP Negeri 23 Bandar Lampung pada tahun 2010. Penulis
melanjutkan Pendidikan kejenjang Sekolah Menengah Atas (SMA) di SMA Al-
Kautsar Bandar Lampung yang diselesaikan penulis pada tahun 2013.
Pada tahun 2014 penulis terdaftar sebagai mahasiswa Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung. Semasa
kuliah, penulis terdaftar dalam organisasi Himakom (Himpunan Mahasiswa Ilmu
Komputer) sebagai Wakil Ketua periode 2016 dan organisasi BEM FMIPA
Universitas Lampung sebagai Wakil Gubernur periode 2017.
Selama menjadi mahasiswa beberapa kegiatan yang dilakukan penulis antara lain :
1. Pada bulan Januari tahun 2015 penulis melaksanakan Karya Wisata Ilmiah
(KWI) di Desa Sidokaton Gisting, Kabupaten Tanggamus.
2. Pada Bulan Juli tahun 2017 penulis melakukan Kuliah Kerja Nyata (KKN) di
Desa Kuripan Kecamatan Penengahan Kabupaten Lampung Selatan dan
menjadi ketua pelaksana pembangunan wisata alam dengan nama “Grand
Sawah”.
3. Pada Bulan Januari 2017 penulis melakukan kerja praktik di Yayasan Al-
Kautsar Kota Bandar Lampung.
PERSEMBAHAN
Puji syukur kepada Allah Subhanahuwata’ala atas berkat dan kasih karunia-Nya
yang telah memberikan rezeki, keyakinan serta kekuatan dalam setiap urusan dan
langkahku, kesehatan dan kesabaran untukku dalam menyelesaikan skripsi ini.
aku persembahkan karya kecil ku ini untuk:
kedua orang tua, kakak, adik, serta keluarga besar ku
yang telah menjadi penyemangat serta motivasi dan inspirasi yang selalu
memberikan doa terbaik.
Seluruh dosen, terkhusus dosen pembimbing
yang tak pernah lelah dan dengan sabar selalu memberikan motivasi serta
bimbingan kepadaku.
Untuk sahabat-sahabat seperjuangan dan seseorang yang selalu mendampingi,
yang telah memberikan cerita, dukungan serta kebahagiaan disetiap hariku.
Selalu bersyukur dikelilingi dan mememiliki orang-orang yang baik seperti
kalian.
Aku selalu berusaha dan berdoa untuk mencapai titik kesuksesan, dan
menjadikannya suatu pembelajaran hingga aku berhasil. Terimakasih.
MOTTO
“Karena sesungguhnya bersama kesulitan itu ada
kemudahan”
[QS. Al-Insyirah : 5-6]
“Kesabaran itu ada dua macam: sabar atas sesuatu yang
tidak kau ingin dan sabar menahan diri dari sesuatu yang
kau ingini”
[Ali bin Abi Thalib]
“Menuju tak terbatas dan melampauinya”
[Buzz Lightyear]
SANWACANA
Puji syukur kepada Allah Tuhan Yang Maha Esa atas berkat dan kasih karunia-Nya
sehingga penulis dapat menyelesaikan penulisan skripsi yang berjudul “Pengenalan
Tulisan Tangan Aksara Lampung menggunakan Fitur Local Binary Pattern”.
Skripsi ini disusun sebagai syarat untuk memperoleh gelar Sarjana Komputer di
Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Lampung.
Proses penulisan skripsi ini tidak akan berjalan lancar jika tanpa ada pihak yang
membantu. Oleh karena itu penulis mengucapkan terima kasih sebesar-besarnya
kepada :
1. Kedua Orang Tua tercinta, Ibunda Liyana dan Ayahanda Ali Bahrul yang selalu
mendoakan, memberikan dukungan dan semangat serta membantu dalam ben-
tuk moril maupun materil.
2. Bapak Dr. rer. nat. Akmal Junaidi, M. Sc. sebagai Pembimbing I yang telah
memberikan motivasi, pembelajaran, ilmu, semangat serta bimbingan sehingga
penulisan skripsi ini dapat diselesaikan.
3. Bapak M. Iqbal, S. Kom., M. Kom. sebagai Pembimbing II yang telah mem-
berikan motivasi, saran, candaan, serta bimbingan sehingga penulis dapat me-
nyelesaikan skripsi ini.
4. Bapak Dr. Eng. Admi Syarif. selaku Penguji skripsi. Terima kasih atas ma-
sukan, saran, serta bimbingan dalam penyelesaian skripsi ini.
5. Bapak Prof. Warsito, S.Si., D.E.A., Ph.D. selaku Dekan FMIPA Universitas
Lampung.
6. Bapak Dr. Ir. Kurnia Muludi, M.S.Sc. selaku Ketua Jurusan Ilmu Komputer
dan Pembimbing Akademik selama penulis terdaftar sebagai mahasiswa Ilmu
Komputer Universitas Lampung.
7. Bapak Didik Kurniawan, S.Si., M.T. selaku Sekretaris Jurusan Ilmu Komputer,
Fakultas MIPA, Universitas Lampung.
8. Bapak Dwi Sakheti, M.Kom. dan Bapak Rico Andrian, S. Si., M. Kom. selaku
dosen dan tutor Liqo yang telah memberikan ilmu dan nasihat hidup yang
bermanfaat.
9. Bapak dan Ibu Dosen Jurusan Ilmu Komputer yang telah memberikan ilmu dan
pengalaman yang bermanfaat bagi penulis.
10. Para saudara kandung, yunda, uni, daing, duli, rafi dan gege.
11. Partner, teman, sahabat dan pendamping terbaik yang selalu menemani,
mengingatkan, dan memberi dukungan, Dinda Suci Ramadanti.
12. Para sahabat terbaik, Akbar Rismawan Tanjung, Alfpinka Mutia Rahmanita,
M. Juandika Rizky, M Doni Syahtria, Muhammad Nur Falah, Muhammad
Thomi Fadholi, Maria Kristiani, Rama Bayu Nugraha, Reny Rosa Enjelica,
Sunita Agustina, Widyan Hasbi Pranata terima kasih atas bantuan, dukungan
dan motivasinya.
13. Seluruh teman-teman Ilmu Komputer 2014 Universitas Lampung, Pengurus
Himakom periode 2015-2016 dan 2016, serta pengurus BEM FMIPA Unila
periode 2017.
14. Almamater tercinta, Universitas Lampung.
Penulis menyadari bahwa dalam penyusunan skripsi ini masih banyak kekurangan
dan masih jauh dari kesempurnaan. Namun besar harapan penulis semoga skripsi
ini bermanfaat bagi perkembangan ilmu pengetahuan terutama teman-teman Ilmu
Komputer serta semua pihak yang membaca
Bandar Lampung, November 2018
Rahmat Purnama
xiv
DAFTAR ISI
Halaman
DAFTAR GAMBAR ........................................................................................... xvi
DAFTAR TABEL ................................................................................................ xvii
I. PENDAHULUAN ........................................................................................... 1
1.1 Latar Belakang ......................................................................................... 1
1.2 Rumusan Masalah .................................................................................... 4
1.3 Batasan Masalah ....................................................................................... 4
1.4 Tujuan ....................................................................................................... 5
1.5 Manfaat ..................................................................................................... 5
II. TINJAUAN PUSTAKA ................................................................................... 6
2.1 Aksara Lampung ...................................................................................... 6
2.2 Pengenalan Pola ..................................................................................... 10
2.3 Handwritten Character Recognition (HWCR) ....................................... 11
2.4 Local Binary Pattern .............................................................................. 12
2.5 Support Vector Machine ......................................................................... 16
2.6 Confusion Matrix .................................................................................... 19
2.7 Pemrograman MATLAB ........................................................................ 20
III. METODE PENELITIAN ............................................................................... 24
3.1 Tahapan Penelitian .................................................................................. 24
3.2 Waktu dan Tempat Penelitian ................................................................. 30
3.3 Alat dan Bahan ....................................................................................... 30
IV. HASIL DAN PEMBAHASAN ...................................................................... 32
4.1 Tahapan Preprocessing ........................................................................... 32
4.2 Klasifikasi Dataset .................................................................................. 33
4.3 Ekstraksi Fitur ........................................................................................ 34
4.4 Klasifikasi ............................................................................................... 44
4.5 Hasil ........................................................................................................ 47
xv
4.6 Analisis Hasil Klasifikasi ....................................................................... 48
V. SIMPULAN DAN SARAN ........................................................................... 57
5.1 Simpulan ................................................................................................. 57
5.2 Saran ....................................................................................................... 58
DAFTAR PUSTAKA ............................................................................................ 61
xvi
DAFTAR GAMBAR
Gambar Halaman
1. Induk aksara Lampung. ....................................................................................... 6
2. Ilustrasi transformasi piksel ke biner................................................................. 13
3. Contoh lingkungan yang digunakan untuk menghitung LBP. .......................... 16
4. Penentuan hyperlane pemisah paling optimal pada SVM ................................ 17
5. Tahapan Penelitian. ........................................................................................... 24
6. Transformasi ukuran dataset. ............................................................................ 26
7. Citra aksara 'ta'. ................................................................................................. 36
8. Contoh tengah (C) dan piksel yang terlibat (p). ................................................ 36
9. Ilustrasi perubahan nilai intensitas C. ............................................................... 39
10. Sampel blok matriks hasil perhitungan LBP. .................................................. 39
11. Tangkapan layar textfile hasil ekstraksi fitur. .................................................. 40
12. Perbandingan citra sebelum dan sesudah ekstraksi fitur. ................................ 40
13. Citra aksara 'ba'. .............................................................................................. 41
14. Koordinat C dan P. .......................................................................................... 41
15. Perbandingan citra awal dan citra LBP. .......................................................... 44
16. Confusion matrix pada LBP dengan radius= 2. .............................................. 49
17. Confusion matrix pada LBP dengan radius= 3. .............................................. 50
18. Perbedaan antara aksara Sa dan Ga. ................................................................ 52
19. Perbedaan antara aksara Nga dan La. ............................................................. 53
20. Sampel citra LBP aksara Sa dan Ga. ............................................................... 53
xvii
DAFTAR TABEL
Tabel Halaman
1. Anak huruf posisi di atas ..................................................................................... 7
2. Anak huruf posisi di bawah ................................................................................. 8
3. Anak huruf posisi di samping .............................................................................. 9
4. Hubungan antara R dan P .................................................................................. 14
5. Contoh Confusion Matrix .................................................................................. 19
6. Beberapa sampel dataset ................................................................................... 26
7. Hasil normalisasi ukuran beberapa citra ........................................................... 32
8. Daftar nama 52 folder data training .................................................................. 33
9. Daftar nama 10 folder data validation .............................................................. 34
10. Daftar nama 20 folder data testing .................................................................. 34
11. Koordinat setiap P dengan C (16,13) .............................................................. 37
12. Nilai biner masing-masing gc .......................................................................... 37
13. Hasil Perhitungan LBP .................................................................................... 38
14. Koordinat piksel yang terlibat dalam perhitungan .......................................... 42
15. Hasil perhitungan LBP .................................................................................... 43
16. Nilai akurasi pengujian data validation dan data testing ................................ 47
17. Perbandingan tingkat akurasi pengujian ......................................................... 48
18. Sampel citra Sa dan Nga dengan bentuk kurang sempurna ............................ 55
I. PENDAHULUAN
1.1 Latar Belakang
Dokumentasi-dokumentasi terdahulu yang tersimpan dalam bentuk tulisan menjadi
bukti sejarah dan alat dalam ilmu pengetahuan untuk dapat dipelajari oleh generasi
saat ini dan yang akan datang. Bentuk dokumen terdahulu yang tertera di atas
berbagai media baik kertas, logam, batu maupun media lain ditulis dengan beragam
bentuk huruf atau aksara sesuai dengan daerahnya masing-masing tidak terkecuali
daerah Lampung. Daerah Lampung memiliki banyak dokumen tertulis yang
menggunakan aksara Lampung yang menceritakan kehidupan terdahulu baik
berbentuk surat, syair, mantra-mantra, hukum, petuah-petuah, dan beragam bentuk
lainnya.
Kondisi dokumen yang umumnya tertulis di atas kertas tidak dapat bertahan dengan
baik dari waktu ke waktu. Hal tersebut mendorong banyak pihak untuk melakukan
pengarsipan terutama bagi dokumen-dokumen penting tak terkecuali arsip sejarah
seperti dokumen kuno yang bertuliskan aksara Lampung. Salah satu usaha
pengarsipan dokumen adalah dengan membuat salinan dalam bentuk digital melalui
foto atau proses scanning. Ilmu pengetahuan yang berkembang pesat
memungkinkan arsip digital yang berbentuk gambar tersebut tidak hanya
digunakan sebagai salinan dokumen namun dapat juga dimanfaatkan untuk
2
melakukan identifikasi dokumen seperti melakukan pengenalan tulisan secara
digital. Bidang yang dapat menangani hal ini adalah pengenalan pola pada karakter
huruf dan aksara atau yang dikenal dengan Handwritten Character Recognition
(HWCR).
Pengenalan pola secara sederhana artinya adalah mengklasifikasikan suatu objek
termasuk ke dalam bagian atau kelas tertentu berdasarkan parameter yang telah
ditentukan sesuai dengan ciri yang membedakan antara objek-objek yang diuji
(Naufal, 2017). Pengenalan pola secara umum terdiri 3 tahap yaitu preprocessing,
feature extraction dan klasifikasi. Preprocessing adalah tahap awal yang dilakukan
sebelum tahapan ekstraksi fitur dan klasifikasi citra. Pada tahapan ini, dilakukan
pemrosesan gambar agar sesuai dengan kebutuhan dan metode penelitian yang akan
dilakukan. Pemrosesan yang dilakukan misalnya mengubah ukuran gambar
menjadi resolusi yang lebih kecil, mengubah citra objek menjadi hitam putih, dan
berbagai macam tahap yang lain. Tahap selanjutnya yaitu feature extraction atau
ekstraksi fitur yang bertujuan untuk memperoleh informasi lebih jelas dari data
yang terdapat di dalam citra objek. Tahap terakhir dalam pengenalan pola adalah
klasifikasi untuk menentukan kelas tertentu pada suatu objek (Yodha & Kurniawan,
2014). Metode klasifikasi pada pengenalan pola beragam macamnya, antara lain
yaitu Support Vector Machine (SVM), Decision Tree (DT), Artificial Neural
Network (ANN) dan K-Nearest Neighbors (K-NN).
Penelitian pada bidang HWCR telah banyak dilakukan. Salah satunya dilakukan
oleh (Mohammadpoor, 2015) dari Islamic Azad University yang melakukan
pengenalan tulisan tangan pada angka Persia menggunakan LBP-HOG descriptor.
3
Metode penelitian tersebut menggunakan kombinasi baru antara tekstur citra dan
fitur tepi sehingga berhasil mengenali tulisan tangan angka Persia dengan tingkat
akurasi 99,3% dari 20.000 gambar yang diuji. Penelitian lain dilakukan oleh (Sari,
et al., 2015) dalam mengenali Aksara Bali dengan menggunakan metode local
binary pattern. Tingkat akurasi tertinggi pada penelitian ini adalah 74,6% dengan
menggunakan klasifikasi. Salah satu penelitian pada pengenalan aksara Lampung,
sudah dilakukan oleh (Junaidi, et al., 2011) dengan menggunakan 82 dokumen
tulisan tangan beraksara Lampung. Penelitian ini berhasil mengenali tulisan tangan
aksara lampung dengan tingkat akurasi sebesar 97,38%.
Pemilihan metode yang digunakan pada setiap tahapan akan mempengaruhi tingkat
akurasi penelitian. Penelitian yang dilakukan kali ini berfokus pada penggunaan
fitur local binary pattern dalam proses ekstraksi fitur pada pengenalan tulisan
tangan aksara Lampung sehingga diperoleh tingkat akurasinya. Cara kerja operator
LBP yaitu dengan mencari nilai tengah dari suatu kernel berukuran 3x3, dengan
melakukan perbandingan nilai tengah piksel dengan nilai tetangga piksel terdekat
pada citra grayscale. Apabila nilai tengah bernilai sama atau lebih besar, diberi nilai
1 selain itu, diberi nilai 0. Kemudian, nilai LBP diperoleh dari penjumlahan dua
pangkat nilai angka yang bernilai 1. Penelitian ini menggunakan pengembangan
dari metode LBP yaitu circular local binary pattern yang membuat penentuan nilai
tengah tidak hanya dapat dilakukan dengan blok yang berukuran 3x3, namun dapat
dihitung dengan ukuran blok yang lebih besar sesuai radius yang membentuk
lingkaran. Radius yang digunakan pada penelitian ini bernilai 2 dan 3.
4
Setelah didapat fitur dari citra yang diproses, citra akan diklasifikasikan dan
dihitung tingkat akurasinya menggunakan metode Support Vector Machine (SVM).
Proses ini akan melewati tiga tahapan yaitu training, validation, dan testing.
Diharapkan penelitian ini berhasil memperoleh tingkat akurasi terbaik dalam
pengenalan tulisan tangan aksara Lampung menggunakan metode LBP. Hasil dari
penelitian ini kedepannya diharapkan dapat menjadi rujukan alternatif bagi
penelitian sejenis.
1.2 Rumusan Masalah
Dari uraian yang telah dijelaskan di latar belakang, rumusan permasalahan dalam
penelitian ini adalah bagaimana tingkat akurasi pengenalan tulisan tangan aksara
Lampung dengan menggunakan fitur local binary pattern.
1.3 Batasan Masalah
Batasan masalah pada penelitian ini adalah sebagai berikut:
a. Metode feature extraction yang digunakan adalah local binary pattern dengan
menggunakan metode circular.
b. Radius yang digunakan bernilai 2 dan 3.
c. Metode klasifikasi yang digunakan adalah support vector machine.
d. Tahapan preprocessing tidak dimulai dari citra asli (raw image), melainkan
menggunakan citra yang tersedia dari dataset.
5
e. Dataset yang digunakan adalah citra aksara Lampung berjumlah 82 dokumen.
f. Dataset dibagi menjadi data training, data validation, dan data testing.
1.4 Tujuan
Tujuan yang ingin dicapai pada penelitian ini adalah sebagai berikut:
a. Mengukur tingkat akurasi metode LBP dalam proses pengenalan tulisan tangan
aksara Lampung.
b. Mengklasifikasikan citra aksara Lampung ke dalam kelas-kelas tertentu.
c. Melakukan analisis terhadap hasil klasifikasi pada setiap kelas.
1.5 Manfaat
Manfaat dari penelitian ini adalah sebagai berikut:
a. Hasil penelitian dapat menambah pengetahuan baru bagi penulis.
b. Menjadikan penelitian ini sebagai alternatif penelitian dalam bidang HWCR
untuk mengenali tulisan tangan aksara Lampung maupun aksara lain.
c. Menjadi salah satu usaha pelestarian aksara Lampung.
II. TINJAUAN PUSTAKA
2.1 Aksara Lampung
Bahasa Lampung adalah salah satu bahasa daerah di Indonesia yang termasuk di
dalam rumpun bahasa Melayu yang dipakai oleh penduduknya untuk saling
berkomunikasi. Bahasa Lampung terbagi atas dua dialek yaitu dialek Nyow yang
terbagi atas subdialek Lampung Tulang Bawang dan Lampung Abung serta dialek
Api yang terbagi atas subdialek Lampung Sungkay, Lampung Pesisir, dan Lampung
Pubiyan (Septianingtias, 2012). Bahasa Lampung memiliki aksara lokal tersendiri
yaitu aksara Lampung atau yang disebut juga dengan istilah kaganga. Induk aksara
Lampung ditunjukkan pada Gambar 1.
Gambar 1. Induk aksara Lampung (Hara, 2016).
7
Aksara Lampung adalah aksara non-kursif yang ditulis dari sisi kiri ke sisi kanan
dan berjumlah 20 buah karakter. Terdapat juga 7 diakritik (tanda baca) unik yang
dapat diletakkan di atas, bawah atau sebelah kanan aksara. Berdasarkan posisi
inilah, jumlah dari diakritik bertambah menjadi 12 buah (Junaidi, et al., 2013).
Aksara Lampung atau had Lampung adalah bentuk tulisan yang memiliki
kemiripan dengan aksara Pallawa. Aksara Lampung berjenis tulisan fonetik dengan
suku kata merupakan huruf hidup seperti dalam huruf Arab (Sari, 2012). Penjelasan
mengenai diakritik aksara Lampung adalah sebagai berikut (Hara, 2016):
2.1.1 Anak Huruf yang Terletak di Atas Induk Huruf
Anak huruf yang terletak di atas induk huruf terdiri dari 6 (enam) anak huruf
seperti ditunjukkan pada Tabel 1.
Tabel 1. Anak Huruf Posisi di Atas (Hara, 2016).
Nama ‘bunyi’ Simbol
Ulan ‘i’ Ulan ‘e’ Bicek ‘e’
Rejunjung ‘r’ Tekelubang ‘ng’
Datas ‘an’
• Ulan merupakan anak huruf berbentuk setengah lingkaran kecil. Anak huruf
ini terdiri atas dua jenis berdasarkan posisi menghadapnya, ulan yang
8
menghadap ke atas berbunyi ‘i’, sedangkan ulan dengan posisi menghadap
ke bawah berbunyi ‘e’ seperti bunyi pada kata ‘pesta’.
• Bicek ialah anak huruf yang bentuknya garis tegak. Bicek berbunyi ’e’
seperti bunyi pada kata ’petani’.
• Tekelubang merupakan anak huruf dengan bentuk garis mendatar.
Tekelubang melambangkan bunyi ’ng’.
• Rejunjung berbentuk spiral dan melambangkan bunyi ’r’.
• Datas merupakan anak huruf yang berbentuk dua garis mendatar berjajar
atas bawah. Datas berbunyi ’n’.
2.1.2 Anak Huruf yang Terletak di Bawah Induk Huruf
Anak huruf yang posisinya terletak di bawah induk huruf terdiri atas tiga jenis
yang ditunjukkan pada Tabel 2.
Tabel 2. Anak huruf posisi di bawah (Hara, 2016).
Nama ‘bunyi’ Simbol
Bitan ‘o’ Bitan ‘u’
Tekelungau ‘au’
• Bitan berbentuk garis pendek. Bitan horizontal melambangkan bunyi ’u’
sedangkan bitan vertikal melambangkan bunyi ’o’.
• Tekelungau berbentuk setengah lingkaran kecil melambangkan bunyi ’au’.
9
2.1.3 Anak Huruf yang Terletak di Depan Induk Huruf
Anak huruf yang posisinya di depan induk huruf terdiri atas tiga jenis
sebagaimana diperlihatkan pada Tabel 3.
Tabel 3. Anak huruf posisi di samping (Hara, 2016).
Nama ‘bunyi’ Simbol
Tekelingai ‘ai’ Keleniah ‘ah’
Nengen
• Tekelingai adalah anak huruf yang berbentuk garis tegak dan
melambangkan bunyi ’ai’.
• Keleniah merupakan anak huruf berbentuk seperti huruf ha, namun
berukuran kecil. Keleniah melambangkan bunyi ’h’.
• Nengen adalah anak huruf yang bentuknya adalah garis miring di depan
induk huruf. Pemberian anak huruf nengen mengakibatkan induk huruf yang
ada di belakang nengen menjadi huruf mati. Namun, untuk pelambangan
beberapa bunyi tidak digunakan anak huruf nengen melainkan
dilambangkan sebagai berikut:
✓ Bunyi ‘ng’ menggunakan tekelubang.
✓ Bunyi ‘r’ menggunakan rejunjung.
✓ Bunyi ‘n’ menggunakan datas.
✓ Bunyi ‘y’ menggunakan tekelingai.
10
✓ Bunyi ‘h’ menggunakan keleniah.
✓ Bunyi ‘w’ menggunakan tekelungau.
2.2 Pengenalan Pola
Pengenalan pola merupakan proses mengelompokkan data numerik dan simbolik
termasuk juga citra secara otomatis oleh komputer dengan tujuan untuk mengenali
suatu objek di dalam citra. Pengenalan pola sudah sejak lama ada dan semakin
mengalami perkembangan mulai dari cara tradisional hingga menggunakan proses
yang lebih modern. Inti dari pengenalan pola adalah mengenali suatu objek dengan
beragam metode sehingga didapatkan tingkat keakuratan yang tinggi (Wijaya &
Kanata, 2004). Pengenalan pola memiliki beragam jenis penerapannya antara lain
pengenalan wajah, pengenalan tulisan, dan pengenalan suara. Secara sederhana,
pengenalan pola adalah proses mengelompokkan suatu objek ke dalam kelas-kelas
berdasarkan ciri dan parameter yang telah ditentukan (Naufal, 2017). Pengenalan
pola terdiri atas tiga tahapan utama yaitu:
• Preprocessing
Preprocessing adalah tahap awal pada proses pengenalan pola yang berguna untuk
mempersiapkan citra atau gambar sehingga sesuai dengan kebutuhan. Salah satu
hal yang dilakukan pada preprocessing misalnya mengubah suatu citra menjadi
citra grayscale (Keabu-abuan) (Yodha & Kurniawan, 2014). Hal lain yang
dilakukan selain grayscaling adalah merubah ukuran suatu citra menjadi piksel
yang lebih kecil agar dapat terlihat pola dari suatu citra atau disebut juga sebagai
resize.
11
• Feature Extraction
Feature Extraction atau ekstraksi fitur merupakan tahap kedua dalam pengenalan
pola yang bertujuan untuk memperoleh informasi yang lebih jelas mengenai data
dalam sebuah citra (Yodha & Kurniawan, 2014). Hal yang dilakukan pada tahap
ekstraksi fitur adalah merubah citra menjadi bentuk pola yang beragam jenisnya
sesuai dengan metode yang digunakan agar dikenali oleh sistem. Metode ekstraksi
fitur pada pengenalan pola memiliki beragam cara, diantaranya adalah
Transformasi Wavelet, Local Binary Pattern (LBP), Gray Level Co-Occurence
Matrix (GLCM), Principal Component Analysis (PCA) dan Deteksi tepi Canny.
• Klasifikasi
Klasifikasi merupakan proses penemuan model yang membedakan kelas data atau
konsep dengan tujuan dapat digunakan untuk memprediksi kelas dari objek yang
label kelasnya belum diketahui. Algoritma klasifikasi yang banyak digunakan yaitu
Decision atau Classification Trees, Bayesian Classifiers atau Naïve Bayes
classifiers, Neural Networks, Analisa Statistik, Algoritma Genetika, Rough Sets, K-
Nearest Neighbor, Metode Rule Based, Memory Based Reasoning, dan Support
Vector Machines (SVM) (Leidiyana, 2013) .
2.3 Handwritten Character Recognition (HWCR)
Handwritten Character Recognition (HWCR) merupakan salah satu cabang dari
Optical Character Recognition (OCR) yang berfokus untuk memaksimalkan
kemampuan komputer dalam hal pengenalan karakter di dalam tulisan. Pada
HWCR, komputer diberikan kemampuan untuk dapat menginterpretasikan tulisan
12
tangan yang dimasukkan dari berbagai media seperti dokumen kertas, foto, dan lain
sebagainya. Penelitian di bidang HWCR yang dilakukan dengan berbagai bahasa
menjadi salah satu topik yang jumlahnya terus meningkat karena semakin dianggap
isu penting di dunia dan salah satu aplikasinya adalah deteksi otomatis pengirim
surat atau identifikasi cek perbankan (Mohammadpoor, 2015).
Gaya tulisan pada setiap orang memiliki variasi yang sangat beragam. Oleh karena
itu, pengenalan karakter tulisan tangan secara otomatis menggunakan komputer
menjadi sebuah permasalahan. Hal ini yang menyebabkan minimnya sistem
komersial dalam hal pengenalan tulisan tangan. Penelitian di bidang HWCR terus
dikembangkan dengan harapan tersedianya sistem yang mampu menafsirkan
tulisan tangan tanpa memaksa pengguna untuk menyesuaikan gaya tulisan sesuai
dengan yang disediakan oleh perangkat (Napper, 2011).
2.4 Local Binary Pattern
Local binary pattern merupakan metode yang membandingkan piksel tetangga
dengan piksel pusat sehingga diperoleh nilai biner pada matriks, lalu nilai biner
tersebut dihitung dan diubah kedalam bentuk desimal. LBP pertama kali
diperkenalkan oleh Timo Ojala. Salah satu sifat paling penting dari operator LBP
ialah kesederhanaan perhitungannya, memiliki waktu komputasi yang lebih cepat,
dan sifatnya yang invarian terhadap perubahan fotometri dari objek yang sama,
dikarenakan LBP merupakan ukuran intensitas relatif suatu piksel dengan intensitas
piksel disekitarnya (Sari, et al., 2015).
13
Metode local binary pattern (LBP) dengan ketetanggaan piksel secara melingkar
(circular) menggunakan sejumlah koordinat tetangga secara merata pada lingkaran
dengan radius (R) tertentu yang berpusat di sebuah piksel (Ahonen, et al., 2004).
Teknik ini bekerja pada piksel yang diproses dari image dalam mode grayscale.
Pada LBP dasar, tahap pertama adalah memilih blok yang akan jadi window dengan
ukuran 3x3 piksel. Dari proses ini, nilai intensitas pusat window dicatat lalu piksel
di sekitarnya ditransformasi menjadi biner 1 apabila nilai intensitasnya lebih besar
dari nilai intensitas pusat window, jika tidak maka nilai binernya menjadi 0 (Law,
et al., 2009). Ilustrasi pembentukan biner LBP ditunjukkan pada Gambar 2.
Gambar 2. Ilustrasi transformasi piksel ke biner (Ahonen, et al., 2004).
Setelah proses transformasi dilaksanakan, selanjutnya nilai-nilai biner tersebut
disusun menjadi bilangan biner 8 digit. Susunan bilangan ini dimulai dari piksel
yang berada pada tengah bawah. Persamaan local binary pattern adalah sebagai
berikut (Ojala, et al., 2002):
14
𝐿𝐵𝑃𝑃,𝑅 = ∑ 𝑠(𝑔𝑝 − 𝑔𝑐)2𝑝𝑃−1𝑝=0
Keterangan:
LBP : Nilai local binary pattern
R : Besaran radius yang digunakan
P : Jumlah piksel tetangga yang terlibat
𝑝 : Piksel yang dihitung ( 0, 1, 2, 3, ..., P-1 )
𝑔𝑝 : Nilai intensitas piksel
𝑔𝑐 : Nilai intensitas piksel pusat (Ojala, et al., 2002)
Pada persamaan di atas, 𝑔𝑐 merupakan nilai dari piksel pusat, 𝑔𝑝 adalah nilai dari
piksel tetangga, P merupakan jumlah piksel tetangga yang terlibat, dan R adalah
radius. Koordinat seharusnya dari 𝑔𝑐 adalah (0,0), kemudian koordinat dari 𝑔𝑝
adalah (𝑅𝑠𝑖𝑛 (2𝜋𝑝
𝑃) , −𝑅𝑐𝑜𝑠 (
2𝜋𝑝
𝑃)). Jumlah piksel tetangga (P) yang terlibat
merupakan kelipatan 8 dari radius (R) yang digunakan (Ojala, et al., 2002).
Hubungan antara R dan P ditunjukkan pada Tabel 4.
Tabel 4. Hubungan antara R dan P
Radius (R) Piksel Tetangga yang Terlibat (P)
1 8
2 16
3 24
n 8 x n
15
Tabel 4 menunjukkan bahwa apabila radius yang digunakan bernilai = 1, jumlah
piksel sekitar yang terlibat berjumlah = 8. Artinya, pada blok citra berukuran 3x3
semua piksel di sekitar C ikut dilibatkan. Namun, ketika radius yang digunakan
bernilai > 1 , letak baris dan kolom piksel tetangga yang terlibat ditentukan dengan
persamaan:
𝑥𝑝 = 𝑥 + 𝑅 cos(2𝜋𝑝
𝑃)
𝑦𝑝 = 𝑦 − 𝑅 sin(2𝜋𝑝
𝑃)
Keterangan:
𝑥 = 𝑘𝑜𝑙𝑜𝑚 𝑝 = 0, 1, 2, … , 𝑃 − 1
𝑦 = 𝑏𝑎𝑟𝑖𝑠 𝑃 = 𝐽𝑢𝑚𝑙𝑎ℎ 𝑝𝑖𝑘𝑠𝑒𝑙 𝑡𝑒𝑡𝑎𝑛𝑔𝑔𝑎 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑙𝑖𝑏𝑎𝑡
𝑅 = 𝑟𝑎𝑑𝑖𝑢𝑠 (Ojala, et al., 2002)
Setelah koordinat setiap piksel tetangga yang terlibat ditentukan, nilai setiap piksel
tersebut dibandingkan dengan nilai intensitas piksel tengah (C). Nilai piksel yang
lebih besar atau sama dengan C dianggap bernilai 1, dan nilai yang lebih kecil
bernilai 0 sesuai dengan ketentuan 𝑠(𝑥) = {01 ,𝑥<𝐶
,𝑥≥𝐶. Contoh pembentukan LBP
ditunjukkan pada Gambar 3 (Ojala, et al., 2002).
16
Gambar 3. Contoh lingkungan yang digunakan untuk menghitung LBP (Ojala, et
al., 2002).
Keunggulan LBP dalam pattern recognition adalah sebagai berikut:
• Sederhana secara komputasional
• Dapat dengan mudah disesuaikan dengan permasalahan yang dihadapi
• Tahan terhadap variasi intensitas
• Tahan terhadap kesalahan lokalisasi
LBP terus berkembang secara dinamis menjadi berbagai varian. Bentuk kombinasi
LBP dengan fitur lain cukup banyak misalnya CLBP, Gabor dan lain sebagainya.
2.5 Support Vector Machine
Support Vector Machine (SVM) dikembangkan oleh Boser, Guyon, dan Vapnik
yang dikenalkan pada tahun 1995. Konsep dasar SVM adalah sebagai aplikasi teori
pembelajaran statistik untuk menyelesaikan masalah klasifikasi. Prinsip SVM
adalah linear classifier yang dikembangkan agar dapat bekerja pada permasalahan
non-linear. Secara sederhana, konsep SVM adalah usaha mencari hyperlane terbaik
yang fungsinya sebagai pemisah antara dua class pada input space (Junaidi, 2016).
Ilustrasi bagaimana cara kerja SVM ditunjukkan pada Gambar 4.
17
Gambar 4. Penentuan hyperlane paling optimal pada SVM (Junaidi, 2016).
Misalkan semua titik yang ada pada gambar merupakan masalah yang perlu untuk
diklasifikasikan menjadi dua kelas. Solusi mendasar untuk masalah klasifikasi ini
adalah dengan membagi titik data menjadi dua bagian dengan membuat sebuah
garis geometris. Dalam SVM, garis ini disebut separating hyperlanes.
Secara umum, ada banyak separating hyperlanes yang dapat menjadi solusi seperti
yang digambarkan pada Gambar 4 (a). Maka SVM akan memutuskan garis terbaik
dari semua garis yang ada. SVM akan menyelidiki titik data terluar di sekitar
separating hyperlane yang terpisah lalu menghitung jaraknya ke hyperlane.
Separating hyperlane dipilih sedemikian rupa sehingga didapatkan jarak
maksimum dari titik terluar setiap kelas ke separating hyperlanes. Setelah
separating hyperlanes didapatkan, titik-titik terluar disebut sebagai support vectors
sementara jarak dari support vectors ke separating hyperlanes disebut margin
seperti yang ditunjukkan pada Gambar 4 (b).
18
Pada prinsip dasarnya, SVM diterapkan untuk klasifikasi dengan pemisahan kelas
secara linier. Padahal dalam prakteknya, sebagian besar data yang digunakan
merupakan non-linier. Maka digunakan trik kernel dalam menangani masalah ini.
Prinsip dasar pemisahan secara linier tetap dipertahankan, namun titik asli data
ditransformasi sehingga didapat ruang baru linier yaitu dengan cara menukar fungsi
kernel yang awalnya linier menjadi non-linier. Fungsi kernel yang umunya
digunakan untuk mengatasi sampel data bertipe non-linier antara lain Radial Basis
Function (RBF), Polynomial Function, dan Sigmoid Function.
Setiap fungsi bekerja dengan cara yang sedikit berbeda antara satu dengan lainnya
sehingga memiliki kesesuaian tergantung dengan sampel yang akan diklasifikiasi.
Dari penjelasan mengenai SVM, didapatkan ciri khas SVM yaitu pendekatan SVM
didefinisikan oleh jumlah support vectors daripada dimensi dari ruang fitur.
Semakin besar dimensi maka semakin tinggi pula hyperlane dan dengan demikian
kompleksitasnya akan lebih tinggi (Junaidi, 2016).
SVM diketahui dapat menggeneralisasi dengan baik bahkan di ruang berdimensi
tinggi dan menunjukkan performa yang lebih unggul dibandingkan prinsip pada
sebagian besar neural networks. Metode SVM telah berhasil diaplikasikan pada
sejumlah aplikasi pengenalan pola dalam deteksi wajah, verifikasi dan pengenalan,
deteksi dan pengenalan obyek, tulisan tangan angka dan huruf, pengenalan suara,
dan banyak aplikasi lainnya (Byun & Lee, 2002).
19
2.6 Confusion Matrix
Confusion matrix merupakan sebuah metode yang kerap digunakan untuk
mengukur akurasi terutama pada konsep data mining. Bentuk ini digambarkan
menggunakan tabel yang menyatakan jumlah data uji yang benar dan salah
diklasifikasikan (Rahman, et al., 2017). Contoh confusion matrix ditunjukkan pada
Tabel 5.
Tabel 5. Contoh Confusion Matrix (Rahman, et al., 2017)
Kelas Hasil Klasifikasi
Prediksi “+” Prediksi “-”
Target Data Aktual “+” True Positives False Negatives
Data Aktual “-” False Positives True Negatives
Berdasarkan tabel confusion matrix tersebut:
a. True Positives (TP) adalah jumlah data bernilai positif yang diklasifikasikan
sebagai nilai positif.
b. False Positives (FP) adalah jumlah data bernilai negatif yang diklasifikasikan
sebagai nilai positif.
c. False Negatives (FN) adalah jumlah data bernilai positif yang diklasifikasikan
sebagai nilai negatif.
d. True Negatives (TN) adalah jumlah data bernilai negatif yang diklasifikasikan
sebagai nilai negatif.
20
Nilai yang dihasilkan dari metode confusion matrix adalah tingkat akurasi
klasifikasi. Perhitungan yang dilakukan adalah dengan membagi jumlah data yang
diprediksi benar dibagi dengan total data keseluruhan (Rahman, et al., 2017).
2.7 Pemrograman MATLAB
MATLAB merupakan nama singkatan dari MATrix LABoratory yaitu suatu
program komputer yang digunakan untuk membantu pekerjaan di bidang teknis dan
perhitungan scientific. Awal mulanya program ini dirancang untuk menghitung
perhitungan matriks matematis, namun semakin lama program ini tumbuh menjadi
sebuah sistem komputer yang mudah digunakan untuk menyelesaikan beragam
masalah teknis (Chapman, 2008).
MATLAB adalah suatu program komputer yang memiliki kemampuan untuk
membantu memecahkan masalah matematis di bidang teknis. Kemampuan
MATLAB dapat digunakan untuk hal paling dasar hingga masalah yang kompleks
seperti mencari akar polinomial, interpolasi data, perhitungan matriks, pengolahan
sinyal dan metode numerik. Keunggulan program ini adalah kemampuan untuk
memvisualisasikan berbagai jenis grafik dari hasil perhitungan yang dilakukan
(Widiarsono, 2005).
Pada lingkungan akademisi, Matlab merupakan tools komputasi standar dalam
pengenalan dan matakuliah lanjut pada bidang matematika, teknik, dan sains.
Dalam dunia industri, Matlab menjadi pilihan untuk digunakan dalam penelitian,
pengembangan industri, dan analisis. Matlab menyediakan beragam toolbox yang
dapat dipakai sesuai dengan kebutuhan pengguna termasuk di dalamnya The Image
21
Processing Toolbox yang berguna dalam pengolahan citra digital (Gonzalez &
Woods, 2001).
Program Matlab mengimplementasikan bahasa pemrograman Matlab dan
menyediakan begitu banyak library dengan berbagai fungsi yang telah dirancang
sebelumnya untuk menyelesaikan pekerjaan pemrograman teknis secara efisien.
Matlab merupakan sebuah program yang begitu besar dengan fungsi-fungsi yang
ada di dalamnya. Bahkan versi dasar Matlab yang tanpa dibekali dengan beragam
toolkit pun lebih kompleks dibanding dengan bahasa pemrograman teknis lainnya.
Terdapat lebih dari seribu fungsi pada versi dasar Matlab dan dengan bantuan begitu
banyaknya toolkit, kemampuan Matlab menjadi semakin luas dengan berbagai
fungsi yang memiliki spesialisasinya masing-masing. Matlab memiliki banyak
keunggulan jika dibandingkan dengan bahasa komputer konvensional, keunggulan
tersebut di antaranya:
• Mudah Digunakan
Bahasa pemrograman Matlab adalah bahasa yang diterjemahkan, seperti
kebanyakan versi Basic yang mudah digunakan. Program dapat ditulis dan
dimodifikasi dengan sangat mudah karena didukung oleh lingkungan
pengembangan yang terintegrasi internal dan debugged dengan debbugger Matlab.
Kemudahan penggunaan ini membuat Matlab sangat ideal untuk pembangunan
prototype program baru dengan sangat cepat.
• Kebebasan Platform
Matlab mendukung berbagai sistem komputer yang begitu banyak. Keuntungan ini
membuat Matlab dapat ditulis di berbagai platform, dapat dibaca pada platform
22
berbeda lainnya, dan file data yang ditulis di platform apapun dapat dibaca pada
platform lain. Kemudahan ini membuat program yang ditulis menggunakan Matlab
dapat bermigrasi ke perangkat baru ketika kebutuhan pengguna berubah.
• Memiliki Beragam Fungsi yang telah Dirancang
Library yang begitu luas yang dimiliki oleh Matlab menyediakan solusi untuk
banyak tugas teknis yang mendasar. Contohnya untuk menghitung mean, median,
deviasi, dan beragam perhitungan statistik lainnya pengguna tidak harus menulis
fungsi secara manual sehingga memudahkan pekerjaan pengguna. Matlab juga
menyediakan banyak toolbox dengan tujuan khusus untuk menyelesaikan masalah
kompleks pada situasi tertentu. Fasilitas ini mengizinkan pengguna dapat membeli
toolbox yang membantu penyelesaian masalah seperti di bidang signal processing,
control systems, communications, image processing, dan neural networks.
• Plotting yang Tidak Bergantung Perangkat
Tidak seperti kebanyakan bahasa pemrograman lainnya, Matlab memiliki banyak
perintah internal untuk pencitraan dan plotting. Plot dan gambar dapat ditampilkan
pada perangkat apapun yang menjalankan Matlab.
• Dapat Membangun GUI
Matlab memungkinkan pengguna untuk membangun Graphical User Interface
(GUI) pada program yang dibuatnya. Kemampuan ini memungkinkan programmer
untuk merancang program yang dapat dioperasikan oleh pengguna yang kurang
berpengalaman.
23
Matlab memiliki dua kelemahan utama. Yang pertama adalah karena Matlab
merupakan interpreted language menyebabkan proses eksekusi program lebih
lambat dibanding compiled language. Masalah ini dapat diatasi dengan penataan
program Matlab dengan baik. Kelemahan kedua adalah versi penuh dari Matlab
harganya lima sampai sepuluh kali lipat dibandingkan kompilator C atau Fortran
konvensional. Biaya yang tinggi ini diimbangi dengan berkurangnya waktu bagi
ilmuwan atau insinyur untuk membuat program. Namun harga tersebut masih
cukup mahal bagi kebanyakan pengguna. Solusi dari Matlab adalah tersedianya
student edition yang ditujukan bagi kalangan pelajar yang ingin mempelajari
Matlab dengan fasilitas yang tak jauh berbeda dengan full version.
Pada sisi environment, unit dasar data pada program Matlab adalah array. Array
adalah kumpulan nilai data yang disusun pada baris dan kolom dan memiliki nama
tunggal. Nilai data pada sebuah array dapat diakses dengan memanggil nama array
disertai posisi baris dan kolom yang ditulis di dalam tanda kurung. Ketika Matlab
dijalankan, ada tiga jendela utama yang ditampilkan yaitu Command Windows
dimana perintah dimasukkan, Figure Windows yang menampilkan plot dan grafik,
dan Edit Windows yang memungkinkan pengguna untuk memodifikasi program
Matlab. Selain tiga jendela utama tersebut, Matlab dapat menampilkan jendela
bantuan yang memungkinkan pengguna memeriksa sebuah nilai variabel yang
didefinisikan di dalam memori (Chapman, 2008).
III. METODE PENELITIAN
3.1 Tahapan Penelitian
Penelitian yang penulis lakukan dalam pengenalan aksara Lampung menggunakan
fitur local binary pattern terdiri atas beberapa tahap. Tahapan penelitian
ditunjukkan pada Gambar 5.
Gambar 5. Tahapan Penelitian.
(Tahap 1)
Studi Literatur
(Tahap 2)
Persiapan
Bahan
(Tahap 3)
Preprocessing
(Tahap 4)
Ekstraksi Fitur
(Tahap 5)
Klasifikasi
(Tahap 6)
Hasil
25
3.1.1 Tahap 1 – Studi Literatur
Penelitian ini diawali dengan studi literatur tentang isu-isu penting dalam
penelitian ini. Isu-isu tersebut antara lain konsep dasar tentang pengenalan pola,
HWCR, local binary pattern serta pendekatan-pendekatan teknis yang
digunakan untuk mengimplementasikannya pada aksara Lampung. Jurnal-jurnal
yang memaparkan hasil penelitian sejenis menjadi acuan penulis dalam
mengimplementasikan fitur LBP.
Beberapa literatur yang digunakan antara lain buku elektronik karangan Markus
Turtinen tahun 2007 berjudul Learning and Recognizing Texture Characteristics
using Local Binary Patterns, The Local Binary Pattern Approach to Texture
Analysis – Extensions and Applications, artikel jurnal Internasional berjudul
Statistical Modeling of the Relation Between Characters and Diacritics in
Lampung Script yang dikerjakan Akmal Junaidi dkk, pada tahun 2013, dan
jurnal Internasional tahun 2002 besutan Timo Ojala dkk, berjudul
Multiresolution Gray-Scale and Rotation Invariant Texture Classification with
Local Binary Patterns.
3.1.2 Tahap 2 – Persiapan Bahan
Sebelum masuk ke tahapan inti pengenalan pola, tahap kedua adalah
mempersiapkan bahan yang akan dipergunakan sebagai objek penelitian. Bahan
penelitian berupa dataset yang diperoleh dari situs web Pattern Recognition
Group di TU Dortmund University. Dataset terdiri dari 32.140 citra bertipe
26
grayscale. Bahan penelitian ini yang kemudian akan dipergunakan pada
pengujian fitur LBP dalam mengenali aksara lampung. Beberapa citra yang
terdapat pada dataset ditunjukkan pada Tabel 6.
Tabel 6. Beberapa sampel dataset
Citra Dataset
3.1.3 Tahap 3 – Preprocessing
Tahapan selanjutnya adalah memproses gambar agar sesuai dengan kebutuhan
penelitian. Dataset merupakan gambar bertipe grayscale namun belum memiliki
ukuran yang seragam. Gambar pada dataset yang ukurannya masih bervariasi
dilakukan proses resizing atau penyamaan ukuran terlebih dahulu. Ukuran yang
digunakan yaitu 32 x 32 piksel dan menggunakan metode interpolasi bicubic.
Contoh transformasi dataset ditunjukkan pada Gambar 6.
Gambar 6. Transformasi ukuran dataset.
27
Proses transformasi gambar menjadi lebih kecil bertujuan untuk memperkecil
nilai yang harus diproses saat proses klasifikasi. Dataset nantinya akan dibagi
menjadi dua bagian, yaitu dataset untuk training dan dataset untuk testing.
Dataset yang telah diperkecil selanjutnya disimpan pada direktori yang berbeda
dengan direktori yang menyimpan gambar asli.
3.1.4 Tahap 4 – Ekstraksi Fitur
Setelah dataset memiliki ukuran yang seragam, proses selanjutnya adalah
ekstraksi fitur. Ekstraksi fitur bertujuan untuk memperoleh (mengekstraksi)
nilai-nilai unik dalam objek gambar. Nilai-nilai unik atau yang dikenal dengan
istilah “fitur” inilah yang menjadi ciri dari setiap kelas sehingga membedakan
antara kelas yang satu dengan yang lainnya.
Tahapan yang menjadi fokus bahasan pada penelitian ini menggunakan fitur
local binary pattern yang pertama kali diperkenalkan oleh Timo Ojala dkk.
Nama “Local Binary Pattern” mencerminkan fungsi operator, yaitu lingkungan
lokal yang ditentukan dari nilai abu-abu pada piksel tengah menjadi pola biner.
Teknik ini mengkodekan informasi yang terdapat pada piksel tekstur gambar.
Gambar akan dibagi menjadi beberapa wilayah dan setiap wilayah memiliki
piksel pusat atau piksel tengah. Pada piksel tengah, setiap piksel tetangga diubah
menjadi biner yaitu berupa angka “1” atau “0” bergantung apakah piksel
tetangga memiliki nilai yang lebih tinggi daripada piksel pusat. Piksel tetangga
adalah titik sampel yang tersebar merata di sekeliling piksel pusat.
28
Besaran radius yang digunakan pada penelitian ini bernilai 2 dan 3. Besaran nilai
radius tersebut didasarkan karena penelitian ini merupakan pengembangan dari
penelitian yang sedang dilakukan oleh Akmal Junaidi, Rico Andrian, dan
Ardiansyah, di tahun 2018 berjudul “Kinerja Fitur LBP dalam Pengenalan aksara
Lampung” yang menggunakan radius bernilai 1. Alasan lain penelitian ini
membatasi nilai radius hanya sebesar 2 dan 3 adalah karena ekstraksi fitur
menyebabkan fitur yang didapat akan terpotong pada bagian pinggir-pinggirnya
sesuai dengan besarnya radius yang digunakan. Hal tersebut berarti semakin
besar radius yang digunakan, maka semakin luas daerah citra yang terpotong
sehingga jumlah fitur setiap citra akan berkurang. Penelitian ini menggunakan
citra yang hanya berukuran 32 x 32 piksel sehingga perubahan ukuran citra yang
diproses sebagai fitur dinilai cukup berpengaruh dengan tingkat akurasi yang
akan dihasilkan.
3.1.5 Tahap 5 - Klasifikasi
Tahapan yang selanjutnya dilakukan setelah nilai fitur didapatkan adalah tahapan
klasifikasi. Tahapan klasifikasi pada penelitian ini menggunakan Support Vector
Machine (SVM). SVM dikenal sebagai alat klasifikasi di berbagai bidang
penelitian dengan hasil yang memuaskan. Teknik ini diperkenalkan oleh Vapnik
dkk pada tahun 1992 dan terus dikembangkan oleh para peneliti. Pengklasifikasi
pada SVM membuat keputusan dengan memaksimalkan margin antara dua kelas
data. Batas keputusan dengan margin yang lebih besar biasanya akan
menghasilkan prediksi yang lebih baik. Pada tahapan ekstraksi fitur LBP,
29
dihasilkan sebuah berkas baru yang menyimpan karakteristik setiap objek
dataset Aksara Lampung. Karakteristik ini yang selanjutnya dipelajari oleh SVM
untuk dapat dikenali dan diklasifikasi. Hasil klasifikasi ini selanjutnya dievaluasi
untuk mendapatkan tingkat akurasi pengenalan aksara Lampung.
Penelitian ini menggunakan empat jenis kernel yang bekerja pada SVM yaitu
kernel linear, RBF, polynomial, dan sigmoid. Penggunaan empat jenis kernel
pada tahapan ini bertujuan untuk membandingkan kinerja masing-masing kernel
sehingga dapat diperoleh hasil klasifikasi terbaik.
3.1.6 Tahap 6 – Hasil
Tahap terakhir pada penelitian ini adalah mendapatkan nilai akurasi pengenalan
aksara Lampung. Proses ini menjadi salah satu tolak ukur keberhasilan
pekerjaan. Hasil klasifikasi diuji dengan menggunakan confusion matrix yang
kemudian diukur tingkat akurasinya menggunakan persamaan sebagai berikut:
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑇𝑃 + 𝑇𝑁
𝐽𝑢𝑚𝑙𝑎ℎ 𝐷𝑎𝑡𝑎
Keterangan:
Akurasi = Nilai akurasi yang dihasilkan
TP (True Positive) = Data positif yang diprediksi positif
TN (True Negative) = Data negatif yang diprediksi negatif
(Rahman, et al., 2017).
30
3.2 Waktu dan Tempat Penelitian
Penelitian dilakukan di Laboratorium Komputasi Dasar Jurusan Ilmu Komputer,
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung yang
beralamat di Jalan Prof. Dr. Soemantri Brojonegoro No.1 Gedong Meneng Bandar
Lampung. Penelitian ini dilaksanakan pada semester genap tahun ajaran 2017/2018.
3.3 Alat dan Bahan
Alat dan bahan yang dibutuhkan dalam penelitian ini adalah sebagai berikut:
3.3.1 Alat Penelitian
a. Perangkat Keras
1. Notebook dengan spesifikasi Processor Intel® Core™i3 2.40GHz, HDD
500 GB, dan RAM 2 GB.
2. All-in-One PC dengan Processor Intel® Core™i5 2.90GHz 64 bits
b. Perangkat Lunak
1. Sistem Operasi Windows 7 Ultimate 32-Bit dan Linux Ubuntu.
2. Matlab R2016a (Linux Versions).
3.3.2 Bahan Penelitian
Bahan penelitian yang digunakan adalah berupa dataset aksara Lampung yang
berjumlah 32.140 gambar dan terbagi atas 82 dokumen. Dataset diperoleh dari
31
situs web Pattern Recognition Group di TU Dortmund University pada URL:
http://patrec.cs.tu-dortmund.de/cms/en/home/Resources/index.html.
V. SIMPULAN DAN SARAN
5.1 Simpulan
Simpulan yang diperoleh berdasarkan penelitian yang telah dilakukan adalah
sebagai berikut:
a. Metode ekstraksi fitur menggunakan local binary pattern telah berhasil
diimplementasikan pada proses pengenalan tulisan tangan aksara Lampung
dengan nilai akurasi tertinggi didapatkan pada ekstraksi fitur LBP dengan
nilai R = 2 yaitu sebesar 88,93%. Sedangkan tingkat akurasi yang diperoleh
pada saat R = 3 yaitu sebesar 87,02%.
b. Citra yang diuji berhasil dikelompokkan pada 18 kelas yaitu kelas Ka (k),
Ga (g), Nga(G), Pa(p), Ba(b), Ma(m), Ta(t), Da(d), Na(n), Ca(c), Ja(j),
Nya(N), Ya(y), A(a), La(l), Sa(s), Wa(w), dan Ha(h).
c. LBP dengan R=2 dan R=3 menghasilkan jumlah prediksi tepat terbanyak
terdapat pada kelas Pa (p) yaitu sebesar 97,5% dan 96,52%. Kesalahan
prediksi tertinggi terjadi pada aksara Sa (s) yang dianggap sebagai kelas Ga
(g) pada radius = 2 sebanyak 40 data, dan aksara Nga (G) yang dianggap
sebagai kelas La (l) pada radius = 3 sebanyak 51 data.
58
5.2 Saran
Saran yang diberikan pada penelitian selanjutnya adalah sebagai berikut:
a. Mengembangkan proses ekstraksi fitur pada pengenalan tulisan tangan
aksara Lampung menggunakan LBP dengan nilai radius yang lebih besar
(R > 3).
b. Mengaplikasikan dan membandingkan penggunaan metode klasifikasi lain
agar didapat hasil terbaik pada penggunaan LBP dalam proses pengenalan
tulisan tangan aksara Lampung.
c. Meningkatkan kualitas citra yang digunakan sebagai dataset pada proses
preprocessing.
d. Menggunakan metode lain selain local binary pattern agar terlihat
perbandingan kinerja.
DAFTAR PUSTAKA
Ahonen, T., Hadid, A. & Pietikainen, M. 2004. Face Recognition with Local Binary
Patterns. Pp. 469-481. European Conference on Computer Vision 8th. Pajdla,
T & Matas, J (eds). Springer, Berlin. Vol 1. 978-3-540-21984-2. 633 pp.
Boser, B., Guyon, I. & Vapnik, V. 1997. Pattern Recognition System using Support
Vectors (Paten). United States/New Jersey. Paten No. 5,649,068.
Byun, H. & Lee, S.-W., 2002. Applications of Support Vector Machines for Pattern
Recognition: A Survey. Pattern Recognition with Support Machines 1st.
Springer, Berlin. Pp. 213-236. Vol 2388. 978-3-540-44016-1. 420 pp.
Chapman, S. J. 2008. Matlab Programming for Engineers 4th Edition. James, H
(ed). Chris Carson, Ontario. 13: 978-0-495-24449-3. 487 pp.
Gonzalez, R. C. & Woods, R. E. 2001. Digital Image Processing 2nd Edition.
Prentice Hall, New Jersey. 779 pp.
Hara, E. 2016. Sistem Pengenalan Tulisan Tangan Aksara Lampung dengan Metode
Deteksi Tepi (Canny) berbasis Jaringan Syaraf Tiruan Backpropagation.
(Skripsi). Universitas Lampung, Bandar Lampung. 86 hlm.
Junaidi, A. 2016. Lampung Handwritten Character Recognition. (Disertasi). TU
Dortmund, Dortmund. 143 pp.
Junaidi, A., Grzeszick, R., Fink, G. A. & Vajda, S. 2013. Statistical Modeling of the
Relation Between Characters and Diacritics in Lampung Script. Pp. 663-667.
12th International Conference on Document Analysis and Recognition. IEEE,
Washington DC. 978-0-7695-4999-6. 1502 pp.
Junaidi, A., Vajda, S. & Fink, G. A. 2011. Lampung – a New Handwritten Character
Benchmark: Database, Labeling and Recognition. Joint Workshop on
Multilingual OCR and Analytics for Noisy Unstructed Text Data. ACM, New
York. Vol 11. 978-1-4503-0685-0. 144 pp.
Law, M. W., Chung, A. C. S. & Liao, S. 2009. Dominant Local Binary Patterns for
Texture Classification. Pp 1107-1118 In: IEEE Transactions on Image
62
Processing. IEEE Press, New Jersey. Vol 18. No 5. 1057-7149. 1152 pp.
Leidiyana, H. 2013. Penerapan Algoritma K-Nearest Neighbor Untuk Penentuan
Resiko Kredit Kepemilikan Kendaraan Bermotor. Hlm 65-76 In: Jurnal
Penelitian Ilmu Komputer, System Embedded & Logic. Universitas Islam 45,
Bekasi. Vol 1. No 1. 2303-3304. 76 hlm.
Matanggui, J. H. 1984. Fonologi Bahasa Lampung Dialek O. Hlm 63-76 In:
Linguistik Indonesia 2. Pusat Kajian Bahasa dan Budaya Unika Atma Jaya,
Jakarta. Vol 2. No 3. 2580-2429. 78 hlm.
Mohammadpoor, R. T. M. 2015. Recognition of Persian Handwritten Numbers
using LBP-HOG Descriptor. Pp 284-290 In: Bulletin of Environment,
Pharmacology and Life Sciences. Academy for Environment and Life
Sciences, Uttar Pradesh. Vol 4. 2277-1808. 495 pp.
Napper, J. L., 2011. Handwritten Character Recognition. United
States/Silverbrook, Paten No. US 8,009,914 B2.
Naufal, M. A., 2017. Implementasi Metode Klasifikasi K-Nearest Neighbor (K-NN)
untuk Pengenalan Pola Batik Motif Lampung. (Skripsi). Universitas Lampung,
Bandar lampung. 43 hlm.
Ojala, T., Pietikainen, M. & Maenpaa, T. 2002. Multiresolution Gray-Scale and
Rotation Invariant Texture Classification with Local Binary Patterns. Pp 971-
987 In: IEEE Transactions On Pattern Analysis And Machine Intelligence.
IEEE Press, New Jersey. Vol 24. No 7. 0162-8828. 1695 pp.
Rahman, M. F., Darmawidjadja, M. I. & Alamsah, D. 2017. Klasifikasi Untuk
Diagnosa Diabetes Menggunakan Metode Bayesian Regularization Neural
Network (RBNN). Pp 36-45 In : Jurnal Informatika. Universitas Ahmad
Dahlan, Yogyakarta. Volume 11. No 1. 1978-0524.
Sari, I. A. D. P., Hidayat, B. & Sunarya, U. 2015. Pengenalan Aksara Bali dengan
Metode Local Binary Pattern. Pp 2697-2704 In: e-Proceeding of Engineering.
Universitas Telkom, Bandung.Vol 2. No 2. 2355-9365.
Sari, L. D. 2012. Aplikasi Kamus Bergambar Bahasa Indonesia-Lampung untuk
Anak Tingkat Sekolah Dasar menggunakan Linear Sequential Model. (Skripsi).
Universitas Lampung, Bandar lampung. 50 hlm.
Septianingtias, V. 2012. Analisis Dialek A dan Dialek O Bahasa Lampung : Kajian
Fonologi. Pp 316-320 In: International Seminar Language Maintenance and
Shift II. Subyanto, A., Muamilin & Prihantono (eds). Universitas Diponegoro,
Semarang. 2088-6799. 583 pp.
Turtinen, M. 2007. Learning and Recognizing Texture Characteristics using Local
Binary Patterns. (Disertasi). University of Oulu, Oulu. 978-951-42-8502-8.
128 hlm.
63
Widiarsono, T. 2005. Tutorial Praktis Belajar Matlab. [t.d]. 172 hlm.
Wijaya, I. G. P. S. & Kanata, B. 2004. Pengenalan Citra Sidik Jari Berbasis
Transformasi Wavelet dan Jaringan Syaraf Tiruan. Pp 46-52 In: Jurnal Teknik
Elektro. Universitas Kristen Petra, Surabaya. Vol 4. No 1. 1411-870X. 62 hlm.
Yodha, J. W. & Kurniawan, A. W. 2014. Pengenalan Motif Batik menggunakan
Deteksi Tepi Canny dan K-Nearest Neighbor. Pp 251-262 In: Techno.Com.
Universitas Dian Nuswantoro, Semarang. Vol 13. No 4. 2356-2579. 262 hlm.