PENGENALAN TULISAN TANGAN AKSARA …digilib.unila.ac.id/55748/3/SKRIPSI FULL TEKS TANPA BAB...Puji...

PENGENALAN TULISAN TANGAN AKSARA LAMPUNG

MENGGUNAKAN FITUR LOCAL BINARY PATTERN

(Skripsi)

Oleh

RAHMAT PURNAMA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS LAMPUNG

BANDAR LAMPUNG

2018

ABSTRACT

HANDWRITTEN LAMPUNG CHARACTERS RECOGNITION USING

LOCAL BINARY PATTERN FEATURE

By

RAHMAT PURNAMA

Lampung script is a cultural heritage that must be preserved. This research is an

effort to preserve Lampung script by conducting research on the recognition of

Lampung script. The image used is grayscale totaling 32140 and divided into data

groups of training, validation, and testing. The researcher uses the Local Binary

Pattern feature with a radius= 2 and radius= 3. The classifier in this research uses

the SVM method. The accuracy value generated for LBP radius= 2 is 88.93% and

the value decreases when the radius is increased to radius= 3 which is equal to

87.02%. This decrease is due to the outermost pixels of the extracted LBP image as

far as the radius used. The larger the radius, the greater the cut section, thereby

reducing the quality of the image that is recognized. LBP with R= 2 and R= 3

produces the highest number of predictions in the Pa (p) class, which is 97.5% and

96.52%. The highest prediction error when radius= 2 occurs in the script Sa (s)

which is considered as class Ga (g) as many as 40 data, and the Nga (G) character

which is considered to be class La (l) at radius= 3 as many as 51 data.

Keywords : feature extraction, handwriten character recognition, Lampung

script, local binary pattern, pattern recognition.

ABSTRAK



Oleh

RAHMAT PURNAMA

Aksara Lampung adalah warisan budaya yang harus selalu dijaga kelestariannya.

Penelitian ini adalah salah satu usaha dalam melestarikan aksara Lampung dengan

melakukan penelitian pengenalan tulisan tangan aksara Lampung. Citra yang

digunakan bertipe grayscale berjumlah 32140 dan dibagi atas kelompok data

training, validation, dan testing. Peneliti menggunakan fitur Local Binary Pattern

dengan besaran radius= 2 dan radius= 3. Classifier dalam penelitian ini

menggunakan metode SVM. Nilai akurasi yang dihasilkan untuk LBP radius= 2

adalah 88.93% dan nilainya menurun saat radius ditingkatkan menjadi radius= 3

yaitu sebesar 87.02%. Penurunan ini disebabkan karena piksel terluar dari citra LBP

hasil ekstraksi terpotong sejauh radius yang digunakan. Semakin besar radius,

semakin besar pula bagian yang terpotong sehingga menurunkan kualitas citra yang

dikenali. LBP dengan R= 2 dan R= 3 menghasilkan jumlah prediksi tepat terbanyak

terdapat pada kelas Pa (p) yaitu sebesar 97,5% dan 96,52%. Kesalahan prediksi

tertinggi ketika radius= 2 terjadi pada aksara Sa (s) yang dianggap sebagai kelas

Ga (g) sebanyak 40 data, dan aksara Nga (G) yang dianggap sebagai kelas La (l) pada radius= 3 sebanyak 51 data.

Keywords : ekstraksi fitur, pengenalan tulisan tangan, aksara Lampung, local

binary pattern, pengenalan pola.



Oleh:

RAHMAT PURNAMA

Skripsi

Sebagai Salah Satu Syarat untuk Memperoleh Gelar

SARJANA KOMPUTER

Pada

Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS LAMPUNG

BANDAR LAMPUNG

2018

Judul Skripsi : Pengenalan Tulisan Tangan Aksara Lampung

Menggunakan Fitur Local Binary Pattern

Nama Mahasiswa : Rahmat Purnama

Nomor Pokok Mahasiswa : 1417051114

Jurusan : Ilmu Komputer

Fakultas : Matematika dan Ilmu Pengetahuan Alam

MENYETUJUI

1. Komisi Pembimbing

Dr. rer. nat. Akmal Junaidi, M. Sc. M. Iqbal, S. Kom., M.Kom.

NIP. 19710129 199702 1 001 NIK. 231708870226101

2. Ketua Jurusan Ilmu Komputer

Dr. Ir. Kurnia Muludi, M.S.Sc

NIP. 19640616 198902 1001

MENGESAHKAN

1. Tim Penguji

Ketua : Dr. rer. nat. Akmal Junaidi, M. Sc.

Sekretaris : M. Iqbal, S. Kom., M.Kom.

Penguji

Bukan Pembimbing : Dr.Eng. Admi Syarif

2. Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam

Prof. Warsito, S.Si., D.E.A., Ph.D.

NIP. 19710210 199512 1 001

Tanggal Lulus Ujian Skripsi: 26 November 2018

PERNYATAAN

Saya yang bertanda tangan di bawah ini, menyatakan bahwa skripsi saya yang

berjudul “Pengenalan Tulisan Tangan Aksara Lampung menggunakan Fitur Local

Binary Pattern” merupakan karya saya sendiri dan bukan karya orang lain. Semua

tulisan yang tertuang di skripsi ini telah mengikuti kaidah penulisan karya ilmiah

Univeristas Lampung. Apabila dikemudian hari terbukti skripsi saya merupakan

hasil penjiplakan atau dibuat orang lain, maka saya bersedia menerima sanksi

berupa pencabutan gelar yang telah saya terima.

Bandarlampung, 26 November 2018

RAHMAT PURNAMA

NPM. 1417051114

RIWAYAT HIDUP

Penulis dilahirkan pada 20 Maret 1996 di Bandar Lampung

sebagai anak kelima dari tujuh bersaudara dengan Ayah bernama

Ali Bahrul dan Ibu Liyana.

Penulis menyelesaikan Pendidikan formal pertama kali di SD

Negeri 1 Raja Basa pada tahun 2007. Sekolah Menengah Pertama (SMP)

diselesaikan di SMP Negeri 23 Bandar Lampung pada tahun 2010. Penulis

melanjutkan Pendidikan kejenjang Sekolah Menengah Atas (SMA) di SMA Al-

Kautsar Bandar Lampung yang diselesaikan penulis pada tahun 2013.

Pada tahun 2014 penulis terdaftar sebagai mahasiswa Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung. Semasa

kuliah, penulis terdaftar dalam organisasi Himakom (Himpunan Mahasiswa Ilmu

Komputer) sebagai Wakil Ketua periode 2016 dan organisasi BEM FMIPA

Universitas Lampung sebagai Wakil Gubernur periode 2017.

Selama menjadi mahasiswa beberapa kegiatan yang dilakukan penulis antara lain :

1. Pada bulan Januari tahun 2015 penulis melaksanakan Karya Wisata Ilmiah

(KWI) di Desa Sidokaton Gisting, Kabupaten Tanggamus.

2. Pada Bulan Juli tahun 2017 penulis melakukan Kuliah Kerja Nyata (KKN) di

Desa Kuripan Kecamatan Penengahan Kabupaten Lampung Selatan dan

menjadi ketua pelaksana pembangunan wisata alam dengan nama “Grand

Sawah”.

3. Pada Bulan Januari 2017 penulis melakukan kerja praktik di Yayasan Al-

Kautsar Kota Bandar Lampung.

PERSEMBAHAN

Puji syukur kepada Allah Subhanahuwata’ala atas berkat dan kasih karunia-Nya

yang telah memberikan rezeki, keyakinan serta kekuatan dalam setiap urusan dan

langkahku, kesehatan dan kesabaran untukku dalam menyelesaikan skripsi ini.

aku persembahkan karya kecil ku ini untuk:

kedua orang tua, kakak, adik, serta keluarga besar ku

yang telah menjadi penyemangat serta motivasi dan inspirasi yang selalu

memberikan doa terbaik.

Seluruh dosen, terkhusus dosen pembimbing

yang tak pernah lelah dan dengan sabar selalu memberikan motivasi serta

bimbingan kepadaku.

Untuk sahabat-sahabat seperjuangan dan seseorang yang selalu mendampingi,

yang telah memberikan cerita, dukungan serta kebahagiaan disetiap hariku.

Selalu bersyukur dikelilingi dan mememiliki orang-orang yang baik seperti

kalian.

Aku selalu berusaha dan berdoa untuk mencapai titik kesuksesan, dan

menjadikannya suatu pembelajaran hingga aku berhasil. Terimakasih.

MOTTO

“Karena sesungguhnya bersama kesulitan itu ada

kemudahan”

[QS. Al-Insyirah : 5-6]

“Kesabaran itu ada dua macam: sabar atas sesuatu yang

tidak kau ingin dan sabar menahan diri dari sesuatu yang

kau ingini”

[Ali bin Abi Thalib]

“Menuju tak terbatas dan melampauinya”

[Buzz Lightyear]

SANWACANA

Puji syukur kepada Allah Tuhan Yang Maha Esa atas berkat dan kasih karunia-Nya

sehingga penulis dapat menyelesaikan penulisan skripsi yang berjudul “Pengenalan

Tulisan Tangan Aksara Lampung menggunakan Fitur Local Binary Pattern”.

Skripsi ini disusun sebagai syarat untuk memperoleh gelar Sarjana Komputer di

Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Lampung.

Proses penulisan skripsi ini tidak akan berjalan lancar jika tanpa ada pihak yang

membantu. Oleh karena itu penulis mengucapkan terima kasih sebesar-besarnya

kepada :

1. Kedua Orang Tua tercinta, Ibunda Liyana dan Ayahanda Ali Bahrul yang selalu

mendoakan, memberikan dukungan dan semangat serta membantu dalam ben-

tuk moril maupun materil.

2. Bapak Dr. rer. nat. Akmal Junaidi, M. Sc. sebagai Pembimbing I yang telah

memberikan motivasi, pembelajaran, ilmu, semangat serta bimbingan sehingga

penulisan skripsi ini dapat diselesaikan.

3. Bapak M. Iqbal, S. Kom., M. Kom. sebagai Pembimbing II yang telah mem-

berikan motivasi, saran, candaan, serta bimbingan sehingga penulis dapat me-

nyelesaikan skripsi ini.

4. Bapak Dr. Eng. Admi Syarif. selaku Penguji skripsi. Terima kasih atas ma-

sukan, saran, serta bimbingan dalam penyelesaian skripsi ini.

5. Bapak Prof. Warsito, S.Si., D.E.A., Ph.D. selaku Dekan FMIPA Universitas

Lampung.

6. Bapak Dr. Ir. Kurnia Muludi, M.S.Sc. selaku Ketua Jurusan Ilmu Komputer

dan Pembimbing Akademik selama penulis terdaftar sebagai mahasiswa Ilmu

Komputer Universitas Lampung.

7. Bapak Didik Kurniawan, S.Si., M.T. selaku Sekretaris Jurusan Ilmu Komputer,

Fakultas MIPA, Universitas Lampung.

8. Bapak Dwi Sakheti, M.Kom. dan Bapak Rico Andrian, S. Si., M. Kom. selaku

dosen dan tutor Liqo yang telah memberikan ilmu dan nasihat hidup yang

bermanfaat.

9. Bapak dan Ibu Dosen Jurusan Ilmu Komputer yang telah memberikan ilmu dan

pengalaman yang bermanfaat bagi penulis.

10. Para saudara kandung, yunda, uni, daing, duli, rafi dan gege.

11. Partner, teman, sahabat dan pendamping terbaik yang selalu menemani,

mengingatkan, dan memberi dukungan, Dinda Suci Ramadanti.

12. Para sahabat terbaik, Akbar Rismawan Tanjung, Alfpinka Mutia Rahmanita,

M. Juandika Rizky, M Doni Syahtria, Muhammad Nur Falah, Muhammad

Thomi Fadholi, Maria Kristiani, Rama Bayu Nugraha, Reny Rosa Enjelica,

Sunita Agustina, Widyan Hasbi Pranata terima kasih atas bantuan, dukungan

dan motivasinya.

13. Seluruh teman-teman Ilmu Komputer 2014 Universitas Lampung, Pengurus

Himakom periode 2015-2016 dan 2016, serta pengurus BEM FMIPA Unila

periode 2017.

14. Almamater tercinta, Universitas Lampung.

Penulis menyadari bahwa dalam penyusunan skripsi ini masih banyak kekurangan

dan masih jauh dari kesempurnaan. Namun besar harapan penulis semoga skripsi

ini bermanfaat bagi perkembangan ilmu pengetahuan terutama teman-teman Ilmu

Komputer serta semua pihak yang membaca

Bandar Lampung, November 2018

Rahmat Purnama

xiv

DAFTAR ISI

Halaman

DAFTAR GAMBAR ........................................................................................... xvi

DAFTAR TABEL ................................................................................................ xvii

I. PENDAHULUAN ........................................................................................... 1

1.1 Latar Belakang ......................................................................................... 1

1.2 Rumusan Masalah .................................................................................... 4

1.3 Batasan Masalah ....................................................................................... 4

1.4 Tujuan ....................................................................................................... 5

1.5 Manfaat ..................................................................................................... 5

II. TINJAUAN PUSTAKA ................................................................................... 6

2.1 Aksara Lampung ...................................................................................... 6

2.2 Pengenalan Pola ..................................................................................... 10

2.3 Handwritten Character Recognition (HWCR) ....................................... 11

2.4 Local Binary Pattern .............................................................................. 12

2.5 Support Vector Machine ......................................................................... 16

2.6 Confusion Matrix .................................................................................... 19

2.7 Pemrograman MATLAB ........................................................................ 20

III. METODE PENELITIAN ............................................................................... 24

3.1 Tahapan Penelitian .................................................................................. 24

3.2 Waktu dan Tempat Penelitian ................................................................. 30

3.3 Alat dan Bahan ....................................................................................... 30

IV. HASIL DAN PEMBAHASAN ...................................................................... 32

4.1 Tahapan Preprocessing ........................................................................... 32

4.2 Klasifikasi Dataset .................................................................................. 33

4.3 Ekstraksi Fitur ........................................................................................ 34

4.4 Klasifikasi ............................................................................................... 44

4.5 Hasil ........................................................................................................ 47

xv

4.6 Analisis Hasil Klasifikasi ....................................................................... 48

V. SIMPULAN DAN SARAN ........................................................................... 57

5.1 Simpulan ................................................................................................. 57

5.2 Saran ....................................................................................................... 58

DAFTAR PUSTAKA ............................................................................................ 61

xvi

DAFTAR GAMBAR

Gambar Halaman

1. Induk aksara Lampung. ....................................................................................... 6

2. Ilustrasi transformasi piksel ke biner................................................................. 13

3. Contoh lingkungan yang digunakan untuk menghitung LBP. .......................... 16

4. Penentuan hyperlane pemisah paling optimal pada SVM ................................ 17

5. Tahapan Penelitian. ........................................................................................... 24

6. Transformasi ukuran dataset. ............................................................................ 26

7. Citra aksara 'ta'. ................................................................................................. 36

8. Contoh tengah (C) dan piksel yang terlibat (p). ................................................ 36

9. Ilustrasi perubahan nilai intensitas C. ............................................................... 39

10. Sampel blok matriks hasil perhitungan LBP. .................................................. 39

11. Tangkapan layar textfile hasil ekstraksi fitur. .................................................. 40

12. Perbandingan citra sebelum dan sesudah ekstraksi fitur. ................................ 40

13. Citra aksara 'ba'. .............................................................................................. 41

14. Koordinat C dan P. .......................................................................................... 41

15. Perbandingan citra awal dan citra LBP. .......................................................... 44

16. Confusion matrix pada LBP dengan radius= 2. .............................................. 49

17. Confusion matrix pada LBP dengan radius= 3. .............................................. 50

18. Perbedaan antara aksara Sa dan Ga. ................................................................ 52

19. Perbedaan antara aksara Nga dan La. ............................................................. 53

20. Sampel citra LBP aksara Sa dan Ga. ............................................................... 53

xvii

DAFTAR TABEL

Tabel Halaman

1. Anak huruf posisi di atas ..................................................................................... 7

2. Anak huruf posisi di bawah ................................................................................. 8

3. Anak huruf posisi di samping .............................................................................. 9

4. Hubungan antara R dan P .................................................................................. 14

5. Contoh Confusion Matrix .................................................................................. 19

6. Beberapa sampel dataset ................................................................................... 26

7. Hasil normalisasi ukuran beberapa citra ........................................................... 32

8. Daftar nama 52 folder data training .................................................................. 33

9. Daftar nama 10 folder data validation .............................................................. 34

10. Daftar nama 20 folder data testing .................................................................. 34

11. Koordinat setiap P dengan C (16,13) .............................................................. 37

12. Nilai biner masing-masing gc .......................................................................... 37

13. Hasil Perhitungan LBP .................................................................................... 38

14. Koordinat piksel yang terlibat dalam perhitungan .......................................... 42

15. Hasil perhitungan LBP .................................................................................... 43

16. Nilai akurasi pengujian data validation dan data testing ................................ 47

17. Perbandingan tingkat akurasi pengujian ......................................................... 48

18. Sampel citra Sa dan Nga dengan bentuk kurang sempurna ............................ 55

I. PENDAHULUAN

1.1 Latar Belakang

Dokumentasi-dokumentasi terdahulu yang tersimpan dalam bentuk tulisan menjadi

bukti sejarah dan alat dalam ilmu pengetahuan untuk dapat dipelajari oleh generasi

saat ini dan yang akan datang. Bentuk dokumen terdahulu yang tertera di atas

berbagai media baik kertas, logam, batu maupun media lain ditulis dengan beragam

bentuk huruf atau aksara sesuai dengan daerahnya masing-masing tidak terkecuali

daerah Lampung. Daerah Lampung memiliki banyak dokumen tertulis yang

menggunakan aksara Lampung yang menceritakan kehidupan terdahulu baik

berbentuk surat, syair, mantra-mantra, hukum, petuah-petuah, dan beragam bentuk

lainnya.

Kondisi dokumen yang umumnya tertulis di atas kertas tidak dapat bertahan dengan

baik dari waktu ke waktu. Hal tersebut mendorong banyak pihak untuk melakukan

pengarsipan terutama bagi dokumen-dokumen penting tak terkecuali arsip sejarah

seperti dokumen kuno yang bertuliskan aksara Lampung. Salah satu usaha

pengarsipan dokumen adalah dengan membuat salinan dalam bentuk digital melalui

foto atau proses scanning. Ilmu pengetahuan yang berkembang pesat

memungkinkan arsip digital yang berbentuk gambar tersebut tidak hanya

digunakan sebagai salinan dokumen namun dapat juga dimanfaatkan untuk

2

melakukan identifikasi dokumen seperti melakukan pengenalan tulisan secara

digital. Bidang yang dapat menangani hal ini adalah pengenalan pola pada karakter

huruf dan aksara atau yang dikenal dengan Handwritten Character Recognition

(HWCR).

Pengenalan pola secara sederhana artinya adalah mengklasifikasikan suatu objek

termasuk ke dalam bagian atau kelas tertentu berdasarkan parameter yang telah

ditentukan sesuai dengan ciri yang membedakan antara objek-objek yang diuji

(Naufal, 2017). Pengenalan pola secara umum terdiri 3 tahap yaitu preprocessing,

feature extraction dan klasifikasi. Preprocessing adalah tahap awal yang dilakukan

sebelum tahapan ekstraksi fitur dan klasifikasi citra. Pada tahapan ini, dilakukan

pemrosesan gambar agar sesuai dengan kebutuhan dan metode penelitian yang akan

dilakukan. Pemrosesan yang dilakukan misalnya mengubah ukuran gambar

menjadi resolusi yang lebih kecil, mengubah citra objek menjadi hitam putih, dan

berbagai macam tahap yang lain. Tahap selanjutnya yaitu feature extraction atau

ekstraksi fitur yang bertujuan untuk memperoleh informasi lebih jelas dari data

yang terdapat di dalam citra objek. Tahap terakhir dalam pengenalan pola adalah

klasifikasi untuk menentukan kelas tertentu pada suatu objek (Yodha & Kurniawan,

2014). Metode klasifikasi pada pengenalan pola beragam macamnya, antara lain

yaitu Support Vector Machine (SVM), Decision Tree (DT), Artificial Neural

Network (ANN) dan K-Nearest Neighbors (K-NN).

Penelitian pada bidang HWCR telah banyak dilakukan. Salah satunya dilakukan

oleh (Mohammadpoor, 2015) dari Islamic Azad University yang melakukan

pengenalan tulisan tangan pada angka Persia menggunakan LBP-HOG descriptor.

3

Metode penelitian tersebut menggunakan kombinasi baru antara tekstur citra dan

fitur tepi sehingga berhasil mengenali tulisan tangan angka Persia dengan tingkat

akurasi 99,3% dari 20.000 gambar yang diuji. Penelitian lain dilakukan oleh (Sari,

et al., 2015) dalam mengenali Aksara Bali dengan menggunakan metode local

binary pattern. Tingkat akurasi tertinggi pada penelitian ini adalah 74,6% dengan

menggunakan klasifikasi. Salah satu penelitian pada pengenalan aksara Lampung,

sudah dilakukan oleh (Junaidi, et al., 2011) dengan menggunakan 82 dokumen

tulisan tangan beraksara Lampung. Penelitian ini berhasil mengenali tulisan tangan

aksara lampung dengan tingkat akurasi sebesar 97,38%.

Pemilihan metode yang digunakan pada setiap tahapan akan mempengaruhi tingkat

akurasi penelitian. Penelitian yang dilakukan kali ini berfokus pada penggunaan

fitur local binary pattern dalam proses ekstraksi fitur pada pengenalan tulisan

tangan aksara Lampung sehingga diperoleh tingkat akurasinya. Cara kerja operator

LBP yaitu dengan mencari nilai tengah dari suatu kernel berukuran 3x3, dengan

melakukan perbandingan nilai tengah piksel dengan nilai tetangga piksel terdekat

pada citra grayscale. Apabila nilai tengah bernilai sama atau lebih besar, diberi nilai

1 selain itu, diberi nilai 0. Kemudian, nilai LBP diperoleh dari penjumlahan dua

pangkat nilai angka yang bernilai 1. Penelitian ini menggunakan pengembangan

dari metode LBP yaitu circular local binary pattern yang membuat penentuan nilai

tengah tidak hanya dapat dilakukan dengan blok yang berukuran 3x3, namun dapat

dihitung dengan ukuran blok yang lebih besar sesuai radius yang membentuk

lingkaran. Radius yang digunakan pada penelitian ini bernilai 2 dan 3.

4

Setelah didapat fitur dari citra yang diproses, citra akan diklasifikasikan dan

dihitung tingkat akurasinya menggunakan metode Support Vector Machine (SVM).

Proses ini akan melewati tiga tahapan yaitu training, validation, dan testing.

Diharapkan penelitian ini berhasil memperoleh tingkat akurasi terbaik dalam

pengenalan tulisan tangan aksara Lampung menggunakan metode LBP. Hasil dari

penelitian ini kedepannya diharapkan dapat menjadi rujukan alternatif bagi

penelitian sejenis.

1.2 Rumusan Masalah

Dari uraian yang telah dijelaskan di latar belakang, rumusan permasalahan dalam

penelitian ini adalah bagaimana tingkat akurasi pengenalan tulisan tangan aksara

Lampung dengan menggunakan fitur local binary pattern.

1.3 Batasan Masalah

Batasan masalah pada penelitian ini adalah sebagai berikut:

a. Metode feature extraction yang digunakan adalah local binary pattern dengan

menggunakan metode circular.

b. Radius yang digunakan bernilai 2 dan 3.

c. Metode klasifikasi yang digunakan adalah support vector machine.

d. Tahapan preprocessing tidak dimulai dari citra asli (raw image), melainkan

menggunakan citra yang tersedia dari dataset.

5

e. Dataset yang digunakan adalah citra aksara Lampung berjumlah 82 dokumen.

f. Dataset dibagi menjadi data training, data validation, dan data testing.

1.4 Tujuan

Tujuan yang ingin dicapai pada penelitian ini adalah sebagai berikut:

a. Mengukur tingkat akurasi metode LBP dalam proses pengenalan tulisan tangan

aksara Lampung.

b. Mengklasifikasikan citra aksara Lampung ke dalam kelas-kelas tertentu.

c. Melakukan analisis terhadap hasil klasifikasi pada setiap kelas.

1.5 Manfaat

Manfaat dari penelitian ini adalah sebagai berikut:

a. Hasil penelitian dapat menambah pengetahuan baru bagi penulis.

b. Menjadikan penelitian ini sebagai alternatif penelitian dalam bidang HWCR

untuk mengenali tulisan tangan aksara Lampung maupun aksara lain.

c. Menjadi salah satu usaha pelestarian aksara Lampung.

II. TINJAUAN PUSTAKA

2.1 Aksara Lampung

Bahasa Lampung adalah salah satu bahasa daerah di Indonesia yang termasuk di

dalam rumpun bahasa Melayu yang dipakai oleh penduduknya untuk saling

berkomunikasi. Bahasa Lampung terbagi atas dua dialek yaitu dialek Nyow yang

terbagi atas subdialek Lampung Tulang Bawang dan Lampung Abung serta dialek

Api yang terbagi atas subdialek Lampung Sungkay, Lampung Pesisir, dan Lampung

Pubiyan (Septianingtias, 2012). Bahasa Lampung memiliki aksara lokal tersendiri

yaitu aksara Lampung atau yang disebut juga dengan istilah kaganga. Induk aksara

Lampung ditunjukkan pada Gambar 1.

Gambar 1. Induk aksara Lampung (Hara, 2016).

7

Aksara Lampung adalah aksara non-kursif yang ditulis dari sisi kiri ke sisi kanan

dan berjumlah 20 buah karakter. Terdapat juga 7 diakritik (tanda baca) unik yang

dapat diletakkan di atas, bawah atau sebelah kanan aksara. Berdasarkan posisi

inilah, jumlah dari diakritik bertambah menjadi 12 buah (Junaidi, et al., 2013).

Aksara Lampung atau had Lampung adalah bentuk tulisan yang memiliki

kemiripan dengan aksara Pallawa. Aksara Lampung berjenis tulisan fonetik dengan

suku kata merupakan huruf hidup seperti dalam huruf Arab (Sari, 2012). Penjelasan

mengenai diakritik aksara Lampung adalah sebagai berikut (Hara, 2016):

2.1.1 Anak Huruf yang Terletak di Atas Induk Huruf

Anak huruf yang terletak di atas induk huruf terdiri dari 6 (enam) anak huruf

seperti ditunjukkan pada Tabel 1.

Tabel 1. Anak Huruf Posisi di Atas (Hara, 2016).

Nama ‘bunyi’ Simbol

Ulan ‘i’ Ulan ‘e’ Bicek ‘e’

Rejunjung ‘r’ Tekelubang ‘ng’

Datas ‘an’

• Ulan merupakan anak huruf berbentuk setengah lingkaran kecil. Anak huruf

ini terdiri atas dua jenis berdasarkan posisi menghadapnya, ulan yang

8

menghadap ke atas berbunyi ‘i’, sedangkan ulan dengan posisi menghadap

ke bawah berbunyi ‘e’ seperti bunyi pada kata ‘pesta’.

• Bicek ialah anak huruf yang bentuknya garis tegak. Bicek berbunyi ’e’

seperti bunyi pada kata ’petani’.

• Tekelubang merupakan anak huruf dengan bentuk garis mendatar.

Tekelubang melambangkan bunyi ’ng’.

• Rejunjung berbentuk spiral dan melambangkan bunyi ’r’.

• Datas merupakan anak huruf yang berbentuk dua garis mendatar berjajar

atas bawah. Datas berbunyi ’n’.

2.1.2 Anak Huruf yang Terletak di Bawah Induk Huruf

Anak huruf yang posisinya terletak di bawah induk huruf terdiri atas tiga jenis

yang ditunjukkan pada Tabel 2.

Tabel 2. Anak huruf posisi di bawah (Hara, 2016).


Bitan ‘o’ Bitan ‘u’

Tekelungau ‘au’

• Bitan berbentuk garis pendek. Bitan horizontal melambangkan bunyi ’u’

sedangkan bitan vertikal melambangkan bunyi ’o’.

• Tekelungau berbentuk setengah lingkaran kecil melambangkan bunyi ’au’.

9

2.1.3 Anak Huruf yang Terletak di Depan Induk Huruf

Anak huruf yang posisinya di depan induk huruf terdiri atas tiga jenis

sebagaimana diperlihatkan pada Tabel 3.

Tabel 3. Anak huruf posisi di samping (Hara, 2016).


Tekelingai ‘ai’ Keleniah ‘ah’

Nengen

• Tekelingai adalah anak huruf yang berbentuk garis tegak dan

melambangkan bunyi ’ai’.

• Keleniah merupakan anak huruf berbentuk seperti huruf ha, namun

berukuran kecil. Keleniah melambangkan bunyi ’h’.

• Nengen adalah anak huruf yang bentuknya adalah garis miring di depan

induk huruf. Pemberian anak huruf nengen mengakibatkan induk huruf yang

ada di belakang nengen menjadi huruf mati. Namun, untuk pelambangan

beberapa bunyi tidak digunakan anak huruf nengen melainkan

dilambangkan sebagai berikut:

✓ Bunyi ‘ng’ menggunakan tekelubang.

✓ Bunyi ‘r’ menggunakan rejunjung.

✓ Bunyi ‘n’ menggunakan datas.

✓ Bunyi ‘y’ menggunakan tekelingai.

10

✓ Bunyi ‘h’ menggunakan keleniah.

✓ Bunyi ‘w’ menggunakan tekelungau.

2.2 Pengenalan Pola

Pengenalan pola merupakan proses mengelompokkan data numerik dan simbolik

termasuk juga citra secara otomatis oleh komputer dengan tujuan untuk mengenali

suatu objek di dalam citra. Pengenalan pola sudah sejak lama ada dan semakin

mengalami perkembangan mulai dari cara tradisional hingga menggunakan proses

yang lebih modern. Inti dari pengenalan pola adalah mengenali suatu objek dengan

beragam metode sehingga didapatkan tingkat keakuratan yang tinggi (Wijaya &

Kanata, 2004). Pengenalan pola memiliki beragam jenis penerapannya antara lain

pengenalan wajah, pengenalan tulisan, dan pengenalan suara. Secara sederhana,

pengenalan pola adalah proses mengelompokkan suatu objek ke dalam kelas-kelas

berdasarkan ciri dan parameter yang telah ditentukan (Naufal, 2017). Pengenalan

pola terdiri atas tiga tahapan utama yaitu:

• Preprocessing

Preprocessing adalah tahap awal pada proses pengenalan pola yang berguna untuk

mempersiapkan citra atau gambar sehingga sesuai dengan kebutuhan. Salah satu

hal yang dilakukan pada preprocessing misalnya mengubah suatu citra menjadi

citra grayscale (Keabu-abuan) (Yodha & Kurniawan, 2014). Hal lain yang

dilakukan selain grayscaling adalah merubah ukuran suatu citra menjadi piksel

yang lebih kecil agar dapat terlihat pola dari suatu citra atau disebut juga sebagai

resize.

11

• Feature Extraction

Feature Extraction atau ekstraksi fitur merupakan tahap kedua dalam pengenalan

pola yang bertujuan untuk memperoleh informasi yang lebih jelas mengenai data

dalam sebuah citra (Yodha & Kurniawan, 2014). Hal yang dilakukan pada tahap

ekstraksi fitur adalah merubah citra menjadi bentuk pola yang beragam jenisnya

sesuai dengan metode yang digunakan agar dikenali oleh sistem. Metode ekstraksi

fitur pada pengenalan pola memiliki beragam cara, diantaranya adalah

Transformasi Wavelet, Local Binary Pattern (LBP), Gray Level Co-Occurence

Matrix (GLCM), Principal Component Analysis (PCA) dan Deteksi tepi Canny.

• Klasifikasi

Klasifikasi merupakan proses penemuan model yang membedakan kelas data atau

konsep dengan tujuan dapat digunakan untuk memprediksi kelas dari objek yang

label kelasnya belum diketahui. Algoritma klasifikasi yang banyak digunakan yaitu

Decision atau Classification Trees, Bayesian Classifiers atau Naïve Bayes

classifiers, Neural Networks, Analisa Statistik, Algoritma Genetika, Rough Sets, K-

Nearest Neighbor, Metode Rule Based, Memory Based Reasoning, dan Support

Vector Machines (SVM) (Leidiyana, 2013) .

2.3 Handwritten Character Recognition (HWCR)

Handwritten Character Recognition (HWCR) merupakan salah satu cabang dari

Optical Character Recognition (OCR) yang berfokus untuk memaksimalkan

kemampuan komputer dalam hal pengenalan karakter di dalam tulisan. Pada

HWCR, komputer diberikan kemampuan untuk dapat menginterpretasikan tulisan

12

tangan yang dimasukkan dari berbagai media seperti dokumen kertas, foto, dan lain

sebagainya. Penelitian di bidang HWCR yang dilakukan dengan berbagai bahasa

menjadi salah satu topik yang jumlahnya terus meningkat karena semakin dianggap

isu penting di dunia dan salah satu aplikasinya adalah deteksi otomatis pengirim

surat atau identifikasi cek perbankan (Mohammadpoor, 2015).

Gaya tulisan pada setiap orang memiliki variasi yang sangat beragam. Oleh karena

itu, pengenalan karakter tulisan tangan secara otomatis menggunakan komputer

menjadi sebuah permasalahan. Hal ini yang menyebabkan minimnya sistem

komersial dalam hal pengenalan tulisan tangan. Penelitian di bidang HWCR terus

dikembangkan dengan harapan tersedianya sistem yang mampu menafsirkan

tulisan tangan tanpa memaksa pengguna untuk menyesuaikan gaya tulisan sesuai

dengan yang disediakan oleh perangkat (Napper, 2011).

2.4 Local Binary Pattern

Local binary pattern merupakan metode yang membandingkan piksel tetangga

dengan piksel pusat sehingga diperoleh nilai biner pada matriks, lalu nilai biner

tersebut dihitung dan diubah kedalam bentuk desimal. LBP pertama kali

diperkenalkan oleh Timo Ojala. Salah satu sifat paling penting dari operator LBP

ialah kesederhanaan perhitungannya, memiliki waktu komputasi yang lebih cepat,

dan sifatnya yang invarian terhadap perubahan fotometri dari objek yang sama,

dikarenakan LBP merupakan ukuran intensitas relatif suatu piksel dengan intensitas

piksel disekitarnya (Sari, et al., 2015).

13

Metode local binary pattern (LBP) dengan ketetanggaan piksel secara melingkar

(circular) menggunakan sejumlah koordinat tetangga secara merata pada lingkaran

dengan radius (R) tertentu yang berpusat di sebuah piksel (Ahonen, et al., 2004).

Teknik ini bekerja pada piksel yang diproses dari image dalam mode grayscale.

Pada LBP dasar, tahap pertama adalah memilih blok yang akan jadi window dengan

ukuran 3x3 piksel. Dari proses ini, nilai intensitas pusat window dicatat lalu piksel

di sekitarnya ditransformasi menjadi biner 1 apabila nilai intensitasnya lebih besar

dari nilai intensitas pusat window, jika tidak maka nilai binernya menjadi 0 (Law,

et al., 2009). Ilustrasi pembentukan biner LBP ditunjukkan pada Gambar 2.

Gambar 2. Ilustrasi transformasi piksel ke biner (Ahonen, et al., 2004).

Setelah proses transformasi dilaksanakan, selanjutnya nilai-nilai biner tersebut

disusun menjadi bilangan biner 8 digit. Susunan bilangan ini dimulai dari piksel

yang berada pada tengah bawah. Persamaan local binary pattern adalah sebagai

berikut (Ojala, et al., 2002):

14

𝐿𝐵𝑃𝑃,𝑅 = ∑ 𝑠(𝑔𝑝 − 𝑔𝑐)2𝑝𝑃−1𝑝=0

Keterangan:

LBP : Nilai local binary pattern

R : Besaran radius yang digunakan

P : Jumlah piksel tetangga yang terlibat

𝑝 : Piksel yang dihitung ( 0, 1, 2, 3, ..., P-1 )

𝑔𝑝 : Nilai intensitas piksel

𝑔𝑐 : Nilai intensitas piksel pusat (Ojala, et al., 2002)

Pada persamaan di atas, 𝑔𝑐 merupakan nilai dari piksel pusat, 𝑔𝑝 adalah nilai dari

piksel tetangga, P merupakan jumlah piksel tetangga yang terlibat, dan R adalah

radius. Koordinat seharusnya dari 𝑔𝑐 adalah (0,0), kemudian koordinat dari 𝑔𝑝

adalah (𝑅𝑠𝑖𝑛 (2𝜋𝑝

𝑃) , −𝑅𝑐𝑜𝑠 (

2𝜋𝑝

𝑃)). Jumlah piksel tetangga (P) yang terlibat

merupakan kelipatan 8 dari radius (R) yang digunakan (Ojala, et al., 2002).

Hubungan antara R dan P ditunjukkan pada Tabel 4.

Tabel 4. Hubungan antara R dan P

Radius (R) Piksel Tetangga yang Terlibat (P)

1 8

2 16

3 24

n 8 x n

15

Tabel 4 menunjukkan bahwa apabila radius yang digunakan bernilai = 1, jumlah

piksel sekitar yang terlibat berjumlah = 8. Artinya, pada blok citra berukuran 3x3

semua piksel di sekitar C ikut dilibatkan. Namun, ketika radius yang digunakan

bernilai > 1 , letak baris dan kolom piksel tetangga yang terlibat ditentukan dengan

persamaan:

𝑥𝑝 = 𝑥 + 𝑅 cos(2𝜋𝑝

𝑃)

𝑦𝑝 = 𝑦 − 𝑅 sin(2𝜋𝑝

𝑃)

Keterangan:

𝑥 = 𝑘𝑜𝑙𝑜𝑚 𝑝 = 0, 1, 2, … , 𝑃 − 1

𝑦 = 𝑏𝑎𝑟𝑖𝑠 𝑃 = 𝐽𝑢𝑚𝑙𝑎ℎ 𝑝𝑖𝑘𝑠𝑒𝑙 𝑡𝑒𝑡𝑎𝑛𝑔𝑔𝑎 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑙𝑖𝑏𝑎𝑡

𝑅 = 𝑟𝑎𝑑𝑖𝑢𝑠 (Ojala, et al., 2002)

Setelah koordinat setiap piksel tetangga yang terlibat ditentukan, nilai setiap piksel

tersebut dibandingkan dengan nilai intensitas piksel tengah (C). Nilai piksel yang

lebih besar atau sama dengan C dianggap bernilai 1, dan nilai yang lebih kecil

bernilai 0 sesuai dengan ketentuan 𝑠(𝑥) = {01 ,𝑥<𝐶

,𝑥≥𝐶. Contoh pembentukan LBP

ditunjukkan pada Gambar 3 (Ojala, et al., 2002).

16

Gambar 3. Contoh lingkungan yang digunakan untuk menghitung LBP (Ojala, et

al., 2002).

Keunggulan LBP dalam pattern recognition adalah sebagai berikut:

• Sederhana secara komputasional

• Dapat dengan mudah disesuaikan dengan permasalahan yang dihadapi

• Tahan terhadap variasi intensitas

• Tahan terhadap kesalahan lokalisasi

LBP terus berkembang secara dinamis menjadi berbagai varian. Bentuk kombinasi

LBP dengan fitur lain cukup banyak misalnya CLBP, Gabor dan lain sebagainya.

2.5 Support Vector Machine

Support Vector Machine (SVM) dikembangkan oleh Boser, Guyon, dan Vapnik

yang dikenalkan pada tahun 1995. Konsep dasar SVM adalah sebagai aplikasi teori

pembelajaran statistik untuk menyelesaikan masalah klasifikasi. Prinsip SVM

adalah linear classifier yang dikembangkan agar dapat bekerja pada permasalahan

non-linear. Secara sederhana, konsep SVM adalah usaha mencari hyperlane terbaik

yang fungsinya sebagai pemisah antara dua class pada input space (Junaidi, 2016).

Ilustrasi bagaimana cara kerja SVM ditunjukkan pada Gambar 4.

17

Gambar 4. Penentuan hyperlane paling optimal pada SVM (Junaidi, 2016).

Misalkan semua titik yang ada pada gambar merupakan masalah yang perlu untuk

diklasifikasikan menjadi dua kelas. Solusi mendasar untuk masalah klasifikasi ini

adalah dengan membagi titik data menjadi dua bagian dengan membuat sebuah

garis geometris. Dalam SVM, garis ini disebut separating hyperlanes.

Secara umum, ada banyak separating hyperlanes yang dapat menjadi solusi seperti

yang digambarkan pada Gambar 4 (a). Maka SVM akan memutuskan garis terbaik

dari semua garis yang ada. SVM akan menyelidiki titik data terluar di sekitar

separating hyperlane yang terpisah lalu menghitung jaraknya ke hyperlane.

Separating hyperlane dipilih sedemikian rupa sehingga didapatkan jarak

maksimum dari titik terluar setiap kelas ke separating hyperlanes. Setelah

separating hyperlanes didapatkan, titik-titik terluar disebut sebagai support vectors

sementara jarak dari support vectors ke separating hyperlanes disebut margin

seperti yang ditunjukkan pada Gambar 4 (b).

18

Pada prinsip dasarnya, SVM diterapkan untuk klasifikasi dengan pemisahan kelas

secara linier. Padahal dalam prakteknya, sebagian besar data yang digunakan

merupakan non-linier. Maka digunakan trik kernel dalam menangani masalah ini.

Prinsip dasar pemisahan secara linier tetap dipertahankan, namun titik asli data

ditransformasi sehingga didapat ruang baru linier yaitu dengan cara menukar fungsi

kernel yang awalnya linier menjadi non-linier. Fungsi kernel yang umunya

digunakan untuk mengatasi sampel data bertipe non-linier antara lain Radial Basis

Function (RBF), Polynomial Function, dan Sigmoid Function.

Setiap fungsi bekerja dengan cara yang sedikit berbeda antara satu dengan lainnya

sehingga memiliki kesesuaian tergantung dengan sampel yang akan diklasifikiasi.

Dari penjelasan mengenai SVM, didapatkan ciri khas SVM yaitu pendekatan SVM

didefinisikan oleh jumlah support vectors daripada dimensi dari ruang fitur.

Semakin besar dimensi maka semakin tinggi pula hyperlane dan dengan demikian

kompleksitasnya akan lebih tinggi (Junaidi, 2016).

SVM diketahui dapat menggeneralisasi dengan baik bahkan di ruang berdimensi

tinggi dan menunjukkan performa yang lebih unggul dibandingkan prinsip pada

sebagian besar neural networks. Metode SVM telah berhasil diaplikasikan pada

sejumlah aplikasi pengenalan pola dalam deteksi wajah, verifikasi dan pengenalan,

deteksi dan pengenalan obyek, tulisan tangan angka dan huruf, pengenalan suara,

dan banyak aplikasi lainnya (Byun & Lee, 2002).

19

2.6 Confusion Matrix

Confusion matrix merupakan sebuah metode yang kerap digunakan untuk

mengukur akurasi terutama pada konsep data mining. Bentuk ini digambarkan

menggunakan tabel yang menyatakan jumlah data uji yang benar dan salah

diklasifikasikan (Rahman, et al., 2017). Contoh confusion matrix ditunjukkan pada

Tabel 5.

Tabel 5. Contoh Confusion Matrix (Rahman, et al., 2017)

Kelas Hasil Klasifikasi

Prediksi “+” Prediksi “-”

Target Data Aktual “+” True Positives False Negatives

Data Aktual “-” False Positives True Negatives

Berdasarkan tabel confusion matrix tersebut:

a. True Positives (TP) adalah jumlah data bernilai positif yang diklasifikasikan

sebagai nilai positif.

b. False Positives (FP) adalah jumlah data bernilai negatif yang diklasifikasikan

sebagai nilai positif.

c. False Negatives (FN) adalah jumlah data bernilai positif yang diklasifikasikan

sebagai nilai negatif.

d. True Negatives (TN) adalah jumlah data bernilai negatif yang diklasifikasikan

sebagai nilai negatif.

20

Nilai yang dihasilkan dari metode confusion matrix adalah tingkat akurasi

klasifikasi. Perhitungan yang dilakukan adalah dengan membagi jumlah data yang

diprediksi benar dibagi dengan total data keseluruhan (Rahman, et al., 2017).

2.7 Pemrograman MATLAB

MATLAB merupakan nama singkatan dari MATrix LABoratory yaitu suatu

program komputer yang digunakan untuk membantu pekerjaan di bidang teknis dan

perhitungan scientific. Awal mulanya program ini dirancang untuk menghitung

perhitungan matriks matematis, namun semakin lama program ini tumbuh menjadi

sebuah sistem komputer yang mudah digunakan untuk menyelesaikan beragam

masalah teknis (Chapman, 2008).

MATLAB adalah suatu program komputer yang memiliki kemampuan untuk

membantu memecahkan masalah matematis di bidang teknis. Kemampuan

MATLAB dapat digunakan untuk hal paling dasar hingga masalah yang kompleks

seperti mencari akar polinomial, interpolasi data, perhitungan matriks, pengolahan

sinyal dan metode numerik. Keunggulan program ini adalah kemampuan untuk

memvisualisasikan berbagai jenis grafik dari hasil perhitungan yang dilakukan

(Widiarsono, 2005).

Pada lingkungan akademisi, Matlab merupakan tools komputasi standar dalam

pengenalan dan matakuliah lanjut pada bidang matematika, teknik, dan sains.

Dalam dunia industri, Matlab menjadi pilihan untuk digunakan dalam penelitian,

pengembangan industri, dan analisis. Matlab menyediakan beragam toolbox yang

dapat dipakai sesuai dengan kebutuhan pengguna termasuk di dalamnya The Image

21

Processing Toolbox yang berguna dalam pengolahan citra digital (Gonzalez &

Woods, 2001).

Program Matlab mengimplementasikan bahasa pemrograman Matlab dan

menyediakan begitu banyak library dengan berbagai fungsi yang telah dirancang

sebelumnya untuk menyelesaikan pekerjaan pemrograman teknis secara efisien.

Matlab merupakan sebuah program yang begitu besar dengan fungsi-fungsi yang

ada di dalamnya. Bahkan versi dasar Matlab yang tanpa dibekali dengan beragam

toolkit pun lebih kompleks dibanding dengan bahasa pemrograman teknis lainnya.

Terdapat lebih dari seribu fungsi pada versi dasar Matlab dan dengan bantuan begitu

banyaknya toolkit, kemampuan Matlab menjadi semakin luas dengan berbagai

fungsi yang memiliki spesialisasinya masing-masing. Matlab memiliki banyak

keunggulan jika dibandingkan dengan bahasa komputer konvensional, keunggulan

tersebut di antaranya:

• Mudah Digunakan

Bahasa pemrograman Matlab adalah bahasa yang diterjemahkan, seperti

kebanyakan versi Basic yang mudah digunakan. Program dapat ditulis dan

dimodifikasi dengan sangat mudah karena didukung oleh lingkungan

pengembangan yang terintegrasi internal dan debugged dengan debbugger Matlab.

Kemudahan penggunaan ini membuat Matlab sangat ideal untuk pembangunan

prototype program baru dengan sangat cepat.

• Kebebasan Platform

Matlab mendukung berbagai sistem komputer yang begitu banyak. Keuntungan ini

membuat Matlab dapat ditulis di berbagai platform, dapat dibaca pada platform

22

berbeda lainnya, dan file data yang ditulis di platform apapun dapat dibaca pada

platform lain. Kemudahan ini membuat program yang ditulis menggunakan Matlab

dapat bermigrasi ke perangkat baru ketika kebutuhan pengguna berubah.

• Memiliki Beragam Fungsi yang telah Dirancang

Library yang begitu luas yang dimiliki oleh Matlab menyediakan solusi untuk

banyak tugas teknis yang mendasar. Contohnya untuk menghitung mean, median,

deviasi, dan beragam perhitungan statistik lainnya pengguna tidak harus menulis

fungsi secara manual sehingga memudahkan pekerjaan pengguna. Matlab juga

menyediakan banyak toolbox dengan tujuan khusus untuk menyelesaikan masalah

kompleks pada situasi tertentu. Fasilitas ini mengizinkan pengguna dapat membeli

toolbox yang membantu penyelesaian masalah seperti di bidang signal processing,

control systems, communications, image processing, dan neural networks.

• Plotting yang Tidak Bergantung Perangkat

Tidak seperti kebanyakan bahasa pemrograman lainnya, Matlab memiliki banyak

perintah internal untuk pencitraan dan plotting. Plot dan gambar dapat ditampilkan

pada perangkat apapun yang menjalankan Matlab.

• Dapat Membangun GUI

Matlab memungkinkan pengguna untuk membangun Graphical User Interface

(GUI) pada program yang dibuatnya. Kemampuan ini memungkinkan programmer

untuk merancang program yang dapat dioperasikan oleh pengguna yang kurang

berpengalaman.

23

Matlab memiliki dua kelemahan utama. Yang pertama adalah karena Matlab

merupakan interpreted language menyebabkan proses eksekusi program lebih

lambat dibanding compiled language. Masalah ini dapat diatasi dengan penataan

program Matlab dengan baik. Kelemahan kedua adalah versi penuh dari Matlab

harganya lima sampai sepuluh kali lipat dibandingkan kompilator C atau Fortran

konvensional. Biaya yang tinggi ini diimbangi dengan berkurangnya waktu bagi

ilmuwan atau insinyur untuk membuat program. Namun harga tersebut masih

cukup mahal bagi kebanyakan pengguna. Solusi dari Matlab adalah tersedianya

student edition yang ditujukan bagi kalangan pelajar yang ingin mempelajari

Matlab dengan fasilitas yang tak jauh berbeda dengan full version.

Pada sisi environment, unit dasar data pada program Matlab adalah array. Array

adalah kumpulan nilai data yang disusun pada baris dan kolom dan memiliki nama

tunggal. Nilai data pada sebuah array dapat diakses dengan memanggil nama array

disertai posisi baris dan kolom yang ditulis di dalam tanda kurung. Ketika Matlab

dijalankan, ada tiga jendela utama yang ditampilkan yaitu Command Windows

dimana perintah dimasukkan, Figure Windows yang menampilkan plot dan grafik,

dan Edit Windows yang memungkinkan pengguna untuk memodifikasi program

Matlab. Selain tiga jendela utama tersebut, Matlab dapat menampilkan jendela

bantuan yang memungkinkan pengguna memeriksa sebuah nilai variabel yang

didefinisikan di dalam memori (Chapman, 2008).

III. METODE PENELITIAN

3.1 Tahapan Penelitian

Penelitian yang penulis lakukan dalam pengenalan aksara Lampung menggunakan

fitur local binary pattern terdiri atas beberapa tahap. Tahapan penelitian

ditunjukkan pada Gambar 5.

Gambar 5. Tahapan Penelitian.

(Tahap 1)

Studi Literatur

(Tahap 2)

Persiapan

Bahan

(Tahap 3)

Preprocessing

(Tahap 4)

Ekstraksi Fitur

(Tahap 5)

Klasifikasi

(Tahap 6)

Hasil

25

3.1.1 Tahap 1 – Studi Literatur

Penelitian ini diawali dengan studi literatur tentang isu-isu penting dalam

penelitian ini. Isu-isu tersebut antara lain konsep dasar tentang pengenalan pola,

HWCR, local binary pattern serta pendekatan-pendekatan teknis yang

digunakan untuk mengimplementasikannya pada aksara Lampung. Jurnal-jurnal

yang memaparkan hasil penelitian sejenis menjadi acuan penulis dalam

mengimplementasikan fitur LBP.

Beberapa literatur yang digunakan antara lain buku elektronik karangan Markus

Turtinen tahun 2007 berjudul Learning and Recognizing Texture Characteristics

using Local Binary Patterns, The Local Binary Pattern Approach to Texture

Analysis – Extensions and Applications, artikel jurnal Internasional berjudul

Statistical Modeling of the Relation Between Characters and Diacritics in

Lampung Script yang dikerjakan Akmal Junaidi dkk, pada tahun 2013, dan

jurnal Internasional tahun 2002 besutan Timo Ojala dkk, berjudul

Multiresolution Gray-Scale and Rotation Invariant Texture Classification with

Local Binary Patterns.

3.1.2 Tahap 2 – Persiapan Bahan

Sebelum masuk ke tahapan inti pengenalan pola, tahap kedua adalah

mempersiapkan bahan yang akan dipergunakan sebagai objek penelitian. Bahan

penelitian berupa dataset yang diperoleh dari situs web Pattern Recognition

Group di TU Dortmund University. Dataset terdiri dari 32.140 citra bertipe

26

grayscale. Bahan penelitian ini yang kemudian akan dipergunakan pada

pengujian fitur LBP dalam mengenali aksara lampung. Beberapa citra yang

terdapat pada dataset ditunjukkan pada Tabel 6.

Tabel 6. Beberapa sampel dataset

Citra Dataset

3.1.3 Tahap 3 – Preprocessing

Tahapan selanjutnya adalah memproses gambar agar sesuai dengan kebutuhan

penelitian. Dataset merupakan gambar bertipe grayscale namun belum memiliki

ukuran yang seragam. Gambar pada dataset yang ukurannya masih bervariasi

dilakukan proses resizing atau penyamaan ukuran terlebih dahulu. Ukuran yang

digunakan yaitu 32 x 32 piksel dan menggunakan metode interpolasi bicubic.

Contoh transformasi dataset ditunjukkan pada Gambar 6.

Gambar 6. Transformasi ukuran dataset.

27

Proses transformasi gambar menjadi lebih kecil bertujuan untuk memperkecil

nilai yang harus diproses saat proses klasifikasi. Dataset nantinya akan dibagi

menjadi dua bagian, yaitu dataset untuk training dan dataset untuk testing.

Dataset yang telah diperkecil selanjutnya disimpan pada direktori yang berbeda

dengan direktori yang menyimpan gambar asli.

3.1.4 Tahap 4 – Ekstraksi Fitur

Setelah dataset memiliki ukuran yang seragam, proses selanjutnya adalah

ekstraksi fitur. Ekstraksi fitur bertujuan untuk memperoleh (mengekstraksi)

nilai-nilai unik dalam objek gambar. Nilai-nilai unik atau yang dikenal dengan

istilah “fitur” inilah yang menjadi ciri dari setiap kelas sehingga membedakan

antara kelas yang satu dengan yang lainnya.

Tahapan yang menjadi fokus bahasan pada penelitian ini menggunakan fitur

local binary pattern yang pertama kali diperkenalkan oleh Timo Ojala dkk.

Nama “Local Binary Pattern” mencerminkan fungsi operator, yaitu lingkungan

lokal yang ditentukan dari nilai abu-abu pada piksel tengah menjadi pola biner.

Teknik ini mengkodekan informasi yang terdapat pada piksel tekstur gambar.

Gambar akan dibagi menjadi beberapa wilayah dan setiap wilayah memiliki

piksel pusat atau piksel tengah. Pada piksel tengah, setiap piksel tetangga diubah

menjadi biner yaitu berupa angka “1” atau “0” bergantung apakah piksel

tetangga memiliki nilai yang lebih tinggi daripada piksel pusat. Piksel tetangga

adalah titik sampel yang tersebar merata di sekeliling piksel pusat.

28

Besaran radius yang digunakan pada penelitian ini bernilai 2 dan 3. Besaran nilai

radius tersebut didasarkan karena penelitian ini merupakan pengembangan dari

penelitian yang sedang dilakukan oleh Akmal Junaidi, Rico Andrian, dan

Ardiansyah, di tahun 2018 berjudul “Kinerja Fitur LBP dalam Pengenalan aksara

Lampung” yang menggunakan radius bernilai 1. Alasan lain penelitian ini

membatasi nilai radius hanya sebesar 2 dan 3 adalah karena ekstraksi fitur

menyebabkan fitur yang didapat akan terpotong pada bagian pinggir-pinggirnya

sesuai dengan besarnya radius yang digunakan. Hal tersebut berarti semakin

besar radius yang digunakan, maka semakin luas daerah citra yang terpotong

sehingga jumlah fitur setiap citra akan berkurang. Penelitian ini menggunakan

citra yang hanya berukuran 32 x 32 piksel sehingga perubahan ukuran citra yang

diproses sebagai fitur dinilai cukup berpengaruh dengan tingkat akurasi yang

akan dihasilkan.

3.1.5 Tahap 5 - Klasifikasi

Tahapan yang selanjutnya dilakukan setelah nilai fitur didapatkan adalah tahapan

klasifikasi. Tahapan klasifikasi pada penelitian ini menggunakan Support Vector

Machine (SVM). SVM dikenal sebagai alat klasifikasi di berbagai bidang

penelitian dengan hasil yang memuaskan. Teknik ini diperkenalkan oleh Vapnik

dkk pada tahun 1992 dan terus dikembangkan oleh para peneliti. Pengklasifikasi

pada SVM membuat keputusan dengan memaksimalkan margin antara dua kelas

data. Batas keputusan dengan margin yang lebih besar biasanya akan

menghasilkan prediksi yang lebih baik. Pada tahapan ekstraksi fitur LBP,

29

dihasilkan sebuah berkas baru yang menyimpan karakteristik setiap objek

dataset Aksara Lampung. Karakteristik ini yang selanjutnya dipelajari oleh SVM

untuk dapat dikenali dan diklasifikasi. Hasil klasifikasi ini selanjutnya dievaluasi

untuk mendapatkan tingkat akurasi pengenalan aksara Lampung.

Penelitian ini menggunakan empat jenis kernel yang bekerja pada SVM yaitu

kernel linear, RBF, polynomial, dan sigmoid. Penggunaan empat jenis kernel

pada tahapan ini bertujuan untuk membandingkan kinerja masing-masing kernel

sehingga dapat diperoleh hasil klasifikasi terbaik.

3.1.6 Tahap 6 – Hasil

Tahap terakhir pada penelitian ini adalah mendapatkan nilai akurasi pengenalan

aksara Lampung. Proses ini menjadi salah satu tolak ukur keberhasilan

pekerjaan. Hasil klasifikasi diuji dengan menggunakan confusion matrix yang

kemudian diukur tingkat akurasinya menggunakan persamaan sebagai berikut:

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑇𝑃 + 𝑇𝑁

𝐽𝑢𝑚𝑙𝑎ℎ 𝐷𝑎𝑡𝑎

Keterangan:

Akurasi = Nilai akurasi yang dihasilkan

TP (True Positive) = Data positif yang diprediksi positif

TN (True Negative) = Data negatif yang diprediksi negatif

(Rahman, et al., 2017).

30

3.2 Waktu dan Tempat Penelitian

Penelitian dilakukan di Laboratorium Komputasi Dasar Jurusan Ilmu Komputer,

Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung yang

beralamat di Jalan Prof. Dr. Soemantri Brojonegoro No.1 Gedong Meneng Bandar

Lampung. Penelitian ini dilaksanakan pada semester genap tahun ajaran 2017/2018.

3.3 Alat dan Bahan

Alat dan bahan yang dibutuhkan dalam penelitian ini adalah sebagai berikut:

3.3.1 Alat Penelitian

a. Perangkat Keras

1. Notebook dengan spesifikasi Processor Intel® Core™i3 2.40GHz, HDD

500 GB, dan RAM 2 GB.

2. All-in-One PC dengan Processor Intel® Core™i5 2.90GHz 64 bits

b. Perangkat Lunak

1. Sistem Operasi Windows 7 Ultimate 32-Bit dan Linux Ubuntu.

2. Matlab R2016a (Linux Versions).

3.3.2 Bahan Penelitian

Bahan penelitian yang digunakan adalah berupa dataset aksara Lampung yang

berjumlah 32.140 gambar dan terbagi atas 82 dokumen. Dataset diperoleh dari

31

situs web Pattern Recognition Group di TU Dortmund University pada URL:

http://patrec.cs.tu-dortmund.de/cms/en/home/Resources/index.html.

V. SIMPULAN DAN SARAN

5.1 Simpulan

Simpulan yang diperoleh berdasarkan penelitian yang telah dilakukan adalah

sebagai berikut:

a. Metode ekstraksi fitur menggunakan local binary pattern telah berhasil

diimplementasikan pada proses pengenalan tulisan tangan aksara Lampung

dengan nilai akurasi tertinggi didapatkan pada ekstraksi fitur LBP dengan

nilai R = 2 yaitu sebesar 88,93%. Sedangkan tingkat akurasi yang diperoleh

pada saat R = 3 yaitu sebesar 87,02%.

b. Citra yang diuji berhasil dikelompokkan pada 18 kelas yaitu kelas Ka (k),

Ga (g), Nga(G), Pa(p), Ba(b), Ma(m), Ta(t), Da(d), Na(n), Ca(c), Ja(j),

Nya(N), Ya(y), A(a), La(l), Sa(s), Wa(w), dan Ha(h).

c. LBP dengan R=2 dan R=3 menghasilkan jumlah prediksi tepat terbanyak

terdapat pada kelas Pa (p) yaitu sebesar 97,5% dan 96,52%. Kesalahan

prediksi tertinggi terjadi pada aksara Sa (s) yang dianggap sebagai kelas Ga

(g) pada radius = 2 sebanyak 40 data, dan aksara Nga (G) yang dianggap

sebagai kelas La (l) pada radius = 3 sebanyak 51 data.

58

5.2 Saran

Saran yang diberikan pada penelitian selanjutnya adalah sebagai berikut:

a. Mengembangkan proses ekstraksi fitur pada pengenalan tulisan tangan

aksara Lampung menggunakan LBP dengan nilai radius yang lebih besar

(R > 3).

b. Mengaplikasikan dan membandingkan penggunaan metode klasifikasi lain

agar didapat hasil terbaik pada penggunaan LBP dalam proses pengenalan

tulisan tangan aksara Lampung.

c. Meningkatkan kualitas citra yang digunakan sebagai dataset pada proses

preprocessing.

d. Menggunakan metode lain selain local binary pattern agar terlihat

perbandingan kinerja.

DAFTAR PUSTAKA

Ahonen, T., Hadid, A. & Pietikainen, M. 2004. Face Recognition with Local Binary

Patterns. Pp. 469-481. European Conference on Computer Vision 8th. Pajdla,

T & Matas, J (eds). Springer, Berlin. Vol 1. 978-3-540-21984-2. 633 pp.

Boser, B., Guyon, I. & Vapnik, V. 1997. Pattern Recognition System using Support

Vectors (Paten). United States/New Jersey. Paten No. 5,649,068.

Byun, H. & Lee, S.-W., 2002. Applications of Support Vector Machines for Pattern

Recognition: A Survey. Pattern Recognition with Support Machines 1st.

Springer, Berlin. Pp. 213-236. Vol 2388. 978-3-540-44016-1. 420 pp.

Chapman, S. J. 2008. Matlab Programming for Engineers 4th Edition. James, H

(ed). Chris Carson, Ontario. 13: 978-0-495-24449-3. 487 pp.

Gonzalez, R. C. & Woods, R. E. 2001. Digital Image Processing 2nd Edition.

Prentice Hall, New Jersey. 779 pp.

Hara, E. 2016. Sistem Pengenalan Tulisan Tangan Aksara Lampung dengan Metode

Deteksi Tepi (Canny) berbasis Jaringan Syaraf Tiruan Backpropagation.

(Skripsi). Universitas Lampung, Bandar Lampung. 86 hlm.

Junaidi, A. 2016. Lampung Handwritten Character Recognition. (Disertasi). TU

Dortmund, Dortmund. 143 pp.

Junaidi, A., Grzeszick, R., Fink, G. A. & Vajda, S. 2013. Statistical Modeling of the

Relation Between Characters and Diacritics in Lampung Script. Pp. 663-667.

12th International Conference on Document Analysis and Recognition. IEEE,

Washington DC. 978-0-7695-4999-6. 1502 pp.

Junaidi, A., Vajda, S. & Fink, G. A. 2011. Lampung – a New Handwritten Character

Benchmark: Database, Labeling and Recognition. Joint Workshop on

Multilingual OCR and Analytics for Noisy Unstructed Text Data. ACM, New

York. Vol 11. 978-1-4503-0685-0. 144 pp.

Law, M. W., Chung, A. C. S. & Liao, S. 2009. Dominant Local Binary Patterns for

Texture Classification. Pp 1107-1118 In: IEEE Transactions on Image

62

Processing. IEEE Press, New Jersey. Vol 18. No 5. 1057-7149. 1152 pp.

Leidiyana, H. 2013. Penerapan Algoritma K-Nearest Neighbor Untuk Penentuan

Resiko Kredit Kepemilikan Kendaraan Bermotor. Hlm 65-76 In: Jurnal

Penelitian Ilmu Komputer, System Embedded & Logic. Universitas Islam 45,

Bekasi. Vol 1. No 1. 2303-3304. 76 hlm.

Matanggui, J. H. 1984. Fonologi Bahasa Lampung Dialek O. Hlm 63-76 In:

Linguistik Indonesia 2. Pusat Kajian Bahasa dan Budaya Unika Atma Jaya,

Jakarta. Vol 2. No 3. 2580-2429. 78 hlm.

Mohammadpoor, R. T. M. 2015. Recognition of Persian Handwritten Numbers

using LBP-HOG Descriptor. Pp 284-290 In: Bulletin of Environment,

Pharmacology and Life Sciences. Academy for Environment and Life

Sciences, Uttar Pradesh. Vol 4. 2277-1808. 495 pp.

Napper, J. L., 2011. Handwritten Character Recognition. United

States/Silverbrook, Paten No. US 8,009,914 B2.

Naufal, M. A., 2017. Implementasi Metode Klasifikasi K-Nearest Neighbor (K-NN)

untuk Pengenalan Pola Batik Motif Lampung. (Skripsi). Universitas Lampung,

Bandar lampung. 43 hlm.

Ojala, T., Pietikainen, M. & Maenpaa, T. 2002. Multiresolution Gray-Scale and

Rotation Invariant Texture Classification with Local Binary Patterns. Pp 971-

987 In: IEEE Transactions On Pattern Analysis And Machine Intelligence.

IEEE Press, New Jersey. Vol 24. No 7. 0162-8828. 1695 pp.

Rahman, M. F., Darmawidjadja, M. I. & Alamsah, D. 2017. Klasifikasi Untuk

Diagnosa Diabetes Menggunakan Metode Bayesian Regularization Neural

Network (RBNN). Pp 36-45 In : Jurnal Informatika. Universitas Ahmad

Dahlan, Yogyakarta. Volume 11. No 1. 1978-0524.

Sari, I. A. D. P., Hidayat, B. & Sunarya, U. 2015. Pengenalan Aksara Bali dengan

Metode Local Binary Pattern. Pp 2697-2704 In: e-Proceeding of Engineering.

Universitas Telkom, Bandung.Vol 2. No 2. 2355-9365.

Sari, L. D. 2012. Aplikasi Kamus Bergambar Bahasa Indonesia-Lampung untuk

Anak Tingkat Sekolah Dasar menggunakan Linear Sequential Model. (Skripsi).

Universitas Lampung, Bandar lampung. 50 hlm.

Septianingtias, V. 2012. Analisis Dialek A dan Dialek O Bahasa Lampung : Kajian

Fonologi. Pp 316-320 In: International Seminar Language Maintenance and

Shift II. Subyanto, A., Muamilin & Prihantono (eds). Universitas Diponegoro,

Semarang. 2088-6799. 583 pp.

Turtinen, M. 2007. Learning and Recognizing Texture Characteristics using Local

Binary Patterns. (Disertasi). University of Oulu, Oulu. 978-951-42-8502-8.

128 hlm.

63

Widiarsono, T. 2005. Tutorial Praktis Belajar Matlab. [t.d]. 172 hlm.

Wijaya, I. G. P. S. & Kanata, B. 2004. Pengenalan Citra Sidik Jari Berbasis

Transformasi Wavelet dan Jaringan Syaraf Tiruan. Pp 46-52 In: Jurnal Teknik

Elektro. Universitas Kristen Petra, Surabaya. Vol 4. No 1. 1411-870X. 62 hlm.

Yodha, J. W. & Kurniawan, A. W. 2014. Pengenalan Motif Batik menggunakan

Deteksi Tepi Canny dan K-Nearest Neighbor. Pp 251-262 In: Techno.Com.

Universitas Dian Nuswantoro, Semarang. Vol 13. No 4. 2356-2579. 262 hlm.

PENGENALAN TULISAN TANGAN AKSARA …digilib.unila.ac.id/55748/3/SKRIPSI FULL TEKS TANPA BAB...Puji...

Documents

Transcript of PENGENALAN TULISAN TANGAN AKSARA …digilib.unila.ac.id/55748/3/SKRIPSI FULL TEKS TANPA BAB...Puji...