1
EKSTRAKSI OPINI TOKOH PUBLIK
BERDASARKAN ANALISIS SENTIMENT DATA
TWITTER MENGGUNAKAN NAÏVE BAYES
BERBASIS PARTICLE SWARM OPTIMIZATION
TUGAS AKHIR
Diajukan Untuk Memenuhi
Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
LIA NURAINI
201210370311115
JURUSAN INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2019
brought to you by COREView metadata, citation and similar papers at core.ac.uk
provided by UMM Institutional Repository
iii
LEMBAR PERNYATAAN
Yang bertanda tangan di bawah ini:
Nama : Lia Nuraini
Tempat / Tgl Lahir : Banjarmasin, 18 Mei 1994
NIM : 201210370311115
Fakultas / Jurusan : Teknik / Teknik Informatika
Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul “Ekstraksi
Opini Tokoh Publik Berdasarkan Analisis Sentiment Data Twitter
Menggunakan Naïve Bayes Berbasis Particle Swarm Optimization” beserta
seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang
lain, baik sebagian maupun keseluruhan, kecuali dalam bentuk kutipan yang telah
disebutkan sumbernya.
Demikian surat pernyataan ini saya buat dengan sebenar-benarnya.
Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam
karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini
maka saya siap menanggung segala bentuk resiko/sanksi yang berlaku.
Mengetahui, Malang, 15 Januari 2019
Dosen Pembimbing I
Nur Hayatin, S.ST., M.Kom
NIP 108.0907.0476
Yang Membuat Pernyataan
Lia Nuraini
NIM 201210370311115
iv
LEMBAR PERSEMBAHAN
Alhamdulillahi Robbil `Alamin, puji syukur penulis ucapkan kepada Allah
SWT atas segala limpahan rahmat dan karunia-Nya, serta kepada Nabi
Muhammad SAW atas segala kebarokahan. Ucapan syukur yang tidak terhingga
kepada Allah SWT yang selalu memberikan bantuan yang tidak terduga,
kesabaran dan rasa tanggung jawab untuk bisa menyelesaikan Tugas Akhir ini.
Dalam penulisan Tugas Akhir Ini penulis banyak mendapatkan dukungan
serta bantuan dari berbagai pihak. Dalam kesempatan ini dengan segala
kerendahan hati, penulis mengucapkan terimakasih kepada :
1. Kedua orang tua penulis, yaitu Bapak Mulyadi dan Ibu Puji Astuti yang
selalu memberikan semangat untuk tidak menyerah dalam proses
penyelesaian Tugas Akhir ini, do’a mereka yang tidak pernah putus menjadi
perantara pertolongan didalam proses pengerjaan, serta dukungan moril
maupun materil kepada penulis selama ini.
2. Kepada semua saudara kandung penulis yaitu Tuti Nurlaili S.T, Renny
Nurhayani, dan Wulan Nuroctaviani yang selalu memberikan semangat dan
bantuannya.
3. Kepada Ibu Nur Hayatin S.ST., M.Kom dan Ibu Gita Indah Marthasari S.T.,
M.Kom selaku dosen pembimbing tugas akhir.
4. Ibu Gita Indah Marthasari S.T., M.Kom selaku Ketua Jurusan Teknik
Informatika Universitas Muhammadiyah Malang.
5. Teman-teman seperjuangan kelas Informatika C angkatan 2012 dan teman
seperjuangan lainnya yaitu Annisa Rizky Ananda S.Ikom yang selalu
memberikan dukungan berupa kritik, saran dan waktunya dalam proses
penyelesaian Tugas Akhir ini.
6. Dan semua pihak yang telah membantu dalam terselesaikannya tugas akhir
ini
vii
KATA PENGANTAR
Alhamdulillahi Robbil `Alamin, segala puji bagi Allah SWT yang telah
memberikan rahmat dan petunjuk serta melancarkan jalan sehingga penulis dapat
menyelesaikan penelitian yang berjudul “Ekstraksi Opini Tokoh Publik
Berdasarkan Analisis Data Twitter Menggunakan Naïve Bayes Berbasis Particle
Swarm Optimization”.
Pada penelitian ini dibuat suatu sistem klasifikasi tweet berbahasa
Indonesia yang membahas tentang Pilkada DKI Jakarta tahun 2017 lalu. Sistem
ini dirancang untuk menentukan sentiment positif dan negatif dari opini
masyarakat, dengan cara menerapkan algoritma Particle Swarm Optimization
pada klasifikasi Naïve Bayes yang bertujuan untuk meningkatkan hasil akurasi
dari kinerja klasifikasi Naïve Bayes.
Penulis menyadari bahwa penelitian ini masih jauh dari kesempurnaan.
Oleh karena itu penulis mengharapkan kritik dan saran yang membangun untuk
pengembangan kedepannya.
Akhir kata penulis mengucapkan terima kasih kepada semua pihak yang
telah membantu hingga tugas akhir ini terselesaikan.
Malang, 15 Januari 2019
Penulis
viii
DAFTAR ISI
LEMBAR PERSETUJUAN ......................................................................... i
LEMBAR PENGESAHAN .......................................................................... ii
LEMBAR PERNYATAAN ........................................................................... iii
LEMBAR PERSEMBAHAN ....................................................................... iv
ABSTRAK ...................................................................................................... v
ABSTRACT ................................................................................................... vi
KATA PENGANTAR ................................................................................... vii
DAFTAR ISI ................................................................................................. viii
DAFTAR TABEL ......................................................................................... xi
DAFTAR GAMBAR ..................................................................................... xii
BAB I PENDAHULUAN ............................................................................... 1
1.1. Latar Belakang ................................................................................. 1
1.2. Rumusan Masalah .......................................................................... 3
1.3. Batasan Masalah ............................................................................. 4
1.4. Tujuan Penelitian ............................................................................ 4
1.5. Metodologi ..................................................................................... 4
1.6. Sistematika Penulisan ..................................................................... 6
BAB II LANDASAN TEORI ........................................................................ 8
2.1. Twitter ............................................................................................ 8
2.2. Sentiment Analysis ......................................................................... 9
2.3. Text Mining .................................................................................... 9
2.4. Text Preprocessing ......................................................................... 10
2.4.1 Case Folding ....................................................................... 10
2.4.2 Tokenizing .......................................................................... 11
2.4.3 Normalisasi ......................................................................... 11
2.4.4 Stopword Removal ............................................................. 12
2.4.5 Stemming ............................................................................ 13
2.5. Algoritma Confix-stripping ............................................................ 14
2.5.1. Aturan Peluruhan Kata Dasar ............................................. 15
ix
2.6. Klasifikasi Teks .............................................................................. 17
2.6.1 Naïve Bayes ........................................................................ 17
2.6.2 Pembobotan Naïve Bayes ................................................... 19
2.8. Naïve Bayes Berbasis Particle Swarm Optimization ........................ 20
2.8.1. Teori Algoritma ................................................................... 20
2.8.2. Prosedur Algoritma Naïve Bayes Berbasis Particle
Swarm Optimization ..................................................................... 21
2.9. Metode Pengujian ........................................................................... 23
2.9.1. Cross Validation ................................................................. 23
2.10. Penelitian Terdahulu ....................................................................... 25
BAB III ANALISIS DAN PERANCANGAN SISTEM ............................. 27
3.1. Perancangan Sistem ........................................................................ 27
3.2. Dataset .......................................................................................... 28
3.3. Pengolahan Data ............................................................................. 29
3.3.1. Manual Labelling ................................................................ 29
3.3.2. Preprocessing ...................................................................... 30
3.3.2.1. Tahapan Normalisasi .......................................... 30
3.3.2.2. Tahapan Case folding ......................................... 31
3.3.2.3. Tahapan Tokenizing ............................................ 31
3.3.2.4. Tahapan Stopword Removal ............................... 32
3.3.2.5. Tahapan Stemming ............................................. 32
3.3.2.6. Specific Feature .................................................. 33
3.4. Metode Klasifikasi yang di Usulkan ............................................. 33
3.4.1. Naïve Bayes Berbasis Particle Swarm Optimization .......... 34
3.5. Perancangan Skenario Pengujian .................................................... 36
BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM ........................ 38
4.1. Implementasi Sistem ....................................................................... 38
4.2. Kebutuhan Sistem ........................................................................... 38
4.2.1. Kebutuhan Perangkat Keras ............................................... 38
4.2.2. Kebutuhan Perangkat Lunak ............................................... 39
x
4.3. Implementasi Proses Dataset .......................................................... 39
4.4. Implementasi dan Hasil Eksperimen Algoritma Klasifikasi
Naïve Bayes .................................................................................... 44
4.4.1 Implementasi Klasifikasi Naïve Bayes .................................. 44
4.5. Penerapan Algoritma Particle Swarm Optimization pada
Klasifikasi Naïve Bayes ................................................................. 49
4.5.1. Pengujian Model Klasifikasi Naïve Bayes Berbasis PSO
dengan Merubah Parameter dari Population Size dan
Inertia Weight pada Algoritma PSO ..................................... 50
4.6. Evaluasi Hasil dan Validasi Model ............................................... 51
BAB V PENUTUP .......................................................................................... 53
5.1. Kesimpulan ..................................................................................... 53
5.2. Saran ............................................................................................... 53
DAFTAR PUSTAKA .................................................................................... 55
xi
DAFTAR TABEL
Tabel 2.1 Case Folding ................................................................................... 10
Tabel 2.2 Tokenizing ....................................................................................... 11
Tabel 2.3 Normalisasi ..................................................................................... 12
Tabel 2.4 Stopword Removal .......................................................................... 13
Tabel 2.5 Stemming ......................................................................................... 14
Tabel 2.6 Kombinasi Prefix dan Sufiks yang tidak diperbolehkan ................ 15
Tabel 2.7 Aturan Peluruhan Kata Dasar (Adriani et al, 2007) ........................ 15
Tabel 2.9 Penelitian Terdahulu ....................................................................... 26
Tabel 3.1 Data Tweet Berdasarkan Keyword ................................................. 28
Tabel 3.2 Pelabelan Data Tweet ...................................................................... 29
Tabel 3.3 Hasil Normalisasi ............................................................................ 30
Tabel 3.4 Hasil Case Folding ......................................................................... 31
Tabel 3.5 Tokenizing ....................................................................................... 31
Tabel 3.6 Stopword Removal .......................................................................... 32
Tabel 3.7 Stemming ......................................................................................... 33
Tabel 3.8 Tabel Sentiment ............................................................................. 33
Tabel 3.9 Pembagian Data Training dan Data Testing ................................... 36
Tabel 3.10 Confusion Matrix .......................................................................... 37
Tabel 4.1 Hasil Preprocessing Data Training ................................................ 44
Tabel 4.2 Hasil Prediksi Data Testing ............................................................ 46
Tabel 4.3 Hasil Accuracy dengan Metode 10-fold Cross Validation .............. 48
Tabel 4.4 Hasil Eksperimen Algoritma Naïve Bayes Berbasis
PSO Dengan Merubah Parameter dari Population Size ................. 50
Tabel 4.5 Hasil Eksperimen Algoritma Naïve Bayes Berbasis
PSO Dengan Merubah Parameter dari Inertia Weight ................... 51
Tabel 4.6 Perbandingan Hasil Akurasi ........................................................... 52
xii
DAFTAR GAMBAR
Gambar 2.1 Ilustrasi 10-fold Cross Validation ............................................... 24
Gambar 3.1 Alur Sistem Analisis Sentiment Tweet Tokoh Publik ................. 27
Gambar 3.2 Flowchart Klasifikasi Naïve Bayes berbasis Particle
Swarm Optimization ................................................................................. 34
Gambar 4.1 Proses Pemilihan Operator View ................................................ 40
Gambar 4.2 Proses Input Dataset .................................................................... 40
Gambar 4.3 Inputan Dataset Training ............................................................ 41
Gambar 4.4 Proses Pemilihan Atribute Menjadi Label ................................... 42
Gambar 4.5 Proses Document From Data ...................................................... 42
Gambar 4.6 Proses Preprocessing Dataset ..................................................... 43
Gambar 4.7 Transformation Pembobotan TF-IDF ......................................... 43
Gambar 4.8 Model Klasifikasi Naïve Bayes pada Tools Rapidminer ............. 45
Gambar 4.9 Implementasi Pengujian 10-fold Cross Validation ..................... 47
Gambar 4.10 Confusion Matrix Algoritma Naïve Bayes ................................ 48
Gambar 4.11 Penerapan Algoritma Particle Swarm Optimization pada
Klasifikasi Naïve Bayes ............................................................ 49
Gambar 4.12 Confusion Matrix Algoritma Naïve Bayes Berbasis
Particle Swarm Optimization .................................................... 51
55
DAFTAR PUSTAKA
Hayatin, Nur., Mentari, Mustika., dan Izzah, Abidatul. 2014. Opinion Extraction
of Public Figure Based on Sentiment Analysis in Twitter. IPTEK, Journal
of Engineering, Vol.1, No.1.
Nurhadi, Achmad. 2016. “Implementasi Algoritma Naïve Bayes Classifier
Berbasis Particle Swarm Optimization (PSO) untuk Klasifikasi Konten
Berita Digital Bahasa Indonesia”. Akademi Manajemen Informatika dan
Komputer, BSI Pontianak.
Ernawati, Siti. 2016. “Penerapan Particle Swarm Optimization untuk Seleksi Fitur
pada Analisis Sentimen Review Perusahaan Penjualan Online
Menggunakan Naïve Bayes”. Program Studi Sistem Informasi, STMIK
Nusa Mandiri, Jakarta.
Prabowo, Alvino Dwi Rachman. “Prediksi Nasabah yang Berpotensi Membuka
Simpanan Deposito Menggunakan Naïve Bayes Berbasis Particle Swarm
Optimization”. Program Studi Teknik Infromatika, Fakultas Ilmu
Komputer, Universitas Dian Nuswantoro Semarang.
Manulu, Boy Utomo. 2014. “Analisis Sentimen pada Twitter Menggunakan Text
Mining”. Program Studi Teknologi Informasi, Fakultas Ilmu Komputer
dan Teknologi Informasi, Universitas Sumatera Utara, Medan.
Kumar, A., & Sebastian, T.M. 2012. Sentiment Analysis on Twitter, International
Journal of Computer Science Issues (IJCSI), 9(3), pp.1694-0814.
Lien, J., & Yu, J. 2011. Weighted Naïve Bayes Classification Algorithm Based on
Particle Swarm Optimization. Information School. Yunnan University of
Finance and Economics. Yunnan Kunming, China. IEEE.
F. Tala, “A Study of Stemming Effects on Information
Retrieval in Bahasa Indonesia,” Institute for Logic, Language
and Computation, Universiteit van Amsterdam, 2003.
Adriani, M., Asian, J., Nazief, B., Tahaghoghi, S.M.M., Williams, H.E. 2007.
Stemming Indonesian : A Confix-Stripping Approach. Transaction on
Asian Language Information Processing. Vol. 6, No. 4, Articel 13.
Association for Computing Machinery : New York .
H, Aris Tri Jaka. 2015. Preprocessing Text untuk Meminimalisir Kata yang Tidak
Berarti dalam Proses Text Mining. Program Studi Informatika, Fakultas
TEKNIK, Universitas PGRI Semarang. Jurnal Informatika UPGRIS,
Volume 1 Edisi Juni 2015.
56
Agusta, L. 2009. Perbandingan Algoritma stemming Porter dengan algoritma
Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia.
Proceeding Konferensi Nasional Sistem dan Informatika. Yogyakarta. Hal
196-201.
Li, Jun, Lixin Ding, and Bo Li. "A Novel Naive Bayes Classification Algorithm
Based on Particle Swarm Optimization." The Open Automation and
Control Systems Journal 6.1 (2014).
J. Kennedy and R. C. Eberhart. Particle Swarm Optimization. In Proceedings of
the 1995 IEEE International Conference on Neural Networks. IEEE
Service Center, Piscataway, 1995.
Kouloumpis, E., Wilson, T., Moore, J. 2011. Twitter Sentiment Analysis: The
Good the Bad and the OMG!. Proceedings of the Fifth International AAAI
Conference on Weblogs and Social Media, Menlo Park, California. pp.
538- 541.
Top Related