IMPLEMENTASI LEXICON BASED DAN NAIVE BAYES PADA ANALISIS SENTIMEN PENGGUNA TWITTER TOPIK PEMILIHAN PRESIDEN 2019

Gusti Nur Aulia
Fakultas Teknologi Industri Universitas Gunadarma
Indonesia
Eka Patriya
Fakultas Teknologi Industri Universitas Gunadarma
Indonesia

Abstract

Pilpres saat ini cukup menyita perhatian, karena berbagai rumor yang beredar. Masyarakat juga menjadi sasaran elit politik, dimana suara mereka merupakan penentu keberlangsungan arah politik untuk lima tahun kedepan. Opini-opini positif, netral maupun negatif dapat menimbulkan ancaman munculnya berita bohong (hoax). Salah satu sarana yang digunakan masyarakat dalam mengekspresikan pilihan politiknya adalah melalui media sosial salah satunya twitter. Data seperti opini publik dapat diolah menjadi sebuah informasi yang bermanfaat, salah satunya melalui analisis sentimen. Pada penelitian ini, akan dilakukan analisis sentimen pada Twitter tentang pemilihan presiden 2019. Tahapan analisis sentimen pada penelitian ini terdiri dari akuisisi data, pre-processing, klasifikasi data, evaluasi data dan visualisasi data. Preprocessing dilakukan dengan case folding, normalisasi data, filtering, ubah kata baku, stopword dan stemming. Penelitian ini melakukan 2 metode yaitu dengan metode Lexicon Based dan Naïve Bayes Classifier. Hasil akhir dari analisis kemudian dihitung nilai akurasi menggunakan confusion matrix dan di visualisasikan menggunakan web server. Penentuan sentimen prediksi dilakukan menggunakan metode Lexicon Based dan Labelisasi dengan perhitungan secara manual. Data latih dan data uji akan digunakan dalam proses pelatihan dan pengujian menggunakan Naive Bayes Classifier. Hasil klasifikasi yang dilakukan oleh metode Naive Bayes Classifier disebut sentimen aktual. Perhitungan tingkat keakurasian antara sentimen prediksi terhadap sentimen aktual menggunakan pengujian confusion matrix. Hasil yang didapatkan adalah tingkat akurasi antara sentimen prediksi dan sentimen aktual dengan Lexicon Based sebesar 64,49% pada data uji dan pada data latih sebanyak 94,2% serta dengan menggunakan Labelisasi dan Naive Bayes Classifier sebesar 86,53% pada data uji dan data latih sebesar 94,08%. Hasil penelitian ini diharapkan dapat membantu melakukan riset atas opini masyarakat pada Twitter mengenai Pilpres 2019 yang mengandung sentimen positif, negatif atau netral.

Keywords
Classifier, Lexicon Based, Prediksi, Naïve Bayes, Twitter
References

M. Adriani, J. Asian, B. Nazief, S. M. Tahaghoghi, dan H. E. Williams, “Stemming Indonesian: A confix-stripping approach”, ACM Transactions on Asian Language Information Processing (TALIP), vol. 6, no. 4, hal. 1 – 33, 2007.

X. Ding, B. Liu, dan P. S. Yu, “A holistic lexicon-based approach to opinion mining”, Dalam Proceedings of the 2008 International Conference on Web Search and Data Mining, 2008.

G. A. Buntoro, T. B. Adji, dan A. E. Permanasari “,Sentiment analysis Twitter dengan kombinasi lexicon based dan double propagation,” dalam CITEE 2014, 2014, hal. 39 – 43.

Falahah dan D. W. A. Nur, “Pengembangan aplikasi sentiment analysis menggunakan metode Naive Bayes (Studi kasus sentiment analysis dari media Twitter)”, Dalam Seminar Nasional Sistem Informasi Indonesia, 2015 Hal. 335 – 340.

I. Kusumawati, “Analisa sentimen menggunakan lexicon based kenaikan harga rokok pada media sosial Twitter,”,Skripsi Sarjana, Universitas Muhammadiyah Surakarta, Surakarta, 2017.

G. A. Buntoro, “Analisis sentimen calon Gubernur DKI Jakarta 2017 di Twitter”, INTEGER: Journal of Information Technology, vol. 2, no. 1, hal. 32 – 41, 2017.

M. M. Munir, M. A. Fauzi, dan R. S. Perdana, “Implementasi metode backpropagation neural network berbasis lexicon based features dan bag of words untuk identifikasi ujaran kebencian pada Twitter,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 10, hal. 3182 – 3191, 2018.

S. K. Ravindran dan V. Garg, Vikram, Mastering Social Media Mining with R. Packt Publishing Ltd. UK, 2015.

W. Baugh, 2013. https://stackoverflow.com/a/17054702.

B. Lantz, Machine Learning With R. Birmingham: Packt Publishing Ltd, 2015.

Information
PDF
6873 times PDF : 2646 times