KLASIFIKASI TOPIK TWEET MENGENAI COVID MENGGUNAKAN METODE MULTINOMIAL NAÏVE BAYES DENGAN PEMBOBOTAN TF-IDF

Lydia Mayasari
Universitas Gunadarma
Indonesia
Dina Indarti
Universitas Gunadarma
Indonesia

Abstract
COVID merupakan virus yang banyak menjangkiti masyarakat Indonesia, bahkan dunia saat ini. Upaya yang dilakukan oleh pemerintah yang tidak luput dari komentar masyarakat mulai dari komentar berupa pujian, kritik, serta saran yang diberikan melalui berbagai media sosial seperti Twitter. Banyak tweet yang dikirimkan mengenai COVID. Tujuan penelitian ini adalah mengklasifikasikan topik tweet mengenai COVID menggunakan Multinomial Naïve Bayes dengan pembobotan Term Frequency-Inverse Document Frequency (TF-IDF). Tahapan penelitian terdiri dari analisis masalah, pengumpulan data, pelabelan data, preprocessing, pembobotan TF-IDF, pelatihan menggunakan Multinomial Naïve Bayes, dan pengujian performa. Data tweet dikumpulkan dari 9 Juni 2021 sampai 9 Juli 2021 dengan kata kunci ‘COVID’. Jumlah tweet yang digunakan dalam penelitian ini yaitu 4.909 yang terdiri dari 3.436 data pelatihan dan 1.473 data pengujian. Topik tweet dalam penelitian ini terdiri dari ekonomi, kesehatan, hiburan, sosial, dan hukum. Klasifikasi topik tweet dilakukan pada tweet bahasa Indonesia. Tweet yang telah dikumpulkan lalu melalui tahap preprocessing terdiri dari case folding, tokenizing, stopword removal, normalisasi, dan stemming. Berdasarkan hasil pengujian, akurasi klasifikasi topik tweet menggunakan Multinomial Naïve Bayes dengan pembobotan TF-IDF sebesar 61%.
Keywords
klasifikasi; Multinomial Naïve Bayes; TF-IDF; Topik Tweet; Twitter
References

Twitter, “Pertanyaan umum pengguna baru,” Twitter, 2021. [Online]. Available: https://help.twitter.com/id/new-user-faq. [Accessed: Jan. 2, 2022].

N. A. Paramastri dan G. Gumilar, “Penggunaan twitter sebagai medium distribusi berita dan newsgathering oleh tirto.id,” Kajian Jurnalisme, vol. 3, no. 1, pp. 18 – 38, 2019.

A. Susilo, C. M. Rumende, C. W. Pitoyo, W. D. Santoso, M. Yulianti, Herikurniawan, R. Sinto, G. Singh, L. Nainggolan, E. J. Nelwan, L. K. Chen, A. Widhani, E. Wijaya, B. Wicaksana, M. Maksum, F. Annisa, C. O. Jasirwan, dan E. Yunihastuti, “Coronavirus disease 2019: tinjauan literatur terkini,” Jurnal Penyakit Dalam Indonesia, vol. 7, no. 1, pp. 45 – 67, 2020.

Satuan Tugas Penanganan COVID-19, “Situasi covid-19 di Indonesia (update per 3 Maret 2022),” Satuan Tugas Penanganan COVID-19, 2021. [Online]. Available: https://covid19.go.id/artikel/2022/03/03/situasi-covid-19-di-indonesia-update-3-maret-2022. [Accessed: Mar 15, 2022].

A. N. A. Hiola, A. Asrifuddin, dan F. L. F. G. Langi, “Hubungan antara upaya pencegahan covid-19 dengan angka konfirmasi positif covid19 di Indonesia,” Jurnal Kesmas, vol. 11, no. 2, pp. 135 – 142, 2022.

I. Zukhrufillah, “Gejala media sosial twitter sebagai media sosial alternatif,” Al-I’lam: Jurnal Komunikasi dan Penyiaran Islam, vol. 1, no. 2, pp. 102 – 109, 2018.

V. Gupta dan G. S. Lehal, “A survey of text mining techniques and applications,” Journal of emerging technologies in web intelligence, vol. 1, no. 1, pp. 60 – 76, 2009.

S. H. Liao, P. H. Chu, dan P. Y. Hsiao, “Data mining techniques and applications–a decade review from 2000 to 2011,” Expert systems with applications, vol. 39, no. 12, pp. 11303 – 11311, 2012.

S. V. Gaikwad, A. Chaugule, dan P. Patil, “Text mining methods and techniques,” International Journal of Computer Applications, vol. 85, no. 17, pp. 42 – 45, 2014.

I. Rish, “An empirical study of the naive bayes classifier,” International Joint Conference on Artificial Intelligence, California, 2006.

C. D. Manning, P. Raghavan, dan H. Schütze, Introduction to information retrieval. New York: Cambridge University Press, 2008.

Rahman, Wiranto, dan A. Doewes, “Online news classification using multinomial naïve bayes,” ITSMART: Jurnal Ilmiah Teknologi dan Informasi, vol. 6, no. 1, pp. 32 – 38, 2017.

V. R. S. Nastiti, S. Basuki, dan Hilman, “Klasifikasi sinopsis novel menggunakan metode naïve bayes classifier,” Repositor, vol. 1, no. 2, pp. 125 – 130, 2019.

S. Robertson, “Understanding inverse document frequency: on theoretical arguments for IDF,” Journal of Documentation, vol. 60, no. 5, pp. 503 – 520, 2004.

D. H. Kalokasari, I. M. Shofi, dan A. H. Setyaningrum, “Implementasi algoritma multinomial naïve bayes classifier pada sistem klasifikasi surat keluar (studi kasus: diskominfo kabupaten tangerang),” Jurnal Teknik Informatika, vol. 10, no.2, pp. 109 – 118, 2017.

C. S. Sriyano dan E. B. Setiawan, “Pendeteksian berita hoax menggunakan naïve bayes multinomial pada twitter dengan fitur pembobotan tf-idf,” e-Proceeding of Engineering, vol. 8, no. 2, 2021, pp. 3396 – 3405.

S. S. Ritonga, E. B. Setiawan, dan I. Kurniawan, “Analisis trending topik pada twitter menggunakan metode naïve bayes dengan pembobotan tf-idf,” e-Proceeding of Engineering, vol. 7, No. 1, 2020, pp. 2806 – 2816.

A. Sabrani, I. G. P. W. Wedashwara, dan F. Bimantoro, “Metode multinomial naïve bayes untuk klasifikasi artikel online tentang gempa di Indonesia,” Jurnal Teknologi Informasi, Komputer dan Aplikasinya (JTIKA), vol. 2, no. 1, pp. 89 – 100, 2020.

R. M. Furqon dan E. B. Setiawan, “Deteksi berita rumor pada sosial media twitter menggunakan metode naïve bayes multinomial dengan pembobotan tf-idf,” e-Proceeding of Engineering, vol. 7, no. 2, 2020, pp. 7916 – 7925.

A. Librian, “High quality stemmer library for Indonesian Language (Bahasa),” github, 2017. [Online]. Available: https://github.com/sastrawi/sastrawi [Accessed: Jan. 15, 2022].

Information
PDF
630 times PDF : 377 times