PERBANDINGAN ALGORITMA KLASIFIKASI DALAM PENGKLASIFIKASIAN DATA PENYAKIT JANTUNG KORONER
Fakultas Teknologi Industri Universitas Gunadarma
Indonesia
Fakultas Teknologi Industri Universitas Gunadarma
Indonesia
Abstract
Penyakit Jantung Koroner (PJK) menjadi penyebab kematian tertinggi pada semua umur setelah stroke. Hal ini mendorong banyak penelitian terhadap penyakit jantung koroner, salah satunya menggunakan metode berbasis komputer. Pengolahan data dalam jumlah besar dapat dilakukan dengan klasifikasi menggunakan algoritma tertentu sehingga hasilnya cepat dan akurat. Metode klasifikasi yang umum digunakan antara lain Naïve Bayes, K-Nearest Neighbor, Decision Tree dan Random Forest. Metode Naïve Bayes menggunakan probabilitas disetiap data, metode K-Nearest Neighbor menggunakan perhitungan jarak, metode Decision Tree menggunakan pohon keputusan, sedangkan metode Random Forest menggunakan beberapa pohon keputusan yang disatukan. Penelitian ini bertujuan untuk membandingkan keempat algoritma tersebut dalam mengklasifikasikan data penyakit jantung koroner. Perbandingan algoritma akan dilihat berdasarkan performance measure yang terdiri dari tingkatan akurasi, recall disetiap kelas, dan presisi disetiap kelas. Pada setiap algoritma diuji menggunakan cross validation. Berdasarkan hasil perbandingan terhadap 300 dataset penyakit jantung koroner, algoritma Random Forest lebih baik dan optimal dibanding dengan Algoritma Naïve Bayes, K-Nearest Neighbor, dan Decision Tree untuk mengklasifikasikan penyakit jantung koroner. Hasil klasifikasi dengan algoritma Random Forest memiliki rerata tingkat akurasi sebesar 85,668 % dengan recall kelas ’1’ adalah 89 %, recall kelas ’0’ adalah 83,6%, presisi kelas ’1’ adalah 85%, dan presisi kelas ’0’ adalah 85,8%.
Keywords
References
Kementerian Kesehatan RI, “Penyakit jantung penyebab kematian tertinggi, kemenkes ingatkan cerdik,” Kementerian Kesehatan RI, 2017. [Daring]. Tersedia: http://www.depkes.go.id/article/view/17073100005/penyakit-jantung-penyebab-kematian-tertinggi-kemenkes-ingatkan-cerdik-.html. [Diakses: 25 April 2019].
D. Sartika dan D. I. Sensuse, “Perbandingan algoritma klasifikasi Naive Bayes, Nearest Neighbour, dan Decision Tree pada studi kasus pengambilan keputusan pemilihan pola pakaian,” Jatisi, vol. 1, no. 2, hal. 153 – 154, 2017.
M. Lestari, “Penerapan algoritma klasifikasi Nearest Neighbor (K-NN) untuk mendeteksi penyakit jantung,” Faktor Exacta, vol. 7, no. 4, hal. 366 – 371, 2014.
F. Maspiyanti dan J. Gatc, “Diagnosa penyakit jantung pada ponsel menggunakan pohon keputusan,” Jurnal Teknologi Terpadu, vol. 1, no. 1, hal. 13 – 20, 2015.
M. R. Amiarrahman dan T. Handhika, “Analisis dan implementasi algoritma klasifikasi Random Forest dalam pengenalan Bahasa Isyarat Indonesia (BISINDO),” Prosiding Seminar Nasional Inovasi Teknologi, 2017, hal. 83 – 88.
A. M. Puspitasari, D. E. Ratnawati, dan A. W. Widodo, “Klasifikasi penyakit gigi dan mulut menggunakan metode Support Vector Machine,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 2, hal. 802 – 810, 2018.
T. Retnasari dan E. Rahmawati, “Diagnosa prediksi penyakit jantung dengan model algoritma Naïve Bayes dan algoritma C4.5,” Prosiding Konferensi Nasional Ilmu Sosial dan Teknologi (KNiST), 2017, hal. 7 – 12.
S. Dewi, “Komparasi 5 metode algoritma klasifikasi data mining pada prediksi keberhasilan pemasaran produk layanan perbankan,” Jurnal Techno Nusa Mandiri, vol. 8, no. 1, hal. 60 – 66, 2016.
Kaggle Dataset, “Heart disease UCI,” Kaggle Dataset, 2019. [Daring]. Tersedia: https://www.kaggle.com/ronitf/heart-disease-uci. [Diakses: 22 April 2019].