DETEKSI SIMILARITAS DOKUMEN ILMIAH MENGGUNAKAN ALGORITMA RABIN-KARP
Fakultas Teknologi Industri Universitas Gunadarma
Indonesia
Fakultas Teknologi Industri Universitas Gunadarma
Indonesia
Abstract
Karya ilmiah adalah salah satu hak kekayaan atas intelektual seseorang. Dalam menulis karya ilmiah tentu memiliki tantangan tertentu agar tulisan tersebut merupakan tulisan yang orisinil dan tidak menjiplak secara langsung terhadap karya tulisan orang lain. Di jaman yang serba modern ini sumber daya tulisan mudah didapatkan dimana saja melalui internet. Kemudahan tersebut membuat seseorang dapat melakukan plagiarisme dari sumber tulisan lain dengan melakukan copy-paste pada penulisannya tanpa mengubah struktur kalimat dan mencantumkan sumber tulisan tersebut. Pada penelitian ini akan mengimplementasikan algoritma Rabin – Karp dalam melakukan pendeteksian similaritas suatu dokumen artikel ilmiah dengan dokumen lainnya.Tahapan dari penelitian ini terdiri dari pemisahan baris kalimat, querying google search, preprocessing, yang terdiri dari proses tokenizing, filtering, dan stemming, k-gram, hasing, perhitungan kemiripan kalimat,dan perhitungan kemiripan dokumen input. Dokumen yang dibandingkan adalah kalimat per kalimat pada dokumen input dengan hasil pencarian kalimat tersebut pada google search. Perbandingan tersebut dengan cara membandingkan total hash dari kalimat query dengan hash hasil pencarian kalimat tersebut sehingga dihasilkan similaritas kalimat tersebut yang nantinya diakumulasikan menjadi similaritas dokumen input tersebut. Hasil penelitian ini diharapkan dapat mendeteksi plagiarisme pada sebuah dokumen.
Keywords
References
S. S. Rajmohammod, P. P. Arun, dan G. P. Dnyandeo, “Web crawler : Extracting the web data”, International Engineering Research Journal (IERJ), vol. 1, no. 8, hal. 629–632, 2015.
N. Wubbeling, “The South African Journal of Science-iThenticate”, Academy of Science of Scouth Africa (ASSAF), 2016.
R. Janani dan S. Vijayarani, “An efficient text pattern matching algorithm for retrieving information from desktop”, Indian Journal of Science and Technology, vol. 9, no. 43, 2016.
C. D. Manning, P. Raghavan, dan H. Schutze, An introduction to information retrieval. Cambridge: Cambridge University Press, 2008.
B. Gipp dan N. Meuschke, “Citation pattern matching algorithms for citation-based plagiarism detection: greedy citation tiling, citation chunking and longest common Citation Sequence”, dalam Proceedings of the 11th ACM Symposium on Document Engineering - DocEng ’11, 2011, hal. 249–258.
A. Prastyanti, “Sistem deteksi kemiripan kata pada dua dokumen menggunakan algoritma Rabin-Karp”, Skripsi Sarjana, Universitas Diponegoro, Semarang, 2014.
A. P. U. Siahaan, Mesran, R. Rahim, dan D. Siregar, “K-Gram as a determinant of plagiarism level in Rabin-Karp algorithm”, International Journal of Scientific & Technology Research, vol. 6, no. 7, 2017.
N. H. Ariyani, Sutardi, dan R. Ramadhan, “Aplikasi pendeteksi kemiripan isi teks dokumen menggunakan metode Levenshtein Distance”, SemanTIK, vol. 2, no. 1, hal. 279–286, 2016.
A. A. Wiguna dan I. Rizqa, “Pemanfaatan algoritma Rabin-Karp untuk mengetahui tingkat kemiripan dari source code pada pemrograman Lisp”, Skripsi Sarjana, Universitas Dian Nuswantoro, Semarang, 2016.
A. Firdaus, Ernawati, dan A. Vatresia, “Aplikasi pendeteksi kemiripan pada dokumen teks menggunakan algoritma Nazief & Andriani dan metode Cosine Similirity”, Jurnal Teknologi Informasi, vol. 10, no. 1, hal. 96–109, 2014.