DETEKSI SIMILARITAS DOKUMEN ILMIAH MENGGUNAKAN ALGORITMA RABIN-KARP

Hermas Yuda Pamungkas; Fitrianingsih Fitrianingsih

Authors

Hermas Yuda Pamungkas
Fitrianingsih Fitrianingsih

Abstract

Karya ilmiah adalah salah satu hak kekayaan atas intelektual seseorang. Dalam menulis karya ilmiah tentu memiliki tantangan tertentu agar tulisan tersebut merupakan tulisan yang orisinil dan tidak menjiplak secara langsung terhadap karya tulisan orang lain. Di jaman yang serba modern ini sumber daya tulisan mudah didapatkan dimana saja melalui internet. Kemudahan tersebut membuat seseorang dapat melakukan plagiarisme dari sumber tulisan lain dengan melakukan copy-paste pada penulisannya tanpa mengubah struktur kalimat dan mencantumkan sumber tulisan tersebut. Pada penelitian ini akan mengimplementasikan algoritma Rabin â€“ Karp dalam melakukan pendeteksian similaritas suatu dokumen artikel ilmiah dengan dokumen lainnya.Tahapan dari penelitian ini terdiri dari pemisahan baris kalimat, querying google search, preprocessing, yang terdiri dari proses tokenizing, filtering, dan stemming, k-gram, hasing, perhitungan kemiripan kalimat,dan perhitungan kemiripan dokumen input. Dokumen yang dibandingkan adalah kalimat per kalimat pada dokumen input dengan hasil pencarian kalimat tersebut pada google search. Perbandingan tersebut dengan cara membandingkan total hash dari kalimat query dengan hash hasil pencarian kalimat tersebut sehingga dihasilkan similaritas kalimat tersebut yang nantinya diakumulasikan menjadi similaritas dokumen input tersebut. Hasil penelitian ini diharapkan dapat mendeteksi plagiarisme pada sebuah dokumen.

References

S. S. Rajmohammod, P. P. Arun, dan G. P. Dnyandeo, â€œWeb crawler : Extracting the web dataâ€, International Engineering Research Journal (IERJ), vol. 1, no. 8, hal. 629â€“632, 2015.

N. Wubbeling, â€œThe South African Journal of Science-iThenticateâ€, Academy of Science of Scouth Africa (ASSAF), 2016.

R. Janani dan S. Vijayarani, â€œAn efficient text pattern matching algorithm for retrieving information from desktopâ€, Indian Journal of Science and Technology, vol. 9, no. 43, 2016.

C. D. Manning, P. Raghavan, dan H. Schutze, An introduction to information retrieval. Cambridge: Cambridge University Press, 2008.

B. Gipp dan N. Meuschke, â€œCitation pattern matching algorithms for citation-based plagiarism detection: greedy citation tiling, citation chunking and longest common Citation Sequenceâ€, dalam Proceedings of the 11th ACM Symposium on Document Engineering - DocEng â€™11, 2011, hal. 249â€“258.

A. Prastyanti, â€œSistem deteksi kemiripan kata pada dua dokumen menggunakan algoritma Rabin-Karpâ€, Skripsi Sarjana, Universitas Diponegoro, Semarang, 2014.

A. P. U. Siahaan, Mesran, R. Rahim, dan D. Siregar, â€œK-Gram as a determinant of plagiarism level in Rabin-Karp algorithmâ€, International Journal of Scientific & Technology Research, vol. 6, no. 7, 2017.

N. H. Ariyani, Sutardi, dan R. Ramadhan, â€œAplikasi pendeteksi kemiripan isi teks dokumen menggunakan metode Levenshtein Distanceâ€, SemanTIK, vol. 2, no. 1, hal. 279â€“286, 2016.

A. A. Wiguna dan I. Rizqa, â€œPemanfaatan algoritma Rabin-Karp untuk mengetahui tingkat kemiripan dari source code pada pemrograman Lispâ€, Skripsi Sarjana, Universitas Dian Nuswantoro, Semarang, 2016.

A. Firdaus, Ernawati, dan A. Vatresia, â€œAplikasi pendeteksi kemiripan pada dokumen teks menggunakan algoritma Nazief & Andriani dan metode Cosine Similirityâ€, Jurnal Teknologi Informasi, vol. 10, no. 1, hal. 96â€“109, 2014.

DETEKSI SIMILARITAS DOKUMEN ILMIAH MENGGUNAKAN ALGORITMA RABIN-KARP

Authors

Abstract

References

Downloads

Published

Issue

Section