Implementasi Locality Sensitive Hashing Dan Jaccard Index Pada Aplikasi Pendeteksi Kemiripan Dokumen

Berlian, David (2018) Implementasi Locality Sensitive Hashing Dan Jaccard Index Pada Aplikasi Pendeteksi Kemiripan Dokumen. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
DavidBerlian_141100110010.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (7MB)

Abstract

Perkembangan kecanggihan teknologi informasi berdampak pada meningkatnya kebutuhan akan informasi. Penggunaan teknologi dalam melakukan pencarian informasi membuat sebagian besar komputer memiliki banyak dokumen yang mirip dikarenakan copy dan sharing dari dokumen antar pengguna internet. Dokumen yang mirip dalam jumlah yang banyak akan membuat pengguna kesulitan dalam mencari dokumen yang dibutuhkan. Oleh karena itu, dibuatlah sebuah aplikasi pendeteksi kemiripan dokumen yang dapat digunakan dalam mendeteksi kemiripan dokumen dengan dokumen yang lainnya. Aplikasi dibangun dengan mengimplementasikan algoritma Locality Sensitive Hashing dan Jaccard Index guna menghitung kemiripan berdasarkan kemiripan lexical. Proses pengujian dilakukan dengan menggunakan 2000 dokumen dari 20 newsgroups dengan rata – rata waktu yang dibutuhkan untuk melakukan pengujian adalah kurang lebih 5.8 detik. Berdasarkan data pengujian, nilai rata-rata F-Measure terbaik didapatkan dengan nilai ambang batas 0.1 pada 0.3 threshold LSH, diperoleh nilai rata-rata precision sebesar 0.271, nilai rata-rata recall sebesar 0.652, dan F-Measure sebesar 0.384, serta ditemukan bahwa semakin besar nilai permutasi maka nilai F-Measure akan semakin membaik.

Item Type: Thesis (Bachelor Thesis)
Keywords: informasi, jaccard index, kemiripan dokumen, Locality Sensitive Hashing
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.2 Programming for Specific Computers, Algorithm, HTML, PHP, java, C++
000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.5 Application / Software
Divisions: Faculty of Engineering & Informatics > Informatics
Depositing User: Administrator UMN Library
Date Deposited: 28 Jan 2019 04:50
Last Modified: 09 May 2023 05:33
URI: https://kc.umn.ac.id/id/eprint/4954

Actions (login required)

View Item View Item