Implementasi Algoritma Levenshtein Distance untuk Typo Correction Bahasa Indonesia pada User Feedback Aplikasi

Setiabudi, Reza (2020) Implementasi Algoritma Levenshtein Distance untuk Typo Correction Bahasa Indonesia pada User Feedback Aplikasi. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (739kB)
[img]
Preview
Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Share Alike.

Download (185kB) | Preview
[img]
Preview
Text
BAB_I.pdf
Available under License Creative Commons Attribution Share Alike.

Download (199kB) | Preview
[img]
Preview
Text
BAB_II.pdf
Available under License Creative Commons Attribution Share Alike.

Download (258kB) | Preview
[img]
Preview
Text
BAB_III.pdf
Available under License Creative Commons Attribution Share Alike.

Download (253kB) | Preview
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (373kB)
[img]
Preview
Text
BAB_V.pdf
Available under License Creative Commons Attribution Share Alike.

Download (120kB) | Preview
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (965kB)

Abstract

Penelitian ini mengimplementasikan Algoritma Levenshtein Distance untuk Typo Correction pada User Feedback. Typo Correction dilakukan dalam tahap preprocessing dalam melakukan klasifikasi User Feedback, agar tidak ada kata yang salah penulisan dianggap menjadi kata yang berbeda pada perhitungan klasifikasi. Kata yang error akan dicocokan dengan kata yang ada pada Kamus Besar Bahasa Indonesia (KBBI) dan dicari jarak yang terpendek dan nilai kemiripan tertinggi sebagai penggantinya. Dataset User Feedback dilakukan Tokenizing lalu dimasukan ke fungsi Typo Correction per token-nya, kemudian di return kata yang terdapat dalam KBBI. Kemudian output yang dibentuk menjadi dataframe dibagi datanya untuk train dan test, baru kemudian dilakukan klasifikasi menggunakan algoritma Naive Bayes. Berdasarkan hasil uji coba, dengan pengelompokan kata berdasarkan panjang karakter memiliki akurasi dari 14,2% sampai 90,9%, sedangkan dengan hasil pengujian klasifikasi akurasi meningkat sebesar 8% dari data yang tidak dilakukan typo correcting.

Item Type: Thesis (Bachelor Thesis)
Keywords: User Feedback, Requirements Engineering, String Similarity, Levenshtein Distance, Typo Correction
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.2 Programming for Specific Computers, Algorithm, HTML, PHP, java, C++
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: mr admin umn
Depositing User: mr admin umn
Date Deposited: 05 Dec 2020 07:01
Last Modified: 25 Aug 2023 08:29
URI: https://kc.umn.ac.id/id/eprint/13499

Actions (login required)

View Item View Item