Implementasi Algoritma Levenshtein Distance untuk Typo Correction Bahasa Indonesia pada User Feedback Aplikasi

⭐ Setiabudi, Reza (2020) Implementasi Algoritma Levenshtein Distance untuk Typo Correction Bahasa Indonesia pada User Feedback Aplikasi. Bachelor Thesis, Universitas Multimedia Nusantara.

Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.
Download (739kB)

Text
DAFTAR_PUSTAKA.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.
Download (185kB)

Preview

Text
BAB_I.pdf
Available under License Creative Commons Attribution Share Alike.
Download (199kB) | Preview

Preview

Text
BAB_II.pdf
Available under License Creative Commons Attribution Share Alike.
Download (258kB) | Preview

Text
BAB_III.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.
Download (253kB)

Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.
Download (373kB)

Text
BAB_V.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.
Download (120kB)

Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.
Download (965kB)

Abstract

Penelitian ini mengimplementasikan Algoritma Levenshtein Distance untuk Typo Correction pada User Feedback. Typo Correction dilakukan dalam tahap preprocessing dalam melakukan klasifikasi User Feedback, agar tidak ada kata yang salah penulisan dianggap menjadi kata yang berbeda pada perhitungan klasifikasi. Kata yang error akan dicocokan dengan kata yang ada pada Kamus Besar Bahasa Indonesia (KBBI) dan dicari jarak yang terpendek dan nilai kemiripan tertinggi sebagai penggantinya. Dataset User Feedback dilakukan Tokenizing lalu dimasukan ke fungsi Typo Correction per token-nya, kemudian di return kata yang terdapat dalam KBBI. Kemudian output yang dibentuk menjadi dataframe dibagi datanya untuk train dan test, baru kemudian dilakukan klasifikasi menggunakan algoritma Naive Bayes. Berdasarkan hasil uji coba, dengan pengelompokan kata berdasarkan panjang karakter memiliki akurasi dari 14,2% sampai 90,9%, sedangkan dengan hasil pengujian klasifikasi akurasi meningkat sebesar 8% dari data yang tidak dilakukan typo correcting.

Item Type:	Thesis (Bachelor Thesis)
Creators:	Setiabudi, Reza (00000012926)
Contributors:	Rusli, Andre
Keywords:	User Feedback, Requirements Engineering, String Similarity, Levenshtein Distance, Typo Correction
Subjects:	000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.2 Programming for Specific Computers, Algorithm, HTML, PHP, java, C++
Divisions:	Faculty of Engineering & Informatics > Informatics
Date Deposited:	05 Dec 2020 07:01
URI:	https://kc.umn.ac.id/id/eprint/13499

Actions (login required)

View Item

This repository is indexed on

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.