UMN Knowledge Center

Rancang Bangun Aplikasi Visualisasi Fasttext Word2Vec Model Menggunakan Algoritma T-distributed Stochastic Neighbor Embedding

Jesslyn Putri Cahyadi, Tio, (2020) Rancang Bangun Aplikasi Visualisasi Fasttext Word2Vec Model Menggunakan Algoritma T-distributed Stochastic Neighbor Embedding. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img]
Preview
PDF
HALAMAN_AWAL.pdf

Download (570kB) | Preview
[img]
Preview
PDF
DAFTAR_PUSTAKA.pdf

Download (133kB) | Preview
[img]
Preview
PDF
BAB_I.pdf

Download (94kB) | Preview
[img] PDF
BAB_II.pdf
Restricted to Registered users only

Download (421kB)
[img] PDF
BAB_III.pdf
Restricted to Registered users only

Download (473kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (1MB)
[img] PDF
BAB_V.pdf
Restricted to Registered users only

Download (12kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (1MB)

Abstract

Penelitian ini bertujuan untuk memvisualisasikan FastText Word2Vec model dan mengukur tingkat akurasi FastText dalam fitur perbaikan kata yang dimilikinya, perbaikan kata yang dimaksud adalah FastText dapat memprediksi kata benar dari sebuah kata typo berdasarkan vektor yang dimiliki kata tersebut. Tujuan lainnya adalah untuk mengukur akurasi t-Distributed Stochastic Neighbor Embedding dalam mereduksi dimensi. Namun, proses visualisasi tentunya tidak dapat secara langsung dilakukan, karena dalam pre-trained model yang disediakan oleh FastText, model akan memetakan sebuah kata ke dalam vektor berukuran 300 dimensi, sedangkan teknologi visualisasi yang umum dilakukan membutuhkan dimensi yang rendah yaitu 3 dimensi. Oleh karena itu, untuk memvisualisasikan data berdimensi tinggi, salah satu teknik pre-processing yang umum dilakukan adalah dimensionality reduction. Algoritma t-Distributed Stochastic Neighbor Embedding digunakan untuk mereduksi dimensi vektor menjadi 3 dimensi. Berdasarkan hal tersebut, tingkat akurasi fitur perbaikan kata FastText diukur menggunakan cosine similarity, akurasi t-SNE dalam mereduksi dimensi vektor diukur menggunakan Euclidean distance, dan vektor yang telah direduksi akan divisualisasikan. Hasil uji coba yang dilakukan menghasilkan akurasi yang dimiliki FastText dalam memetakan kata typo berdekatan dengan kata aslinya memiliki ratarata sebesar 80,16% dan akurasi dimensionality reduction t-SNE adalah 77,50%.

Item Type: Thesis (Bachelor Thesis)
Uncontrolled Keywords: Cosine Similarity, Euclidean Distance, FastText, t-SNE, Word2Vec
Subjects: T Technology > T Technology (General) > T55 Industrial engineering. Management engineering > T58.5-58.64 Information technology
Divisions: Fakultas Teknik Informatika > Program Studi Informatika
SWORD Depositor: mr admin umn
Depositing User: mr admin umn
Date Deposited: 04 Dec 2020 19:23
Last Modified: 04 Dec 2020 19:23
URI: http://kc.umn.ac.id/id/eprint/14500

Actions (login required)

View Item View Item