Rancang Bangun Aplikasi Visualisasi Fasttext Word2Vec Model Menggunakan Algoritma T-distributed Stochastic Neighbor Embedding

Jesslyn Putri Cahyadi, Tio, (2020) Rancang Bangun Aplikasi Visualisasi Fasttext Word2Vec Model Menggunakan Algoritma T-distributed Stochastic Neighbor Embedding. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (688kB)
[img]
Preview
Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Share Alike.

Download (247kB) | Preview
[img]
Preview
Text
BAB_I.pdf
Available under License Creative Commons Attribution Share Alike.

Download (208kB) | Preview
[img]
Preview
Text
BAB_II.pdf
Available under License Creative Commons Attribution Share Alike.

Download (534kB) | Preview
[img]
Preview
Text
BAB_III.pdf
Available under License Creative Commons Attribution Share Alike.

Download (592kB) | Preview
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (1MB)
[img]
Preview
Text
BAB_V.pdf
Available under License Creative Commons Attribution Share Alike.

Download (126kB) | Preview
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (1MB)

Abstract

Penelitian ini bertujuan untuk memvisualisasikan FastText Word2Vec model dan mengukur tingkat akurasi FastText dalam fitur perbaikan kata yang dimilikinya, perbaikan kata yang dimaksud adalah FastText dapat memprediksi kata benar dari sebuah kata typo berdasarkan vektor yang dimiliki kata tersebut. Tujuan lainnya adalah untuk mengukur akurasi t-Distributed Stochastic Neighbor Embedding dalam mereduksi dimensi. Namun, proses visualisasi tentunya tidak dapat secara langsung dilakukan, karena dalam pre-trained model yang disediakan oleh FastText, model akan memetakan sebuah kata ke dalam vektor berukuran 300 dimensi, sedangkan teknologi visualisasi yang umum dilakukan membutuhkan dimensi yang rendah yaitu 3 dimensi. Oleh karena itu, untuk memvisualisasikan data berdimensi tinggi, salah satu teknik pre-processing yang umum dilakukan adalah dimensionality reduction. Algoritma t-Distributed Stochastic Neighbor Embedding digunakan untuk mereduksi dimensi vektor menjadi 3 dimensi. Berdasarkan hal tersebut, tingkat akurasi fitur perbaikan kata FastText diukur menggunakan cosine similarity, akurasi t-SNE dalam mereduksi dimensi vektor diukur menggunakan Euclidean distance, dan vektor yang telah direduksi akan divisualisasikan. Hasil uji coba yang dilakukan menghasilkan akurasi yang dimiliki FastText dalam memetakan kata typo berdekatan dengan kata aslinya memiliki ratarata sebesar 80,16% dan akurasi dimensionality reduction t-SNE adalah 77,50%.

Item Type: Thesis (Bachelor Thesis)
Keywords: Cosine Similarity, Euclidean Distance, FastText, t-SNE, Word2Vec
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.2 Programming for Specific Computers, Algorithm, HTML, PHP, java, C++
000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.5 Application / Software
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: mr admin umn
Depositing User: mr admin umn
Date Deposited: 04 Dec 2020 19:23
Last Modified: 09 Aug 2023 00:18
URI: https://kc.umn.ac.id/id/eprint/14500

Actions (login required)

View Item View Item