Jesslyn Putri Cahyadi, Tio, (2020) Rancang Bangun Aplikasi Visualisasi Fasttext Word2Vec Model Menggunakan Algoritma T-distributed Stochastic Neighbor Embedding. Bachelor Thesis thesis, Universitas Multimedia Nusantara.
Text
HALAMAN_AWAL.pdf Restricted to Registered users only Available under License Creative Commons Attribution Share Alike. Download (688kB) |
||
|
Text
DAFTAR_PUSTAKA.pdf Available under License Creative Commons Attribution Share Alike. Download (247kB) | Preview |
|
|
Text
BAB_I.pdf Available under License Creative Commons Attribution Share Alike. Download (208kB) | Preview |
|
|
Text
BAB_II.pdf Available under License Creative Commons Attribution Share Alike. Download (534kB) | Preview |
|
|
Text
BAB_III.pdf Available under License Creative Commons Attribution Share Alike. Download (592kB) | Preview |
|
Text
BAB_IV.pdf Restricted to Registered users only Available under License Creative Commons Attribution Share Alike. Download (1MB) |
||
|
Text
BAB_V.pdf Available under License Creative Commons Attribution Share Alike. Download (126kB) | Preview |
|
Text
LAMPIRAN.pdf Restricted to Registered users only Available under License Creative Commons Attribution Share Alike. Download (1MB) |
Abstract
Penelitian ini bertujuan untuk memvisualisasikan FastText Word2Vec model dan mengukur tingkat akurasi FastText dalam fitur perbaikan kata yang dimilikinya, perbaikan kata yang dimaksud adalah FastText dapat memprediksi kata benar dari sebuah kata typo berdasarkan vektor yang dimiliki kata tersebut. Tujuan lainnya adalah untuk mengukur akurasi t-Distributed Stochastic Neighbor Embedding dalam mereduksi dimensi. Namun, proses visualisasi tentunya tidak dapat secara langsung dilakukan, karena dalam pre-trained model yang disediakan oleh FastText, model akan memetakan sebuah kata ke dalam vektor berukuran 300 dimensi, sedangkan teknologi visualisasi yang umum dilakukan membutuhkan dimensi yang rendah yaitu 3 dimensi. Oleh karena itu, untuk memvisualisasikan data berdimensi tinggi, salah satu teknik pre-processing yang umum dilakukan adalah dimensionality reduction. Algoritma t-Distributed Stochastic Neighbor Embedding digunakan untuk mereduksi dimensi vektor menjadi 3 dimensi. Berdasarkan hal tersebut, tingkat akurasi fitur perbaikan kata FastText diukur menggunakan cosine similarity, akurasi t-SNE dalam mereduksi dimensi vektor diukur menggunakan Euclidean distance, dan vektor yang telah direduksi akan divisualisasikan. Hasil uji coba yang dilakukan menghasilkan akurasi yang dimiliki FastText dalam memetakan kata typo berdekatan dengan kata aslinya memiliki ratarata sebesar 80,16% dan akurasi dimensionality reduction t-SNE adalah 77,50%.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Keywords: | Cosine Similarity, Euclidean Distance, FastText, t-SNE, Word2Vec |
Subjects: | 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.2 Programming for Specific Computers, Algorithm, HTML, PHP, java, C++ 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.5 Application / Software |
Divisions: | Faculty of Engineering & Informatics > Informatics |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 04 Dec 2020 19:23 |
Last Modified: | 09 Aug 2023 00:18 |
URI: | https://kc.umn.ac.id/id/eprint/14500 |
Actions (login required)
View Item |