Reinhart Halim, Lionel (2020) Analisis Sentimen Cyberbullying Menggunakan Word2Vec dan One-Against-All SVM. Bachelor Thesis thesis, Universitas Multimedia Nusantara.
Text
HALAMAN_AWAL.pdf Restricted to Registered users only Available under License Creative Commons Attribution Share Alike. Download (665kB) |
||
|
Text
DAFTAR_PUSTAKA.pdf Available under License Creative Commons Attribution Share Alike. Download (359kB) | Preview |
|
|
Text
BAB_I.pdf Available under License Creative Commons Attribution Share Alike. Download (305kB) | Preview |
|
|
Text
BAB_II.pdf Available under License Creative Commons Attribution Share Alike. Download (662kB) | Preview |
|
|
Text
BAB_III.pdf Available under License Creative Commons Attribution Share Alike. Download (609kB) | Preview |
|
Text
BAB_IV.pdf Restricted to Registered users only Available under License Creative Commons Attribution Share Alike. Download (1MB) |
||
|
Text
BAB_V.pdf Available under License Creative Commons Attribution Share Alike. Download (292kB) | Preview |
|
Text
LAMPIRAN.pdf Restricted to Registered users only Available under License Creative Commons Attribution Share Alike. Download (796kB) |
Abstract
Depresi dan kecemasan sosial merupakan dua dampak negatif utama dari perundungan siber dalam kesehatan mental. Sayangnya, jajak pendapak yang dilakukan oleh UNICEF pada 3 September 2019 menunjukkan bahwa 1 dari 3 orang muda di 30 negara pernah menjadi korban perundungan siber. Penelitian analisis sentimen akan dilakukan untuk mendeteksi suatu komentar yang mengandung perundungan siber. Kumpulan data perundungan siber didapat dari laman Kaggle, yaitu Toxic Comment Classification Challenge. Proses prapemrosesan terdiri dari 4 tahap, yaitu generalisasi komentar (mengubah teks menjadi huruf kecil dan menghapus tanda baca), tokenisasi, penghapusan stopwords, dan pengubahan kata ke bentuk dasar (lemmatization). Metode Word Embedding akan digunakan untuk melakukan analisis sentimen dengan mengimplementasikan Word2Vec. Lalu, metode One-Against-All dengan model (OAA) Support Vector Machine (SVM) akan digunakan untuk melakukan prediksi dalam bentuk banyak label. Model SVM akan melalui proses hyperparameter tuning menggunakan fungsi Randomized Search CV. Kemudian, evaluasi prediksi akan dilakukan dengan menggunakan Micro Averaged F1 Score untuk mengetahui keakuratan prediksi dan menggunakan Hamming Loss untuk mengetahui banyaknya pasangan sampel � label salah diklasifikasikan. Hasil implementasi dari model Word2Vec dan OAA SVM memberikan hasil terbaik terhadap data yang melalui proses pra-pemrosesan generalisasi komentar, tokenisasi, penghapusan stopwords, dan lemmatization dan disimpan sebanyak 100 fitur pada model Word2Vec. Persentase Micro Averaged F1 Score yang dihasilkan sebesar 83.40% dan persentase Hamming Lossyang dihasilkan sebesar 15.13%.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Keywords: | Analisis Sentimen, Word Embedding, Word2Vec, One-Against-All, Support Vector Machine, Toxic Comment Classification Challenge, Multi Labelling |
Subjects: | 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.3 Programs 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.4 System Programming, Operating System, Computer Interface |
Divisions: | Faculty of Engineering & Informatics > Informatics |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 05 Dec 2020 04:37 |
Last Modified: | 09 Aug 2023 05:33 |
URI: | https://kc.umn.ac.id/id/eprint/13705 |
Actions (login required)
View Item |