UMN Knowledge Center

Analisis Sentimen Cyberbullying Menggunakan Word2Vec dan One-Against-All SVM

Reinhart Halim, Lionel (2020) Analisis Sentimen Cyberbullying Menggunakan Word2Vec dan One-Against-All SVM. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img]
Preview
PDF
HALAMAN_AWAL.pdf

Download (548kB) | Preview
[img]
Preview
PDF
DAFTAR_PUSTAKA.pdf

Download (245kB) | Preview
[img]
Preview
PDF
BAB_I.pdf

Download (191kB) | Preview
[img] PDF
BAB_II.pdf
Restricted to Registered users only

Download (548kB)
[img] PDF
BAB_III.pdf
Restricted to Registered users only

Download (494kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (1MB)
[img] PDF
BAB_V.pdf
Restricted to Registered users only

Download (178kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (681kB)

Abstract

Depresi dan kecemasan sosial merupakan dua dampak negatif utama dari perundungan siber dalam kesehatan mental. Sayangnya, jajak pendapak yang dilakukan oleh UNICEF pada 3 September 2019 menunjukkan bahwa 1 dari 3 orang muda di 30 negara pernah menjadi korban perundungan siber. Penelitian analisis sentimen akan dilakukan untuk mendeteksi suatu komentar yang mengandung perundungan siber. Kumpulan data perundungan siber didapat dari laman Kaggle, yaitu Toxic Comment Classification Challenge. Proses prapemrosesan terdiri dari 4 tahap, yaitu generalisasi komentar (mengubah teks menjadi huruf kecil dan menghapus tanda baca), tokenisasi, penghapusan stopwords, dan pengubahan kata ke bentuk dasar (lemmatization). Metode Word Embedding akan digunakan untuk melakukan analisis sentimen dengan mengimplementasikan Word2Vec. Lalu, metode One-Against-All dengan model (OAA) Support Vector Machine (SVM) akan digunakan untuk melakukan prediksi dalam bentuk banyak label. Model SVM akan melalui proses hyperparameter tuning menggunakan fungsi Randomized Search CV. Kemudian, evaluasi prediksi akan dilakukan dengan menggunakan Micro Averaged F1 Score untuk mengetahui keakuratan prediksi dan menggunakan Hamming Loss untuk mengetahui banyaknya pasangan sampel – label salah diklasifikasikan. Hasil implementasi dari model Word2Vec dan OAA SVM memberikan hasil terbaik terhadap data yang melalui proses pra-pemrosesan generalisasi komentar, tokenisasi, penghapusan stopwords, dan lemmatization dan disimpan sebanyak 100 fitur pada model Word2Vec. Persentase Micro Averaged F1 Score yang dihasilkan sebesar 83.40% dan persentase Hamming Lossyang dihasilkan sebesar 15.13%.

Item Type: Thesis (Bachelor Thesis)
Uncontrolled Keywords: Analisis Sentimen, Word Embedding, Word2Vec, One-Against-All, Support Vector Machine, Toxic Comment Classification Challenge, Multi Labelling
Subjects: T Technology > T Technology (General) > T55 Industrial engineering. Management engineering > T58.5-58.64 Information technology
Divisions: Fakultas Teknik Informatika > Program Studi Informatika
SWORD Depositor: mr admin umn
Depositing User: mr admin umn
Date Deposited: 05 Dec 2020 04:37
Last Modified: 05 Dec 2020 04:37
URI: http://kc.umn.ac.id/id/eprint/13705

Actions (login required)

View Item View Item