Analisis Sentimen Cyberbullying Menggunakan Word2Vec dan One-Against-All SVM

Reinhart Halim, Lionel (2020) Analisis Sentimen Cyberbullying Menggunakan Word2Vec dan One-Against-All SVM. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (665kB)
[img]
Preview
Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Share Alike.

Download (359kB) | Preview
[img]
Preview
Text
BAB_I.pdf
Available under License Creative Commons Attribution Share Alike.

Download (305kB) | Preview
[img]
Preview
Text
BAB_II.pdf
Available under License Creative Commons Attribution Share Alike.

Download (662kB) | Preview
[img]
Preview
Text
BAB_III.pdf
Available under License Creative Commons Attribution Share Alike.

Download (609kB) | Preview
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (1MB)
[img]
Preview
Text
BAB_V.pdf
Available under License Creative Commons Attribution Share Alike.

Download (292kB) | Preview
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (796kB)

Abstract

Depresi dan kecemasan sosial merupakan dua dampak negatif utama dari perundungan siber dalam kesehatan mental. Sayangnya, jajak pendapak yang dilakukan oleh UNICEF pada 3 September 2019 menunjukkan bahwa 1 dari 3 orang muda di 30 negara pernah menjadi korban perundungan siber. Penelitian analisis sentimen akan dilakukan untuk mendeteksi suatu komentar yang mengandung perundungan siber. Kumpulan data perundungan siber didapat dari laman Kaggle, yaitu Toxic Comment Classification Challenge. Proses prapemrosesan terdiri dari 4 tahap, yaitu generalisasi komentar (mengubah teks menjadi huruf kecil dan menghapus tanda baca), tokenisasi, penghapusan stopwords, dan pengubahan kata ke bentuk dasar (lemmatization). Metode Word Embedding akan digunakan untuk melakukan analisis sentimen dengan mengimplementasikan Word2Vec. Lalu, metode One-Against-All dengan model (OAA) Support Vector Machine (SVM) akan digunakan untuk melakukan prediksi dalam bentuk banyak label. Model SVM akan melalui proses hyperparameter tuning menggunakan fungsi Randomized Search CV. Kemudian, evaluasi prediksi akan dilakukan dengan menggunakan Micro Averaged F1 Score untuk mengetahui keakuratan prediksi dan menggunakan Hamming Loss untuk mengetahui banyaknya pasangan sampel � label salah diklasifikasikan. Hasil implementasi dari model Word2Vec dan OAA SVM memberikan hasil terbaik terhadap data yang melalui proses pra-pemrosesan generalisasi komentar, tokenisasi, penghapusan stopwords, dan lemmatization dan disimpan sebanyak 100 fitur pada model Word2Vec. Persentase Micro Averaged F1 Score yang dihasilkan sebesar 83.40% dan persentase Hamming Lossyang dihasilkan sebesar 15.13%.

Item Type: Thesis (Bachelor Thesis)
Keywords: Analisis Sentimen, Word Embedding, Word2Vec, One-Against-All, Support Vector Machine, Toxic Comment Classification Challenge, Multi Labelling
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.3 Programs
000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.4 System Programming, Operating System, Computer Interface
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 05 Dec 2020 04:37
Last Modified: 09 Aug 2023 05:33
URI: https://kc.umn.ac.id/id/eprint/13705

Actions (login required)

View Item View Item