Brianlian, Brianlian (2024) Implementasi Pretrained Word Embedding GloVe dan Support Vector Machine dalam Mendeteksi Berita Palsu. Bachelor Thesis thesis, Universitas Multimedia Nusantara.
PDF
HALAMAN_AWAL.pdf Download (1MB) |
|
PDF
BAB_I.pdf Download (211kB) |
|
PDF
BAB_II.pdf Download (433kB) |
|
PDF
BAB_III.pdf Download (278kB) |
|
PDF
BAB_IV.pdf Restricted to Registered users only Download (443kB) |
|
PDF
BAB_V.pdf Download (203kB) |
|
PDF
DAFTAR_PUSTAKA.pdf Download (207kB) |
|
PDF
LAMPIRAN.pdf Restricted to Registered users only Download (1MB) |
Abstract
Berita palsu merupakan salah satu masalah yang disebabkan karena perkembangan teknologi. Sebagian besar berita palsu yang ada di internet tersebar dalam bentuk teks. Dalam memproses data teks perlu melakukan feature extraction untuk mengubah data teks menjadi vektor sehingga dapat diklasifikasikan. Metode vektorisasi kata yang digunakan dalam feature extraction teks berita sangat berpengaruh terhadap hasil klasifikasi. Metode vektorisasi kata yang digunakan pada penelitian ini yaitu term frequency-inverse document frequency (TF-IDF), Word2Vec, dan GloVe. GloVe adalah model unsupervised learning yang memanfaatkan statistik kemunculan kata secara global pada suatu korpus. Algoritma klasifikasi support vector machine (SVM) digunakan untuk melakukan klasifikasi berita asli atau palsu terhadap data tersebut. SVM bekerja dengan cara memetakan data ke dalam sebuah ruang vektor yang lalu membentuk sebuah hyperplane optimal untuk memisahkan masing-masing kelas. Upaya untuk memastikan bahwa hyperplane yang dibentuk oleh SVM dapat memisahkan kelas dengan baik adalah dengan melakukan hyperparameter tuning. Proses ini dilakukan setelah training dengan cara membandingkan kombinasi kandidat hyperparameter sehingga kombinasi tersebut dapat menghasilkan hyperplane paling optimal. Performa TF-IDF dengan SVM menempati urutan pertama memiliki akurasi sebesar 97.86%, presisi sebesar 97.39%, recall sebesar 98.42%, dan F1-score sebesar 97.92%. Performa GloVe dengan SVM menempati urutan kedua setelah TF-IDF memiliki akurasi sebesar 90.61%, presisi sebesar 89.81%, recall sebesar 92.06%, dan F1-score sebesar 90.92%. Word2Vec menempati urutan ketiga memiliki akurasi sebesar 89.17%, presisi sebesar 88.85%, recall sebesar 90.08%, dan F1-score sebesar 89.46%.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Keywords: | Berita palsu, GloVe, SVM, TF-IDF, Word2Vec, word embedding |
Subjects: | ?? T58.5-58.64 ?? |
Divisions: | Faculty of Engineering & Informatics > Informatics |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 09 Nov 2024 11:07 |
Last Modified: | 09 Nov 2024 11:07 |
URI: | https://kc.umn.ac.id/id/eprint/33736 |
Actions (login required)
View Item |