Implementasi Pretrained Word Embedding GloVe dan Support Vector Machine dalam Mendeteksi Berita Palsu

Brianlian, Brianlian (2024) Implementasi Pretrained Word Embedding GloVe dan Support Vector Machine dalam Mendeteksi Berita Palsu. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf

Download (1MB)
[img] PDF
BAB_I.pdf

Download (211kB)
[img] PDF
BAB_II.pdf

Download (433kB)
[img] PDF
BAB_III.pdf

Download (278kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (443kB)
[img] PDF
BAB_V.pdf

Download (203kB)
[img] PDF
DAFTAR_PUSTAKA.pdf

Download (207kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (1MB)

Abstract

Berita palsu merupakan salah satu masalah yang disebabkan karena perkembangan teknologi. Sebagian besar berita palsu yang ada di internet tersebar dalam bentuk teks. Dalam memproses data teks perlu melakukan feature extraction untuk mengubah data teks menjadi vektor sehingga dapat diklasifikasikan. Metode vektorisasi kata yang digunakan dalam feature extraction teks berita sangat berpengaruh terhadap hasil klasifikasi. Metode vektorisasi kata yang digunakan pada penelitian ini yaitu term frequency-inverse document frequency (TF-IDF), Word2Vec, dan GloVe. GloVe adalah model unsupervised learning yang memanfaatkan statistik kemunculan kata secara global pada suatu korpus. Algoritma klasifikasi support vector machine (SVM) digunakan untuk melakukan klasifikasi berita asli atau palsu terhadap data tersebut. SVM bekerja dengan cara memetakan data ke dalam sebuah ruang vektor yang lalu membentuk sebuah hyperplane optimal untuk memisahkan masing-masing kelas. Upaya untuk memastikan bahwa hyperplane yang dibentuk oleh SVM dapat memisahkan kelas dengan baik adalah dengan melakukan hyperparameter tuning. Proses ini dilakukan setelah training dengan cara membandingkan kombinasi kandidat hyperparameter sehingga kombinasi tersebut dapat menghasilkan hyperplane paling optimal. Performa TF-IDF dengan SVM menempati urutan pertama memiliki akurasi sebesar 97.86%, presisi sebesar 97.39%, recall sebesar 98.42%, dan F1-score sebesar 97.92%. Performa GloVe dengan SVM menempati urutan kedua setelah TF-IDF memiliki akurasi sebesar 90.61%, presisi sebesar 89.81%, recall sebesar 92.06%, dan F1-score sebesar 90.92%. Word2Vec menempati urutan ketiga memiliki akurasi sebesar 89.17%, presisi sebesar 88.85%, recall sebesar 90.08%, dan F1-score sebesar 89.46%.

Item Type: Thesis (Bachelor Thesis)
Keywords: Berita palsu, GloVe, SVM, TF-IDF, Word2Vec, word embedding
Subjects: ?? T58.5-58.64 ??
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 09 Nov 2024 11:07
Last Modified: 09 Nov 2024 11:07
URI: https://kc.umn.ac.id/id/eprint/33736

Actions (login required)

View Item View Item