Perbandingan Berbagai Teknik Feature Extraction pada Naive Bayes untuk Mengoptimalkan Deteksi Berita Hoax di Indonesia

Ivan Wibowo, Christian (2025) Perbandingan Berbagai Teknik Feature Extraction pada Naive Bayes untuk Mengoptimalkan Deteksi Berita Hoax di Indonesia. MBKM thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf

Download (522kB)
[img] PDF
BAB_I.pdf

Download (193kB)
[img] PDF
BAB_II.pdf

Download (257kB)
[img] PDF
BAB_III.pdf

Download (231kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (295kB)
[img] PDF
BAB_V.pdf

Download (187kB)
[img] PDF
DAFTAR_PUSTAKA.pdf

Download (210kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (3MB)
[img] PDF
LEMBAR_PENGESAHAN.pdf

Download (53kB)

Abstract

Pada era digital saat ini, penyebaran berita hoax menjadi masalah yang semakin mendesak, yang memengaruhi stabilitas sosial dan politik, serta merusak kepercayaan publik. Deteksi berita hoax secara otomatis dapat membantu mengatasi masalah ini dengan menggunakan teknik klasifikasi teks berbasis machine learning. Penelitian ini menguji kinerja algoritma Naive Bayes dalam mendeteksi berita bohong (hoax), dengan menggunakan dua teknik ekstraksi fitur yaitu CountVectorizer dan TfidfVectorizer, dengan variasi n-gram (unigram, bigram, trigram). Data yang digunakan diperoleh dari sumber Mafindo API dan Kaggle, yang terdiri dari 29.552 entri berita yang terdiri dari berita hoax dan berita faktual. Hasil percobaan menunjukkan bahwa model Naive Bayes dengan unigram CountVectorizer (1,1) memberikan kinerja terbaik dengan akurasi sebesar 93% pada data uji, sedangkan unigram TfidfVectorizer (1,1) menghasilkan akurasi sebesar 90,6%. Selain itu, penggunaan n-gram yang lebih tinggi (bigram dan trigram) justru menurunkan kinerja model. Temuan ini menunjukkan bahwa dalam konteks pendeteksian hoax, penggunaan unigram CountVectorizer lebih efektif, sedangkan TfidfVectorizer lebih cocok untuk tugas yang memerlukan penekanan pada kata-kata yang jarang. Studi ini berkontribusi pada pengembangan sistem pendeteksian hoax yang lebih efisien dan akurat.

Item Type: Thesis (MBKM)
Keywords: CountVectorizer, Hoax, Klasifikasi Teks, Naive Bayes, TfidfVectorizer
Subjects: ?? T58.5-58.64 ??
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 26 Jan 2025 12:58
Last Modified: 26 Jan 2025 13:59
URI: https://kc.umn.ac.id/id/eprint/36012

Actions (login required)

View Item View Item