Pengembangan model klasifikasi berbasis machine learning untuk moderasi komentar judi online di youtube

Theodorus, Ray (2025) Pengembangan model klasifikasi berbasis machine learning untuk moderasi komentar judi online di youtube. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf

Download (3MB)
[img] PDF
BAB_I.pdf

Download (330kB)
[img] PDF
BAB_II.pdf

Download (555kB)
[img] PDF
BAB_III.pdf

Download (473kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (3MB)
[img] PDF
BAB_V.pdf

Download (290kB)
[img] PDF
DAFTAR_PUSTAKA.pdf

Download (497kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (915kB)

Abstract

YouTube memiliki lebih dari 2,5 miliar pengguna aktif bulanan per 2023, kendati demikian kini di Indonesia kolom komentar pada lama tersebut kerap disalahgunakan untuk promosi judi online. Hal ini memberikan pengalaman buruk bagi pengguna serta citra buruk bagi pengelola akun. Saat ini sistem moderasi otomatis bawaan YouTube masih kesulitan mengenali bahasa manipulatif yang digunakan pelaku spam. Penelitian ini bertujuan mengembangkan model klasifikasi berbasis machine learning yang mampu menyaring komentar promosi judi online secara lebih akurat dan adaptif. Data diperoleh melalui YouTube Data API dari 20 channel terpilih (50 video terakhir per channel; cut-off 9 Maret 2025) dan diberi label menjadi dua kelas: judi online (spam) dan non-spam . Setelah pembersihan teks, tokenisasi TF-IDF, pembagian data latih-uji 80/20, serta undersampling untuk menyeimbangkan kelas, dilakukan benchmarking 11 algoritma. K-Nearest Neighbors (KNN) serta Logistic Regression menunjukkan performa terbaik dan selanjutnya akan dikomparasi melalui optimasi dengan RandomizedSearchCV . Hasil evaluasi awal menempatkan KNN sebagai model terakurat (accuracy 98,48 % dan F1-score makro 83,07 %), dan hyperparameter tuning pada KNN meningkatkan recall makro menjadi 94 % meski menurunkan accuracy menjadi 97 % dan F1-score makro menjadi 78,30 %. Sebaliknya, Logistic Regression ter-tuning (C=5,95; class_weight='balanced'; penalty='l2'; solver='sag') meningkatkan recall makro menjadi 97 % dengan penurunan precision dan F1-score yang minimal serta runtime hanya 0,05 s. Dengan prioritas meminimalkan false negatives sambil menjaga accuracy dan precision, Logistic Regression ter-tuning dipilih sebagai solusi akhir, membuktikan efektivitas pendekatan machine learning dalam moderasi komentar judi online di YouTube.

Item Type: Thesis (Bachelor Thesis)
Keywords: Judi online, Klasifikasi teks, Machine learning, Moderasi komentar, YouTube
Subjects: ?? T70 ??
Divisions: Faculty of Engineering & Informatics > Information System
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 05 Jul 2025 11:06
Last Modified: 05 Jul 2025 11:06
URI: https://kc.umn.ac.id/id/eprint/37697

Actions (login required)

View Item View Item