Hendrojoyo Suryokuncoro, Nikodemus (2025) Implementasi Algoritma Naive Bayes untuk Klasifikasi Teks Phishing. Bachelor Thesis, Universitas Multimedia Nusantara.
![]() |
PDF
HALAMAN_AWAL.pdf Download (2MB) |
![]() |
PDF
BAB_I.pdf Download (210kB) |
![]() |
PDF
BAB_II.pdf Download (362kB) |
![]() |
PDF
BAB_III.pdf Download (458kB) |
![]() |
PDF
BAB_IV.pdf Restricted to Registered users only Download (1MB) |
![]() |
PDF
BAB_V.pdf Download (225kB) |
![]() |
PDF
DAFTAR_PUSTAKA.pdf Download (211kB) |
![]() |
PDF
LAMPIRAN.pdf Restricted to Registered users only Download (1MB) |
Abstract
Pada tahun 2022 hingga awal tahun 2024, penipuan transaksi keuangan di Indonesia mengakibatkan kerugian sebesar Rp 2,5 triliun berdasarkan 155 ribu aduan konsumen dari 10 bank yang tercatat di Otoritas Jasa Keuangan (OJK). Oleh karena itu, diperlukan sistem yang mampu mendeteksi potensi serangan secara otomatis. Penelitian ini bertujuan untuk mengimplementasikan algoritma Na¨ive Bayes dalam membangun model klasifikasi teks guna mengidentifikasi serangan phishing. Dataset yang digunakan dalam pembuatan model berjumlah 8894 data teks berbahasa indonesia dan inggris dengan 3 kelas yaitu 0 untuk teks "Normal", 1 untuk teks "Phishing", dan 2 untuk teks "Promo". Model dikembangkan menggunakan algoritma Na¨ive Bayes dengan dua jenis vectorizer, yaitu CountVectorizer dan TF-IDF Vectorizer. Untuk meningkatkan performa model, dilakukan proses optimasi dengan pencarian hyperparameter menggunakan metode GridSearchCV. Model terbaik diperoleh dengan penggunaan vectorizer TF- IDF dan optimasi hyperparameter, dengan pembagian rasio dataset 90% untuk training dan 10% untuk testing. Kombinasi hyperparameter yang digunakan pada model dibagi menjadi hyperparameter algoritma yaitu alpha yang bernilai 0.1, class prior yang bernilai [0.7, 0.15, 0.15], dan fit prior yang bernilai True. Sedangkan untuk hyperparameter vectorizer terdiri dari ngram range yang bernilai 1.2, dan smooth idf serta use idf yang keduanya bernilai True. Model ini berhasil mencapai akurasi sebesar 96.18% , dengan rata-rata nilai precision sebesar 96.14%, nilai recall sebesar 96.18%, nilai f1-score sebesar sebesar 96.12%, dan nilai log loss sebesar 0.1603.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Creators: | Hendrojoyo Suryokuncoro, Nikodemus (00000060266) |
Contributors: | Endariahna Surbakti, Eunike |
Keywords: | Count Vectorizer, Klasifikasi Teks, Na¨ive Bayes, Phishing, TF-IDF |
Subjects: | 000 Computer Science, Information and General Works |
Divisions: | Faculty of Engineering & Informatics > Informatics |
Date Deposited: | 09 Sep 2025 11:04 |
URI: | https://kc.umn.ac.id/id/eprint/40358 |
Actions (login required)
![]() |
View Item |