Optimasi dan Seleksi Fitur pada Nama Domain untuk Deteksi DGA dengan Pendekatan Random Forest dan BiLSTM

Zaidan Fiqri, Muhammad (2026) Optimasi dan Seleksi Fitur pada Nama Domain untuk Deteksi DGA dengan Pendekatan Random Forest dan BiLSTM. Bachelor Thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf

Download (5MB)
[img] PDF
BAB_I.pdf

Download (753kB)
[img] PDF
BAB_II.pdf

Download (654kB)
[img] PDF
BAB_III.pdf

Download (641kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (1MB)
[img] PDF
BAB_V.pdf

Download (208kB)
[img] PDF
DAFTAR_PUSTAKA.pdf

Download (220kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (2MB)

Abstract

Serangan siber berbasis Domain Generation Algorithm (DGA) merupakan teknik yang umum digunakan oleh malware untuk mengaburkan komunikasi dengan server Command and Control (C&C). Sifat dinamis dari DGA membuat metode deteksi konvensional berbasis daftar hitam (blacklist) menjadi tidak efektif. Penelitian ini bertujuan untuk mengevaluasi kinerja deteksi DGA melalui komparasi dua pendekatan Machine Learning, yaitu Random Forest (berbasis fitur) dan Bidirectional LSTM (berbasis sekuensial), serta menganalisis dampak optimasi fitur terhadap akurasi deteksi. Dataset penelitian disusun melalui unifikasi sumber data sekunder (UMUDGA, Data Driven Security, Kaggle, dan ExtraHop) serta arsip Alexa dan Tranco untuk domain legit. Metodologi meliputi ekstraksi Second Level Domain (SLD), penyeimbangan data latih dengan undersampling (2.142.460 sampel latih seimbang), serta evaluasi pada data uji hold-out 20% yang tetap imbalanced (5.666.143 sampel). Rekayasa fitur mencakup TF-IDF n-gram dan fitur statistik handcrafted (misalnya entropi Shannon). Evaluasi dilakukan menggunakan Stratified 5-Fold Cross-Validation dan interpretasi model menggunakan SHAP (SHapley Additive exPlanations). Hasil pengujian pada data uji menunjukkan bahwa model BiLSTM murni (tanpa fitur buatan) menghasilkan kinerja terbaik dengan akurasi 95,36% dan ROC-AUC 0,9929. Di sisi lain, Random Forest teroptimasi menghasilkan akurasi 91,95% dengan ROC-AUC 0,9888, serta lebih baik dalam menekan false positive pada domain legit (indikasi dari recall kelas legit yang tinggi). Kesimpulan penelitian menunjukkan bahwa pendekatan deep learning berbasis sekuensial lebih efektif untuk menangkap variasi pola DGA yang kompleks, sementara pendekatan berbasis fitur lebih sesuai ketika prioritas utama adalah meminimalkan kesalahan pemblokiran pada domain legit.

Item Type: Thesis (Bachelor Thesis)
Creators: Zaidan Fiqri, Muhammad (00000060117)
Contributors: Agustriawan, David
Keywords: BiLSTM, DGA, Keamanan Siber, Random Forest, Rekayasa Fitur.
Subjects: 000 Computer Science, Information and General Works
Divisions: Faculty of Engineering & Informatics > Informatics
Date Deposited: 27 Jan 2026 08:03
URI: https://kc.umn.ac.id/id/eprint/44040

Actions (login required)

View Item View Item