Penanganan Imbalance Data untuk Klasifikasi Penyakit Jantung menggunakan Metode SMOTE pada Algoritma Naive Bayes

Juliano Wibowo, Jonathan (2023) Penanganan Imbalance Data untuk Klasifikasi Penyakit Jantung menggunakan Metode SMOTE pada Algoritma Naive Bayes. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (878kB)
[img] Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (282kB)
[img] Text
BAB_I.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (266kB)
[img] Text
BAB_II.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (613kB)
[img] Text
BAB_III.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (382kB)
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (3MB)
[img] Text
BAB_V.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (236kB)
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (2MB)

Abstract

Kesehatan merupakan hal yang penting untuk dijaga, terutama dalam pencegahan penyakit jantung. Memprediksi penyakit jantung secara dini dapat membantu dalam pengelompokan pasien dengan lebih efisien. Salah satu metode yang dapat digunakan adalah data mining, yang memungkinkan prediksi melalui klasifikasi data, dengan algoritma Naïve Bayes yang akan digunakan mengacu pada penelitian terdahulu. Namun, dalam data mining, sering terjadi masalah ketidakseimbangan data, dimana jumlah spesimen pada satu kelas lebih banyak daripada kelas lainnya. Masalah ini dapat mempengaruhi kinerja algoritma klasifikasi terutama pada evaluasi metrik. Tahapan penelitian ini, menggunakan framework penelitian KDD yaitu data selection, data pre-processing, data transformation, data mining, dan interpretation/evaluation. Penanganan data yang tidak seimbang dilakukan dengan pada metode SMOTE pada algoritma Naïve Bayes untuk tiga rasio split data yang dibandingkan sebelum dan sesudah menggunakan SMOTE dalam data training dan data testing yaitu 70:30, 60:40, dan 50:50. Hasil yang ditemukan adalah rasio split data terbaik dengan peningkatan signifikan ada pada rasio 50:50. Nilai kinerja rasio split data 50:50 pada data training sebelum SMOTE pada rasio 50:50 memiliki nilai akurasi 86.42%, presisi 29.93%, recall 43.66%, dan AUC 0.820. Setelah menggunakan metode SMOTE, akurasi menurun menjadi 73.05%, namun presisi meningkat menjadi 77.72%, recall meningkat menjadi 64.61%, dan AUC meningkat menjadi 0.831. Dalam konteks ini, peningkatan pada metrik spesifik ini bisa dianggap sebagai peningkatan performa yang diinginkan, sehingga SMOTE terbilang berhasil dalam penanganan imbalance data.

Item Type: Thesis (Bachelor Thesis)
Keywords: Data Mining, Imbalance Data, Naïve Bayes, Penyakit Jantung, SMOTE.
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 004 Computer Science, Data Processing, Hardware
600 Technology (Applied Sciences) > 600 Technology > 600 Technology
Divisions: Faculty of Engineering & Informatics > Information System
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 08 Mar 2024 09:04
Last Modified: 13 Mar 2024 02:29
URI: https://kc.umn.ac.id/id/eprint/28205

Actions (login required)

View Item View Item