Pemodelan Klasifikasi Penyakit Jantung Menggunakan Logistic Regression dan Random Forest dengan Teknik Borderline SMOTE dan K-Means SMOTE

Eugene Kaparang, Marcellus (2026) Pemodelan Klasifikasi Penyakit Jantung Menggunakan Logistic Regression dan Random Forest dengan Teknik Borderline SMOTE dan K-Means SMOTE. Bachelor Thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf
Restricted to Registered users only

Download (915kB)
[img] PDF
BAB_I.pdf

Download (222kB)
[img] PDF
BAB_II.pdf

Download (350kB)
[img] PDF
BAB_III.pdf
Restricted to Registered users only

Download (241kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (1MB)
[img] PDF
BAB_V.pdf
Restricted to Registered users only

Download (210kB)
[img] PDF
DAFTAR_PUSTAKA.pdf
Restricted to Registered users only

Download (213kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (1MB)

Abstract

Penyakit jantung merupakan salah satu penyebab utama kematian di dunia sehingga deteksi dini menjadi sangat penting untuk membantu proses diagnosis medis. Pemanfaatan machine learning pada data klinis pasien dapat digunakan untuk mendukung proses klasifikasi penyakit jantung, namun dataset medis sering memiliki permasalahan ketidakseimbangan kelas (imbalanced dataset) yang dapat menyebabkan model cenderung bias terhadap kelas mayoritas. Penelitian ini bertujuan untuk meningkatkan performa model klasifikasi penyakit jantung menggunakan algoritma Logistic Regression dan Random Forest dengan menerapkan teknik penanganan ketidakseimbangan data, yaitu Borderline- SMOTE dan K-Means SMOTE. Evaluasi model dilakukan menggunakan metrik Accuracy, Precision, Recall, F1-score, dan Area Under the Curve (AUC). Hasil penelitian menunjukkan bahwa penerapan teknik oversampling mampu meningkatkan performa model, terutama pada metrik recall, F1-score, dan AUC dalam mendeteksi kelas minoritas. Berdasarkan hasil perbandingan model, kombinasi Random Forest dengan K-Means SMOTE menghasilkan performa terbaik dengan nilai precision 0,9479, recall 0,9302, dan AUC 0,9797. Hasil ini menunjukkan bahwa penggunaan metode ensemble yang dikombinasikan dengan teknik oversampling berbasis klaster dapat meningkatkan akurasi dan keandalan model klasifikasi pada dataset yang tidak seimbang.

Item Type: Thesis (Bachelor Thesis)
Creators: Eugene Kaparang, Marcellus (00000082420)
Contributors: Aditiyawan, Aditiyawan (8994550022)
Keywords: Borderline-SMOTE, K-Means SMOTE, Logistic Regression, Penyakit Jantung, Random Forest
Subjects: 000 Computer Science, Information and General Works
Divisions: Faculty of Engineering & Informatics > Informatics
Date Deposited: 05 May 2026 07:58
URI: https://kc.umn.ac.id/id/eprint/45421

Actions (login required)

View Item View Item