Implementasi K-Prototypes dengan Ensemble Learning untuk Segmentasi Pelanggan E-Commerce PT. XYZ

Pautrisio Cendranadi, Cianando (2025) Implementasi K-Prototypes dengan Ensemble Learning untuk Segmentasi Pelanggan E-Commerce PT. XYZ. Bachelor Thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf

Download (1MB)
[img] PDF
BAB_I.pdf

Download (341kB)
[img] PDF
BAB_II.pdf

Download (345kB)
[img] PDF
BAB_III.pdf

Download (462kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (2MB)
[img] PDF
BAB_V.pdf

Download (224kB)
[img] PDF
DAFTAR_PUSTAKA.pdf

Download (252kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (1MB)

Abstract

Segmentasi pelanggan merupakan aspek vital untuk kesuksesan platform e-commerce dalam memberikan personalisasi yang tepat sasaran. Proses clustering manual yang saat ini dijalankan PT. XYZ memerlukan waktu 1-3 hari kerja per siklus dan rentan terhadap inkonsistensi, sehingga diperlukan pendekatan analitik otomatis yang lebih efisien. Penelitian ini mengimplementasikan metode ensemble K-Prototypes untuk clustering pelanggan PT. XYZ berbasis data transaksi dan demografi campuran. Dataset mencakup 75.232 transaksi dari tiga periode bulanan (Juni-Agustus 2025) dengan tiga fitur utama: usia (numerik ternormalisasi), gender, dan kategori produk (kategorikal). Proses clustering dilakukan melalui bootstrap ensemble clustering untuk meningkatkan robustness, dilanjutkan dengan meta-clustering untuk memperoleh konsensus cluster terbaik. Evaluasi kualitas menggunakan metrik internal (Silhouette Score, Davies-Bouldin Index, Calinski-Harabasz Index) sebagai validasi utama, dilengkapi AdaBoost classifier untuk mengukur separability cluster. Hasil penelitian menunjukkan bahwa metode ensemble K-Prototypes berhasil menghasilkan empat segmen pelanggan dengan profil demografis yang jelas dan terpisah, serta konsisten di periode 3 bulan. Metrik evaluasi internal menunjukkan kualitas clustering yang cukup baik (Silhouette Score > 0.65, Davies-Bouldin Index < 1.0, Calinski-Harabasz Index > 100), dan evaluasi separability mencapai accuracy > 85%. Waktu eksekusi total pipeline adalah sekitar 15 menit (920 detik), lebih efisien dibandingkan proses manual yang memerlukan 1-3 hari kerja. Segmen yang dihasilkan juga dapat digunakan sebagai bahan pertimbangan dalam strategi pemasaran terpersonalisasi, dengan setiap cluster menunjukkan karakteristik unik dalam profil demografis, preferensi produk, dan dinamika pertumbuhan.

Item Type: Thesis (Bachelor Thesis)
Creators: Pautrisio Cendranadi, Cianando (00000057710)
Contributors: Pratiwi, Monica
Keywords: e-commerce, clustering, K-Prototypes, clustering
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 004 Computer Science, Data Processing, Hardware
Divisions: Faculty of Engineering & Informatics > Computer Engineering
Date Deposited: 18 Dec 2025 08:02
URI: https://kc.umn.ac.id/id/eprint/42808

Actions (login required)

View Item View Item