Nathaniel Sabera, Darrel (2025) Analisis Perbandingan Large Language Model sebagai Feature Extraction dalam Deteksi Sarkasme Menggunakan Algoritma Klasifikasi. Bachelor Thesis thesis, Universitas Multimedia Nusantara.
![]() |
PDF
HALAMAN_AWAL.pdf Download (1MB) |
![]() |
PDF
ARTIKEL.pdf Download (311kB) |
![]() |
PDF
TURNITIN.pdf Download (130kB) |
![]() |
PDF
LAMPIRAN.pdf Restricted to Registered users only Download (678kB) |
![]() |
PDF
LETTER_OF_ACCEPTANCE.pdf Download (140kB) |
Abstract
Deteksi sarkasme merupakan tugas penting dalam NLP (Natural Language Processing) karena ekspresi sarkasme dapat mendistorsi analisis sentimen dan menyesatkan sistem decision machine. Urgensi penelitian ini terletak pada keterbatasan metode tradisional seperti Bag of Words (BoW) dan TF- IDF yang gagal menangkap pemahaman kontekstual yang mendalam, sementara teknik word embedding seperti Word2Vec dan GloVe memberikan peningkatan, namun masih kesulitan dalam memahami makna kalimat secara utuh. LLM (Large Language Model) seperti BERT dan RoBERTa telah mentransformasi NLP dengan menangkap representasi kata secara kontekstual, sehingga lebih efektif untuk deteksi sarkasme. Penelitian ini menyajikan analisis komparatif berbagai metode ekstraksi fitur seperti Word2Vec, GloVe, BERT, dan RoBERTa yang dikombinasikan dengan algoritma klasifikasi seperti Support Vector Machine (SVM), XGBoost, dan Random Forest. Studi ini menggunakan framework Knowledge Discovery in Database (KDD) yang mencakup data selection, preprocessing, transformation, modelling, dan evaluation. Dataset yang digunakan terdiri dari judul berita yang diberi label sarkastik atau non-sarkastik. Principal Component Analysis digunakan untuk reduksi dimensi dengan mengeliminasi fitur-fitur yang redundan. Hasil penelitian menunjukkan bahwa kombinasi RoBERTa-SVM mencapai akurasi tertinggi sebesar 88,00%, yang menunjukkan keunggulan model berbasis transformer dibandingkan teknik embedding tradisional. Penelitian ini menyimpulkan bahwa integrasi embedding kontekstual dan seleksi fitur meningkatkan performa deteksi sarkasme sekaligus menjaga efisiensi komputasi. Namun, model ini masih menghadapi tantangan dalam mengidentifikasi sarkasme implisit karena tidak adanya petunjuk linguistik yang eksplisit, yang menjadi keterbatasan dari penelitian ini.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Keywords: | Feature Extraction, Feature Selection, Large Language Model, RoBERTaSupport Vector Machine, Sarcasm Detection |
Subjects: | ?? T70 ?? |
Divisions: | Faculty of Engineering & Informatics > Information System |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 05 Jul 2025 11:20 |
Last Modified: | 05 Jul 2025 11:20 |
URI: | https://kc.umn.ac.id/id/eprint/37767 |
Actions (login required)
![]() |
View Item |