Analisis Perbandingan Large Language Model sebagai Feature Extraction dalam Deteksi Sarkasme Menggunakan Algoritma Klasifikasi

⭐ Nathaniel Sabera, Darrel (2025) Analisis Perbandingan Large Language Model sebagai Feature Extraction dalam Deteksi Sarkasme Menggunakan Algoritma Klasifikasi. Bachelor Thesis, Universitas Multimedia Nusantara.

	PDF HALAMAN_AWAL.pdf Restricted to Registered users only Download (1MB)
	PDF ARTIKEL.pdf Restricted to Registered users only Download (311kB)
	PDF TURNITIN.pdf Restricted to Registered users only Download (130kB)
	PDF LAMPIRAN.pdf Restricted to Registered users only Download (678kB)
	PDF LETTER_OF_ACCEPTANCE.pdf Restricted to Registered users only Download (140kB)

Abstract

Deteksi sarkasme merupakan tugas penting dalam NLP (Natural Language Processing) karena ekspresi sarkasme dapat mendistorsi analisis sentimen dan menyesatkan sistem decision machine. Urgensi penelitian ini terletak pada keterbatasan metode tradisional seperti Bag of Words (BoW) dan TF- IDF yang gagal menangkap pemahaman kontekstual yang mendalam, sementara teknik word embedding seperti Word2Vec dan GloVe memberikan peningkatan, namun masih kesulitan dalam memahami makna kalimat secara utuh. LLM (Large Language Model) seperti BERT dan RoBERTa telah mentransformasi NLP dengan menangkap representasi kata secara kontekstual, sehingga lebih efektif untuk deteksi sarkasme. Penelitian ini menyajikan analisis komparatif berbagai metode ekstraksi fitur seperti Word2Vec, GloVe, BERT, dan RoBERTa yang dikombinasikan dengan algoritma klasifikasi seperti Support Vector Machine (SVM), XGBoost, dan Random Forest. Studi ini menggunakan framework Knowledge Discovery in Database (KDD) yang mencakup data selection, preprocessing, transformation, modelling, dan evaluation. Dataset yang digunakan terdiri dari judul berita yang diberi label sarkastik atau non-sarkastik. Principal Component Analysis digunakan untuk reduksi dimensi dengan mengeliminasi fitur-fitur yang redundan. Hasil penelitian menunjukkan bahwa kombinasi RoBERTa-SVM mencapai akurasi tertinggi sebesar 88,00%, yang menunjukkan keunggulan model berbasis transformer dibandingkan teknik embedding tradisional. Penelitian ini menyimpulkan bahwa integrasi embedding kontekstual dan seleksi fitur meningkatkan performa deteksi sarkasme sekaligus menjaga efisiensi komputasi. Namun, model ini masih menghadapi tantangan dalam mengidentifikasi sarkasme implisit karena tidak adanya petunjuk linguistik yang eksplisit, yang menjadi keterbatasan dari penelitian ini.

Item Type:	Thesis (Bachelor Thesis)
Creators:	Nathaniel Sabera, Darrel (00000055439)
Contributors:	Kristiyanti, Dinar Ajeng
Keywords:	Feature Extraction, Feature Selection, Large Language Model, RoBERTaSupport Vector Machine, Sarcasm Detection
Subjects:	000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 004 Computer Science, Data Processing, Hardware > 004.2 Systems Analysis and Design, Information Architecture, Performance Evaluation
Divisions:	Faculty of Engineering & Informatics > Information System
Date Deposited:	05 Jul 2025 11:20
URI:	https://kc.umn.ac.id/id/eprint/37767

Actions (login required)

View Item

This repository is indexed on

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.