Analisis Perbandingan Large Language Model sebagai Feature Extraction dalam Deteksi Sarkasme Menggunakan Algoritma Klasifikasi

Nathaniel Sabera, Darrel (2025) Analisis Perbandingan Large Language Model sebagai Feature Extraction dalam Deteksi Sarkasme Menggunakan Algoritma Klasifikasi. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf

Download (1MB)
[img] PDF
ARTIKEL.pdf

Download (311kB)
[img] PDF
TURNITIN.pdf

Download (130kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (678kB)
[img] PDF
LETTER_OF_ACCEPTANCE.pdf

Download (140kB)

Abstract

Deteksi sarkasme merupakan tugas penting dalam NLP (Natural Language Processing) karena ekspresi sarkasme dapat mendistorsi analisis sentimen dan menyesatkan sistem decision machine. Urgensi penelitian ini terletak pada keterbatasan metode tradisional seperti Bag of Words (BoW) dan TF- IDF yang gagal menangkap pemahaman kontekstual yang mendalam, sementara teknik word embedding seperti Word2Vec dan GloVe memberikan peningkatan, namun masih kesulitan dalam memahami makna kalimat secara utuh. LLM (Large Language Model) seperti BERT dan RoBERTa telah mentransformasi NLP dengan menangkap representasi kata secara kontekstual, sehingga lebih efektif untuk deteksi sarkasme. Penelitian ini menyajikan analisis komparatif berbagai metode ekstraksi fitur seperti Word2Vec, GloVe, BERT, dan RoBERTa yang dikombinasikan dengan algoritma klasifikasi seperti Support Vector Machine (SVM), XGBoost, dan Random Forest. Studi ini menggunakan framework Knowledge Discovery in Database (KDD) yang mencakup data selection, preprocessing, transformation, modelling, dan evaluation. Dataset yang digunakan terdiri dari judul berita yang diberi label sarkastik atau non-sarkastik. Principal Component Analysis digunakan untuk reduksi dimensi dengan mengeliminasi fitur-fitur yang redundan. Hasil penelitian menunjukkan bahwa kombinasi RoBERTa-SVM mencapai akurasi tertinggi sebesar 88,00%, yang menunjukkan keunggulan model berbasis transformer dibandingkan teknik embedding tradisional. Penelitian ini menyimpulkan bahwa integrasi embedding kontekstual dan seleksi fitur meningkatkan performa deteksi sarkasme sekaligus menjaga efisiensi komputasi. Namun, model ini masih menghadapi tantangan dalam mengidentifikasi sarkasme implisit karena tidak adanya petunjuk linguistik yang eksplisit, yang menjadi keterbatasan dari penelitian ini.

Item Type: Thesis (Bachelor Thesis)
Keywords: Feature Extraction, Feature Selection, Large Language Model, RoBERTa­Support Vector Machine, Sarcasm Detection
Subjects: ?? T70 ??
Divisions: Faculty of Engineering & Informatics > Information System
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 05 Jul 2025 11:20
Last Modified: 05 Jul 2025 11:20
URI: https://kc.umn.ac.id/id/eprint/37767

Actions (login required)

View Item View Item