Analisis Sentimen dan Pemodelan Topik Opini mengenai Coretax menggunakan Model Hybrid VADER, TF-IDF, BERT Embeddings, dan BERTopic

Febriani Santoso, Cindy (2025) Analisis Sentimen dan Pemodelan Topik Opini mengenai Coretax menggunakan Model Hybrid VADER, TF-IDF, BERT Embeddings, dan BERTopic. Bachelor Thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf

Download (497kB)
[img] PDF
BAB_I.pdf

Download (426kB)
[img] PDF
BAB_II.pdf

Download (677kB)
[img] PDF
BAB_III.pdf

Download (665kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (1MB)
[img] PDF
BAB_V.pdf

Download (399kB)
[img] PDF
DAFTAR_PUSTAKA.pdf

Download (377kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (1MB)

Abstract

Coretax merupakan sistem perpajakan yang diluncurkan oleh pemerintah Indonesia pada bulan Januari 2025. Sistem ini mengintegrasikan seluruh layanan DJP online ke dalam satu platform. Implementasi sistem Coretax diharapkan dapat meningkatkan penerimaan pajak akibat kepatuhan pajak yang rendah. Sejak perilisannya, sistem ini menghasilkan opini dan reaksi publik di media sosial, terutama X. Penelitian ini melakukan analisis sentimen dan pemodelan topik untuk mengetahui opini publik terhadap Coretax. Metode analisis sentimen menggabungkan fitur VADER, TF-IDF, dan BERT embeddings ke model klasifikasi Logistic Regression. Sementara itu, pemodelan topik diimplementasikan dengan BERTopic untuk mengekstrak topik yang dibicarakan di X. Penelitian ini menerapkan KDD sebagai kerangka kerja penelitian. Proses pembersihan data terdiri dari penyaringan dan pengubahan teks menjadi huruf kecil, penerjemahan ke bahasa Inggris, tokenisasi, lemmatisasi, dan pemeriksaan ejaan. Di sisi lain, transformasi data dilakukan dengan pelabelan data dan SMOTE untuk menyeimbangkan kelas data. Tahap-tahap sebelumnya menghasilkan 17.100 data valid untuk analisis lebih lanjut. Penelitian ini menunjukkan bahwa model hybrid dapat mengungkap dominasi sentimen negatif terhadap Coretax di Indonesia pada data aktual. Metode penanganan kelas tidak seimbang SMOTE memiliki performa yang tinggi dengan akurasi, presisi, recall, dan f1-score 94%. BERTopic dapat mengidentifikasi apresiasi fitur yang didiskusikan secara positif dan keluhan teknis yang dihadapi penguna pada sentimen negatif. Validasi hasil mengkonfirmasi relevansi hasil temuan dan analisis kebijakan lebih lanjut menunjukkan inkonsistensi dengan Permenkomdigi Nomor 6 Tahun 2025. Sistem Coretax yang tidak optimal berkontribusi pada penurunan penerimaan pajak sehingga dibutuhkan perbaikan terhadap keluhan pengguna.

Item Type: Thesis (Bachelor Thesis)
Creators: Febriani Santoso, Cindy (00000059735)
Contributors: Faza, Ahmad
Keywords: Coretax, sentimen, opini, topik, X
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 004 Computer Science, Data Processing, Hardware > 004.2 Systems Analysis and Design, Information Architecture, Performance Evaluation
Divisions: Faculty of Engineering & Informatics > Information System
Date Deposited: 09 Sep 2025 07:34
URI: https://kc.umn.ac.id/id/eprint/40313

Actions (login required)

View Item View Item