⭐ Christianto, Christianto (2021) Implementasi Metode Unsupervised Data Augmentation untuk Deteksi Teks Hate Speech dalam Bahasa Indonesia. Bachelor Thesis, Universitas Multimedia Nusantara.
|
Text
HALAMAN_AWAL.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (504kB) |
||
|
Text
DAFTAR_PUSTAKA.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (188kB) |
||
|
Text
BAB_I.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (184kB) | Preview |
|
|
Text
BAB_II.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (338kB) | Preview |
|
|
Text
BAB_III.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (518kB) |
||
|
Text
BAB_IV.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (757kB) |
||
|
Text
BAB_V.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (113kB) |
||
|
Text
LAMPIRAN.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (454kB) |
Abstract
Media sosial yang kian berkembang secara tidak langsung membantu para penggunanya dalam menebarkan ujaran kebencian. Penyebaran ujaran kebencian yang begitu cepat dan mudah tidak boleh dianggap ringan, mengingat bahwa ujaran kebencian menjadi salah satu penyebab tingginya angka prevalensi depresi di Indonesia. Oleh sebab itu, dibutuhkan penyortiran terhadap tweet yang dikirimkan dalam media sosial. Akan tetapi, banyaknya tweet yang disebarkan setiap harinya membuat pendeteksian ujaran kebencian secara manual terlihat tidak mungkin. Text classification menjadi solusi terhadap masalah tersebut dengan membentuk model yang dapat menentukan label dari suatu teks secara otomatis. Namun, metode yang sering digunakan untuk membentuk model tersebut adalah supervised learning, yang membutuhkan banyak usaha karena proses pelatihannya membutuhkan banyak data berlabel. Oleh sebab itu, penelitian ini mengimplementasikan metode Unsupervised Data Augmentation yang meminimalisir penggunaan data berlabel dalam proses pelatihannya. Berdasarkan hasil pengujian, dengan menggunakan 10% data berlabel atau sebanyak 1.316 dari 13.169 data, diperoleh model dengan performa nilai accuracy 78,8%, precision 79,1%, recall 77,9%, dan F1 score 77%.
Actions (login required)
![]() |
View Item |
