Christianto, Christianto (2021) Implementasi Metode Unsupervised Data Augmentation untuk Deteksi Teks Hate Speech dalam Bahasa Indonesia. Bachelor Thesis thesis, Universitas Multimedia Nusantara.
Abstract
Media sosial yang kian berkembang secara tidak langsung membantu para penggunanya dalam menebarkan ujaran kebencian. Penyebaran ujaran kebencian yang begitu cepat dan mudah tidak boleh dianggap ringan, mengingat bahwa ujaran kebencian menjadi salah satu penyebab tingginya angka prevalensi depresi di Indonesia. Oleh sebab itu, dibutuhkan penyortiran terhadap tweet yang dikirimkan dalam media sosial. Akan tetapi, banyaknya tweet yang disebarkan setiap harinya membuat pendeteksian ujaran kebencian secara manual terlihat tidak mungkin. Text classification menjadi solusi terhadap masalah tersebut dengan membentuk model yang dapat menentukan label dari suatu teks secara otomatis. Namun, metode yang sering digunakan untuk membentuk model tersebut adalah supervised learning, yang membutuhkan banyak usaha karena proses pelatihannya membutuhkan banyak data berlabel. Oleh sebab itu, penelitian ini mengimplementasikan metode Unsupervised Data Augmentation yang meminimalisir penggunaan data berlabel dalam proses pelatihannya. Berdasarkan hasil pengujian, dengan menggunakan 10% data berlabel atau sebanyak 1.316 dari 13.169 data, diperoleh model dengan performa nilai accuracy 78,8%, precision 79,1%, recall 77,9%, dan F1 score 77%.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Keywords: | BERT, Binary Text Classification, Hate Speech, Text Augmentation, Unsupervised Data Augmentation |
Subjects: | 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.2 Programming for Specific Computers, Algorithm, HTML, PHP, java, C++ 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 006 Special Computer Methods > 006.8 Augmented Reality, Virtual Reality |
Divisions: | Faculty of Engineering & Informatics > Informatics |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 24 Aug 2021 15:31 |
Last Modified: | 22 Aug 2023 08:09 |
URI: | https://kc.umn.ac.id/id/eprint/16558 |
Actions (login required)
View Item |