Wisnu Setyawan, Antonius (2021) Implementasi Algoritma Latent Dirichlet Allocation untuk Topic Modeling Terhadap Data Twitter Terkait Pandemi Covid-19. Bachelor Thesis thesis, Universitas Multimedia Nusantara.
Abstract
Pada tahun 2019, penemuan virus penyakit baru mengejutkan masyarakat dunia, yang tidak lama kemudian penyebaran virus penyakit ini berkembang menjadi pandemi. Pandemi ini disebabkan oleh virus severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) atau yang dikenal sebagai virus Corona. Penyakit yang ditimbulkan akibat virus ini disebut Coronavirus Disease 2019 atau yang lebih dikenal dengan COVID-19. Indonesia merupakan salah satu negara yang terdampak pandemi ini dan berjuang untuk menghadapi pandemi virus COVID-19. Untuk menekan penyebaran virus ini, telah dilakukan oleh pemerintah Indonesia berbagai cara, salah satunya adalah dengan memperjuangkan vaksinasi yang sudah mulai dilakukan pemerintah. Namun vaksinasi juga menimbulkan tanggapan positif maupun negatif bagi masyarakat Indonesia serta menimbulkan berbagai macam isu atau kontroversi maupun teori konspirasi yang beredar pada sosial media, dan salah satunya melalui Twitter. Pada penelitian ini dilakukan perancangan sistem untuk melakukan topic modeling dengan metode Latent Dirichlet Allocation (LDA) dilakukan untuk melihat ragam topik yang beredar pada masyarakat melalui kicauan atau tweet pada sosial media Twitter. Set data pada penelitian ini berupa tweet dari sosial media Twitter. Pengumpulan set data dilakukan mulai tanggal 20 Maret 2021 sampai dengan 29 Maret 2021 dengan kata kunci "#Covid-19" berbahasa Indonesia dan berlokasi Indonesia. Percobaan yang dilakukan dengan skenario perbandingan set data sebelum dilakukan penyaringan dan set data setelah dilakukan penyaringan beserta uji coba perbandingan hyperparameter alpha dengan hyperparameter jumlah topik. Hasil dari penelitian yang dilakukan menunjukkan implementasi metode LDA untuk melakukan topic modeling pada tweet dari sosial media Twitter berhasil dikembangkan. Dari hasil uji coba didapatkan performa metode LDA untuk melakukan topic modeling pada set data sebelum dilakukan penyaringan memiliki nilai coherence score terbaik yaitu 0.5232 dan untuk set data setelah dilakukan penyaringan memiliki nilai coherence score terbaik yaitu 0.4484.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Keywords: | COVID-19, latent dirichlet allocation, topic coherence, topic modeling, tweet |
Subjects: | 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.2 Programming for Specific Computers, Algorithm, HTML, PHP, java, C++ |
Divisions: | Faculty of Engineering & Informatics > Informatics |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 18 Oct 2022 08:58 |
Last Modified: | 25 Aug 2023 06:14 |
URI: | https://kc.umn.ac.id/id/eprint/17957 |
Actions (login required)
View Item |