Implementasi Metode Lstm-Rnn pada Klasifikasi Kategori Berita dalam Bahasa Indonesia

Saputra, Rully (2021) Implementasi Metode Lstm-Rnn pada Klasifikasi Kategori Berita dalam Bahasa Indonesia. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img]
Preview
PDF
HALAMAN_AWAL.pdf

Download (483kB) | Preview
[img]
Preview
PDF
DAFTAR_PUSTAKA.pdf

Download (177kB) | Preview
[img]
Preview
PDF
BAB_I.pdf

Download (203kB) | Preview
[img]
Preview
PDF
BAB_II.pdf

Download (299kB) | Preview
[img]
Preview
PDF
BAB_III.pdf

Download (476kB) | Preview
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (852kB)
[img]
Preview
PDF
BAB_V.pdf

Download (125kB) | Preview
[img]
Preview
PDF
LAMPIRAN.pdf

Download (475kB) | Preview

Abstract

Klasifikasi kategori suatu data teks memiliki tujuan untuk mempermudah manusia untuk mengkategorikan sebuah data dalam kategori tertentu. Pada penelitian ini, klasfikasi berita digital akan mempermudah editor dalam menentukan berita tersebut masuk pada kategori tertentu. Proses mengklasifikasi data teks tidak dapat dilakukan oleh machine learning karena sebuah model machine learning hanya dapat menerima masukan berupa nilai numerik. Dengan adanya keterbatasan tersebut, maka kumpulan data teks harus ditransformasi dengan menerapkan Natural Language Processing (NLP) yang mempersiapkan data agar dapat diproses. NLP menjadi kunci agar sebuah model dapat mempelajari data latih dengan optimal supaya hasil prediksi akurat. Metode untuk melakukan prediksi dengan menerapkan LSTM-RNN merupakan kombinasi terbaik dalam memprediksi suatu kumpulan kata yang banyak Pada penelitan terdahulu, penggunaan metode LSTM-RNN memiliki tingkat akurasi yang tinggi untuk klasifikasi berita dalam bahasa inggris. Untuk eksplorasi lebih lanjut, maka pada penelitian ini menggunakan berita berbahasa Indonesia yang diambil dari Jakartaresearch dan web scraping pada Kompas.com yang menjadi data latih dan data testing. Berdasarkan hasil eksperimen untuk model LSTM-RNN berhasil mendapatkan nilai akurasi sebesar 93%, nilai recall sebesar 91.8%, nilai presisi sebesar 92.4% dan nilai F1-Score sebesar 91.8%. Nilai akurasi prediksi dengan menggunakan 17 data berita dari Detik.com menunjukan 100% akurat memprediksi kategori berita tersebut.

Item Type: Thesis (Bachelor Thesis)
Keywords: Genre Classification, Long Short Term Memory, Natural Language Processing, News, Recurrent Neural Network, Web Scraping,
Subjects: T Technology > T Technology (General) > T55 Industrial engineering. Management engineering > T58.5-58.64 Information technology
Divisions: Fakultas Teknik Informatika > Program Studi Informatika
SWORD Depositor: mr admin umn
Depositing User: mr admin umn
Date Deposited: 24 Aug 2021 21:20
Last Modified: 24 Aug 2021 21:20
URI: http://kc.umn.ac.id/id/eprint/15901

Actions (login required)

View Item View Item