Implementasi Algoritma Random Forest untuk Klasifikasi Kategori Berita

Jonathan, Jonathan (2021) Implementasi Algoritma Random Forest untuk Klasifikasi Kategori Berita. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (974kB)
[img]
Preview
Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (128kB) | Preview
[img]
Preview
Text
BAB_I.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (138kB) | Preview
[img]
Preview
Text
BAB_II.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (294kB) | Preview
[img]
Preview
Text
BAB_III.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (348kB) | Preview
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (881kB)
[img]
Preview
Text
BAB_V.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (5kB) | Preview
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (6MB)

Abstract

Perkembangan teknologi yang sangat cepat membuat masyarakat semakin mudah dalam mencari informasi salah satunya adalah berita. Pada tahun 2018 tercatat 65.97% penduduk Indonesia menggunakan fasilitas internet untuk mencari berita di portal berita online. Banyaknya jumlah berita yang tersebar saat ini tidak dapat dipungkiri terdapat editor yang mungkin kesulitan untuk menyunting berita tersebut satu per satu. Belum lagi jika ada konten berita yang ternyata tidak sesuai dengan berita-berita pada kategori yang diusulkan. Hal ini dapat mempengaruhi SEO dari portal berita tersebut. Pada penelitian ini akan dibuat sebuah classifier berita online yang diharapkan dapat membantu memastikan bahwa konten berita yang sesuai dengan kategori yang diusulkan secara otomatis dengan mengimplementasikan algoritma Random Forest. Dataset diambil dengan metode webcrawling pada portal berita Kompas sebanyak 69,753. Untuk meningkatkan akurasi dilakukan word embedding pada data berita menggunakan model Word2Vec dan optimasi hyperparameter menggunakan RandomizedSearchCV. Performa dari algoritma Random Forest untuk klasifikasi berita online yang dihitung dengan nilai accuracy dan F1-Score mendapatkan hasil terbaik yaitu 0.8561 untuk accuracy dan 0.8561 untuk F1-Score.

Item Type: Thesis (Bachelor Thesis)
Keywords: Berita online, Machine Learning, Klasifikasi, Word Embedding, Word2Vec, Random Forest
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.2 Programming for Specific Computers, Algorithm, HTML, PHP, java, C++
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 24 Aug 2021 16:53
Last Modified: 09 Aug 2023 00:35
URI: https://kc.umn.ac.id/id/eprint/16610

Actions (login required)

View Item View Item