Implementasi Algoritma BERT untuk Klasifikasi Topik Penelitian di Universitas Multimedia Nusantara

Frederico, Charlie (2024) Implementasi Algoritma BERT untuk Klasifikasi Topik Penelitian di Universitas Multimedia Nusantara. Bachelor Thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf

Download (1MB)
[img] PDF
BAB_I.pdf

Download (218kB)
[img] PDF
BAB_II.pdf

Download (270kB)
[img] PDF
BAB_III.pdf

Download (268kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (1MB)
[img] PDF
BAB_V.pdf

Download (208kB)
[img] PDF
DAFTAR_PUSTAKA.pdf

Download (231kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (1MB)

Abstract

Terdapat lebih dari 3000 jurnal akademik dan artikel penelitian dari Universitas Multimedia Nusantara yang diterbitkan pada tahun 2018 hingga 2023. Untuk memudahkan pengkategorian, dibangun sistem klasifikasi teks yang menggunakan model Bidirectional Encoder Representations from Transformers (BERT) untuk mengkategorikan judul atau abstrak jurnal ke dalam 17 kategori UN SDG. UN SDG merupakan parameter utama yang digunakan untuk meningkatkan akreditasi fakultas dan program studi oleh Universitas Multimedia Nusantara. Terdapat 76.958 dataset berbahasa Inggris yang digunakan selama training. Model terbaik diperoleh dengan menggunakan preprocessing dengan library NLTK tanpa metode sampling yang menggunakan 70% data training dan 30% data testing. Parameter model mencakup 4 epochs, learning rate 2e-5, dan batch size 32. Model ini mendapatkan nilai precision 0.99, recall 0.82, f1-score 0.87, dan akurasi 90.68%. Model ini dipilih untuk pengklasifikasian teks karena mendapatkan hasil terbaik dibandingkan model lainnya dan telah di demonstrasikan kepada pihak LPPM UMN.

Item Type: Thesis (Bachelor Thesis)
Creators: Frederico, Charlie (00000043442)
Contributors:
  1. Endariahna Surbakti, Eunike
  2. Twince Tobing, Fenina Adline
Keywords: Bidirectional Encoder Representations from Transformers, Deep Learning, Jurnal Akademik, Klasifikasi Teks, Natural Language Processing
Subjects: 000 Computer Science, Information and General Works
Divisions: Faculty of Engineering & Informatics > Informatics
Date Deposited: 09 Nov 2024 12:16
URI: https://kc.umn.ac.id/id/eprint/34014

Actions (login required)

View Item View Item