Implementasi IndoBERT-lite dan RoBERTa untuk Text Minng pada Aplikasi Chatbot Jacob

Richardson, Benny (2021) Implementasi IndoBERT-lite dan RoBERTa untuk Text Minng pada Aplikasi Chatbot Jacob. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (636kB)
[img]
Preview
Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (128kB) | Preview
[img]
Preview
Text
BAB_I.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (136kB) | Preview
[img]
Preview
Text
BAB_II.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (901kB) | Preview
[img]
Preview
Text
BAB_III.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (629kB) | Preview
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (2MB)
[img]
Preview
Text
BAB_V.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (22kB) | Preview
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (954kB)

Abstract

Jacob merupakan aplikasi chatbot yang memiliki kemampuan untuk memberikan informasi terkait program Joint Degree informatika Universitas Multimedia Nusantara. Jacob saat ini telah dirancang untuk dapat melakukan text mining secara daring, tetapi bahasa yang digunakan hanya tersedia dalam bahasa Inggris. Pada penelitian ini, dilakukan implementasi pre-trained model IndoBERT-lite dan RoBERTa melalui web service untuk melakukan text mining dalam Bahasa Indonesia. Selain itu, dilakukan juga pre-training dan fine-tuning pada model RoBERTa dengan TyDI QA dan SQuAD Bahasa Indonesia untuk mendapatkan model yang mampu memprediksi jawaban dalam Bahasa Indonesia. Pengujian dilakukan dengan menggunakan 5 pre-trained model dan evaluasi untuk melihat nilai akurasi/F-Score dari hasil pengujian. Hasil evaluasi menunjukkan indobert- lite-squad memiliki hasil sebesar 0,8/0,89, roberta-1.5gb-tydiqa sebesar 0,8/0,87, roberta-3gb-tydiqa sebesar 0,47/0,57, roberta-1.5gb-squad sebesar 0,47/0,64, dan roberta-3gb-squad sebesar 0,4/0,57.

Item Type: Thesis (Bachelor Thesis)
Keywords: IndoBERT-lite, Jacob, RoBERTa, SQuAD, text mining, TyDI QA
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.5 Application / Software
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 24 Aug 2021 12:46
Last Modified: 09 Aug 2023 06:22
URI: https://kc.umn.ac.id/id/eprint/16801

Actions (login required)

View Item View Item