Cornelius, Kenny (2022) Implementasi POS-Tag dan Bilingual Dataset untuk Peningkatan Performa Model Named Entity Recognition Berbasis Bi-LSTM+CRF. Bachelor Thesis thesis, Universitas Multimedia Nusantara.
Abstract
Dewasa ini, pertukaran informasi berlangsung dengan sangat cepat dan mudah de- ngan bantuan internet. Namun, muncul sebuah tantangan dimana informasi yang beredar di internet bersifat tidak terstruktur. Terlebih lagi, informasi-informasi tersebut dapat tertulis dalam berbagai macam bahasa. Oleh karena itu dikem- bangkanlah sebuah sistem yang NER untuk mengolah informasi tersebut. Pada penelitian ini, sistem NER yang dibangun mengaplikasikan pelatihan menggunakan dua dataset dengan bahasa yang berbeda (Bahasa Indonesia dan Bahasa Ingrris) dan POS-Tagging. Penelitian ini bertujuan untuk membandingkan performa model yang dilatih menggunakan dataset dengan satu bahasa dan dua bahasa, serta memband- ingkan performa model dengan atau tanpa penggunaan POS-Tagging. Berdasarkan beberapa skenario percobaan, performa model yang memiliki performa paling baik adalah model yang dilatih menggunakan dataset Bahasa indonesia dan tanpa peng- gunaan POS-Tagging, yang memiliki akurasi sebesar 95%. Penelitian ini juga menyimpulkan bahwa penggunaan bilingual dataset memiliki perbedaan akurasi sebesar 5% (tanpa POS-Tag) dan 12% (dengan POS-Tag). Selain itu penggunaan POS-Tag pada model membuat performa model menurun sebesar 25% pada model yang dilatih menggunakan dataset Bahasa Indonesia dan 8% pada model yang di- latih menggunakan dataset Bahasa Indonesia dan Bahasa Inggris.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Keywords: | Bidirectional LSTM, Bilingual, Conditional Random Fields, Named Entity Recognition, POS-Tagging, prediksi |
Subjects: | 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 004 Computer Science, Data Processing, Hardware 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 006 Special Computer Methods > 006.2 Special-purpose System, Data Collection, Automatic Identification and Data Capture 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 006 Special Computer Methods > 006.3 Artificial Intelligence, Machine Learning, Pattern Recognition, Data Mining |
Divisions: | Faculty of Engineering & Informatics > Informatics |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 18 Nov 2022 07:52 |
Last Modified: | 24 Aug 2023 00:02 |
URI: | https://kc.umn.ac.id/id/eprint/19945 |
Actions (login required)
View Item |