Cornelius, Kenny (2022) Implementasi POS-Tag dan Bilingual Dataset untuk Peningkatan Performa Model Named Entity Recognition Berbasis Bi-LSTM+CRF. Bachelor Thesis, Universitas Multimedia Nusantara.
|
Text
HALAMAN_AWAL.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (1MB) |
||
|
Text
DAFTAR_PUSTAKA.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (604kB) |
||
|
Text
BAB_I.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (945kB) | Preview |
|
|
Text
BAB_II.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (1MB) | Preview |
|
|
Text
BAB_III.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (1MB) |
||
|
Text
BAB_IV.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (6MB) |
||
|
Text
BAB_V.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (312kB) |
||
|
Text
LAMPIRAN.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (4MB) |
Abstract
Dewasa ini, pertukaran informasi berlangsung dengan sangat cepat dan mudah de- ngan bantuan internet. Namun, muncul sebuah tantangan dimana informasi yang beredar di internet bersifat tidak terstruktur. Terlebih lagi, informasi-informasi tersebut dapat tertulis dalam berbagai macam bahasa. Oleh karena itu dikem- bangkanlah sebuah sistem yang NER untuk mengolah informasi tersebut. Pada penelitian ini, sistem NER yang dibangun mengaplikasikan pelatihan menggunakan dua dataset dengan bahasa yang berbeda (Bahasa Indonesia dan Bahasa Ingrris) dan POS-Tagging. Penelitian ini bertujuan untuk membandingkan performa model yang dilatih menggunakan dataset dengan satu bahasa dan dua bahasa, serta memband- ingkan performa model dengan atau tanpa penggunaan POS-Tagging. Berdasarkan beberapa skenario percobaan, performa model yang memiliki performa paling baik adalah model yang dilatih menggunakan dataset Bahasa indonesia dan tanpa peng- gunaan POS-Tagging, yang memiliki akurasi sebesar 95%. Penelitian ini juga menyimpulkan bahwa penggunaan bilingual dataset memiliki perbedaan akurasi sebesar 5% (tanpa POS-Tag) dan 12% (dengan POS-Tag). Selain itu penggunaan POS-Tag pada model membuat performa model menurun sebesar 25% pada model yang dilatih menggunakan dataset Bahasa Indonesia dan 8% pada model yang di- latih menggunakan dataset Bahasa Indonesia dan Bahasa Inggris.
Actions (login required)
![]() |
View Item |
