Implementasi POS-Tag dan Bilingual Dataset untuk Peningkatan Performa Model Named Entity Recognition Berbasis Bi-LSTM+CRF

Cornelius, Kenny (2022) Implementasi POS-Tag dan Bilingual Dataset untuk Peningkatan Performa Model Named Entity Recognition Berbasis Bi-LSTM+CRF. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (1MB)
[img]
Preview
Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (604kB) | Preview
[img]
Preview
Text
BAB_I.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (945kB) | Preview
[img]
Preview
Text
BAB_II.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (1MB) | Preview
[img]
Preview
Text
BAB_III.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (1MB) | Preview
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (6MB)
[img]
Preview
Text
BAB_V.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (312kB) | Preview
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (4MB)

Abstract

Dewasa ini, pertukaran informasi berlangsung dengan sangat cepat dan mudah de- ngan bantuan internet. Namun, muncul sebuah tantangan dimana informasi yang beredar di internet bersifat tidak terstruktur. Terlebih lagi, informasi-informasi tersebut dapat tertulis dalam berbagai macam bahasa. Oleh karena itu dikem- bangkanlah sebuah sistem yang NER untuk mengolah informasi tersebut. Pada penelitian ini, sistem NER yang dibangun mengaplikasikan pelatihan menggunakan dua dataset dengan bahasa yang berbeda (Bahasa Indonesia dan Bahasa Ingrris) dan POS-Tagging. Penelitian ini bertujuan untuk membandingkan performa model yang dilatih menggunakan dataset dengan satu bahasa dan dua bahasa, serta memband- ingkan performa model dengan atau tanpa penggunaan POS-Tagging. Berdasarkan beberapa skenario percobaan, performa model yang memiliki performa paling baik adalah model yang dilatih menggunakan dataset Bahasa indonesia dan tanpa peng- gunaan POS-Tagging, yang memiliki akurasi sebesar 95%. Penelitian ini juga menyimpulkan bahwa penggunaan bilingual dataset memiliki perbedaan akurasi sebesar 5% (tanpa POS-Tag) dan 12% (dengan POS-Tag). Selain itu penggunaan POS-Tag pada model membuat performa model menurun sebesar 25% pada model yang dilatih menggunakan dataset Bahasa Indonesia dan 8% pada model yang di- latih menggunakan dataset Bahasa Indonesia dan Bahasa Inggris.

Item Type: Thesis (Bachelor Thesis)
Keywords: Bidirectional LSTM, Bilingual, Conditional Random Fields, Named Entity Recognition, POS-Tagging, prediksi
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 004 Computer Science, Data Processing, Hardware
000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 006 Special Computer Methods > 006.2 Special-purpose System, Data Collection, Automatic Identification and Data Capture
000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 006 Special Computer Methods > 006.3 Artificial Intelligence, Machine Learning, Pattern Recognition, Data Mining
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 18 Nov 2022 07:52
Last Modified: 24 Aug 2023 00:02
URI: https://kc.umn.ac.id/id/eprint/19945

Actions (login required)

View Item View Item