Implementasi Representasi Kata Tingkat Karakter Menggunakan Embedding from Language Models (ELMo) pada Pengurai Dependensi Bahasa Indonesia

Anthony, Anthony (2020) Implementasi Representasi Kata Tingkat Karakter Menggunakan Embedding from Language Models (ELMo) pada Pengurai Dependensi Bahasa Indonesia. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (1MB)
[img]
Preview
Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Share Alike.

Download (237kB) | Preview
[img]
Preview
Text
BAB_I.pdf
Available under License Creative Commons Attribution Share Alike.

Download (217kB) | Preview
[img]
Preview
Text
BAB_II.pdf
Available under License Creative Commons Attribution Share Alike.

Download (1MB) | Preview
[img]
Preview
Text
BAB_III.pdf
Available under License Creative Commons Attribution Share Alike.

Download (959kB) | Preview
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (866kB)
[img]
Preview
Text
BAB_V.pdf
Available under License Creative Commons Attribution Share Alike.

Download (206kB) | Preview
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Share Alike.

Download (1MB)

Abstract

Tujuan dilakukannya penguraian dependensi adalah untuk mengetahui hubungan fungsional yang terjadi di antara kata, seperti misalnya hubungan subjek-objek di dalam kalimat. Untuk menguraikan kalimat bahasa Indonesia, morfologi kata perlu diketahui. Hal ini dikarenakan tata bahasa Indonesia banyak sekali melakukan pengimbuhan kata. Berdasarkan hal tersebut, informasi tentang morfologi seharusnya ikut disertakan. Beruntungnya, informasi tersebut bisa disertakan secara implisit oleh representasi kata. Misalnya, Embeddings from Language Models (ELMo) yang berkemampuan untuk menyimpan morfologis kata di dalam representasi kata miliknya. Tidak seperti representasi kata yang secara luas digunakan seperti word2vec ataupun Global Vectors (GloVe), ELMo mempergunakan metode yang berbeda yaitu Character Convolutional Neural Network (Char CNN). Metode ini ditujukan agar pengimbuhan kata bisa tersertakan di dalam representasi kata. Untuk membandingkan ELMo dengan word2vec, beberapa analisis dilakukan yang antara lain analisis kemiripan kata dan pengvisualisasian kata. Hasil analisis menunjukan bahwa representasi kata ELMo lebih baik dibanding word2vec dalam hal menyimpan morfologis kata. Kemudian, pengurai coba dilatih menggunakan representasi kata milik word2vec dan ELMo. Sesuai dugaan, pengurai yang menggunakan ELMo mendapatkan akurasi yang lebih baik dibandingkan dengan word2vec. Unlabeled Attachment Score (UAS) yang didapatkan oleh ELMo adalah sebesar 83.55% sedangkan word2vec 81.35%. Oleh sebab itu penelitian ini mengkonfirmasikan bahwa morfologis kata wajib diikutsertakan terutama pada tugas penguraian dependensi berbahasa Indonesia.

Item Type: Thesis (Bachelor Thesis)
Keywords: Natural Language Processing, Syntactics, Dependency Parsing, Character Based Representation
Subjects: 400 Language > 400 Language > 400 Language
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: mr admin umn
Depositing User: mr admin umn
Date Deposited: 05 Dec 2020 09:48
Last Modified: 22 Aug 2023 01:11
URI: https://kc.umn.ac.id/id/eprint/13262

Actions (login required)

View Item View Item