Sebastian Emmanuel, Denn (2023) Pengembangan U-Tapis untuk Pendeteksi Kesalahan Sintaksis Kalimat Bahasa Indonesia Menggunakan Conditional Random Field dan Context Free Grammar. Bachelor Thesis thesis, Universitas Multimedia Nusantara.
|
PDF
HALAMAN_AWAL.pdf Download (966kB) | Preview |
|
|
PDF
DAFTAR_PUSTAKA.pdf Download (239kB) | Preview |
|
|
PDF
BAB_I.pdf Download (221kB) | Preview |
|
|
PDF
BAB_II.pdf Download (844kB) | Preview |
|
|
PDF
BAB_III.pdf Download (1MB) | Preview |
|
PDF
BAB_IV.pdf Restricted to Registered users only Download (1MB) |
||
|
PDF
BAB_V.pdf Download (208kB) | Preview |
|
PDF
LAMPIRAN.pdf Restricted to Registered users only Download (1MB) |
Abstract
Saat pembuatan proyek skripsi ini, proses pembuatan artikel berita baru di Tribun News masih menggunakan teknik semi-digital (word processing tool dan internal website) dan belum mengimplementasikan teknologi algoritma dan machine learning. Hal ini berpotensi menyebabkan artikel berita baru tersebut memiliki kesalahan sintaksis kalimat Bahasa Indonesia. Pengembangan Algoritma U-Tapis Pendeteksi Kesalahan Sintaksis Kalimat Bahasa Indonesia dilakukan untuk membantu memastikan kebenaran sintaksis artikel berita baru di Tribun News. Algoritma ini dapat menerima data artikel berita dan mengembalikan kebenaran sintaksis dari setiap kalimat berita tersebut. Algoritma U-Tapis Pendeteksi Kesalahan Sintaksis Kalimat adalah kombinasi dari algoritma Conditional Random Field (CRF) dan Context Free Grammar (CFG). Algoritma Conditional Random Field (CRF) digunakan untuk melakukan part-of-speech tagging dan algoritma Context Free Grammar (CFG) digunakan untuk melakukan parsing pada hasil part-of-speech tagging tersebut serta menguji kebenaran sintaksis setiap kalimat di dalam berita tersebut. Algoritma U-Tapis Pendeteksi Kesalahan Sintaksis Kalimat telah berhasil di-deploy dalam bentuk Python Flask API (Application Programming Interface). Hasil evaluasi Algoritma U-Tapis Pendeteksi Kesalahan Sintaksis Kalimat menunjukkan nilai accuracy sebesar 0,91, macro-averaged precision sebesar 0,83, macro-averaged recall sebesar 0,84, macro-averaged F1- Score sebesar 0,84, weighted-averaged precision sebesar 0,91, weighted-averaged recall sebesar 0,91, weighted-averaged F1-score sebesar 0,91, dan rata-rata runtime sebesar 2,1374 detik per kalimat.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Keywords: | Conditional Random Field, Context Free Grammar, sintaksis kalimat bahasa Indonesia, Tribun News, U-Tapis |
Subjects: | 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming > 005.1 Programming, Programming Language 400 Language > 410 Linguistics > 411 Writing Systems of Standard Forms of Languages |
Divisions: | Faculty of Engineering & Informatics > Informatics |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 21 Jun 2023 09:49 |
Last Modified: | 25 Aug 2023 08:19 |
URI: | https://kc.umn.ac.id/id/eprint/25445 |
Actions (login required)
View Item |