Alfeto, Alfeto (2023) Analisis Perbandingan Rasio Training Data Model Speech Recognition untuk Gangguan Bicara. Bachelor Thesis thesis, Universitas Multimedia Nusantara.
Text
HALAMAN_AWAL.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (778kB) |
|
Text
DAFTAR_PUSTAKA.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (364kB) |
|
Text
BAB_I.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (258kB) |
|
Text
BAB_II.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (601kB) |
|
Text
BAB_III.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (424kB) |
|
Text
BAB_IV.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (639kB) |
|
Text
BAB_V.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (249kB) |
|
Text
LAMPIRAN.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (492kB) |
Abstract
Sistem speech recognition dapat meningkatkan berbagai aspek kualitas hidup manusia, umumnya dengan menyediakan aksesibilitas dalam bidang audio dan audio visual. Namun, merancang sistem speech recognition sebagai alat bantu komunikasi untuk pengidap gangguan bicara menjadi sebuah tantangan akibat keterbatasan dalam ketersediaan data gangguan bicara. Penelitian ini memiliki tujuan untuk menyelidiki kemungkinan dalam merancang sistem speech recognition berbasis convolutional neural network untuk gangguan bicara menggunakan campuran antara data disordered speech dan normal speech, serta jumlah dan rasio data disordered speech yang harus disertakan pada training data model. Terdapat dua metode untuk membuat dataset yang mengandung data campuran, yaitu dengan memproses sebagian data normal speech menjadi data disordered speech dan dengan melakukan penambahan sebagian data disordered speech kepada dataset normal speech. Dataset yang dibuat digunakan untuk melatih model NVIDIA QuartzNet dan diuji dengan memperhitungkan word error rate pada hasil inference model terhadap data disordered speech. Hasil penelitian menunjukkan adanya potensi untuk merancang sistem dengan melatih model menggunakan data campuran, namun model yang didapatkan dalam penelitian tidak layak untuk digunakan akibat tidak memenuhi kriteria word error rate minimum dan harus dilatih dengan data tambahan.
Item Type: | Thesis (Bachelor Thesis) |
---|---|
Keywords: | Speech Recognition, Speech Disorder, Convolutional Neural Network, Training Data |
Subjects: | 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming 600 Technology (Applied Sciences) > 610 Medicine and Health |
Divisions: | Faculty of Engineering & Informatics > Computer Engineering |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 08 Mar 2024 06:37 |
Last Modified: | 08 Mar 2024 06:47 |
URI: | https://kc.umn.ac.id/id/eprint/28033 |
Actions (login required)
View Item |