Analisis Perbandingan Rasio Training Data Model Speech Recognition untuk Gangguan Bicara

⭐ Alfeto, Alfeto (2023) Analisis Perbandingan Rasio Training Data Model Speech Recognition untuk Gangguan Bicara. Bachelor Thesis, Universitas Multimedia Nusantara.

	Text HALAMAN_AWAL.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (778kB)
	Text DAFTAR_PUSTAKA.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (364kB)
	Text BAB_I.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (258kB)
	Text BAB_II.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (601kB)
	Text BAB_III.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (424kB)
	Text BAB_IV.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (639kB)
	Text BAB_V.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (249kB)
	Text LAMPIRAN.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (492kB)

Abstract

Sistem speech recognition dapat meningkatkan berbagai aspek kualitas hidup manusia, umumnya dengan menyediakan aksesibilitas dalam bidang audio dan audio visual. Namun, merancang sistem speech recognition sebagai alat bantu komunikasi untuk pengidap gangguan bicara menjadi sebuah tantangan akibat keterbatasan dalam ketersediaan data gangguan bicara. Penelitian ini memiliki tujuan untuk menyelidiki kemungkinan dalam merancang sistem speech recognition berbasis convolutional neural network untuk gangguan bicara menggunakan campuran antara data disordered speech dan normal speech, serta jumlah dan rasio data disordered speech yang harus disertakan pada training data model. Terdapat dua metode untuk membuat dataset yang mengandung data campuran, yaitu dengan memproses sebagian data normal speech menjadi data disordered speech dan dengan melakukan penambahan sebagian data disordered speech kepada dataset normal speech. Dataset yang dibuat digunakan untuk melatih model NVIDIA QuartzNet dan diuji dengan memperhitungkan word error rate pada hasil inference model terhadap data disordered speech. Hasil penelitian menunjukkan adanya potensi untuk merancang sistem dengan melatih model menggunakan data campuran, namun model yang didapatkan dalam penelitian tidak layak untuk digunakan akibat tidak memenuhi kriteria word error rate minimum dan harus dilatih dengan data tambahan.

Item Type:	Thesis (Bachelor Thesis)
Creators:	Alfeto, Alfeto (00000023710)
Contributors:	Kusuma Halim, Dareen
Keywords:	Speech Recognition, Speech Disorder, Convolutional Neural Network, Training Data
Subjects:	000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming 600 Technology (Applied Sciences) > 610 Medicine and Health
Divisions:	Faculty of Engineering & Informatics > Computer Engineering
Date Deposited:	08 Mar 2024 06:37
URI:	https://kc.umn.ac.id/id/eprint/28033

Actions (login required)

View Item

This repository is indexed on

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.