Analisis Perbandingan Rasio Training Data Model Speech Recognition untuk Gangguan Bicara

Alfeto, Alfeto (2023) Analisis Perbandingan Rasio Training Data Model Speech Recognition untuk Gangguan Bicara. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (778kB)
[img] Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (364kB)
[img] Text
BAB_I.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (258kB)
[img] Text
BAB_II.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (601kB)
[img] Text
BAB_III.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (424kB)
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (639kB)
[img] Text
BAB_V.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (249kB)
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (492kB)

Abstract

Sistem speech recognition dapat meningkatkan berbagai aspek kualitas hidup manusia, umumnya dengan menyediakan aksesibilitas dalam bidang audio dan audio visual. Namun, merancang sistem speech recognition sebagai alat bantu komunikasi untuk pengidap gangguan bicara menjadi sebuah tantangan akibat keterbatasan dalam ketersediaan data gangguan bicara. Penelitian ini memiliki tujuan untuk menyelidiki kemungkinan dalam merancang sistem speech recognition berbasis convolutional neural network untuk gangguan bicara menggunakan campuran antara data disordered speech dan normal speech, serta jumlah dan rasio data disordered speech yang harus disertakan pada training data model. Terdapat dua metode untuk membuat dataset yang mengandung data campuran, yaitu dengan memproses sebagian data normal speech menjadi data disordered speech dan dengan melakukan penambahan sebagian data disordered speech kepada dataset normal speech. Dataset yang dibuat digunakan untuk melatih model NVIDIA QuartzNet dan diuji dengan memperhitungkan word error rate pada hasil inference model terhadap data disordered speech. Hasil penelitian menunjukkan adanya potensi untuk merancang sistem dengan melatih model menggunakan data campuran, namun model yang didapatkan dalam penelitian tidak layak untuk digunakan akibat tidak memenuhi kriteria word error rate minimum dan harus dilatih dengan data tambahan.

Item Type: Thesis (Bachelor Thesis)
Keywords: Speech Recognition, Speech Disorder, Convolutional Neural Network, Training Data
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 005 Computer Programming
600 Technology (Applied Sciences) > 610 Medicine and Health
Divisions: Faculty of Engineering & Informatics > Computer Engineering
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 08 Mar 2024 06:37
Last Modified: 08 Mar 2024 06:47
URI: https://kc.umn.ac.id/id/eprint/28033

Actions (login required)

View Item View Item