Implementasi Augmentasi Audio untuk Pengenalan Ucapan pada Model Wav2Vec2 dalam Bahasa Jawa dan Sunda

Gregorius Hakim, Raphael (2024) Implementasi Augmentasi Audio untuk Pengenalan Ucapan pada Model Wav2Vec2 dalam Bahasa Jawa dan Sunda. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf

Download (7MB)
[img] PDF
BAB_I.pdf

Download (214kB)
[img] PDF
BAB_II.pdf

Download (1MB)
[img] PDF
BAB_III.pdf

Download (340kB)
[img] PDF
BAB_IV.pdf
Restricted to Registered users only

Download (330kB)
[img] PDF
BAB_V.pdf

Download (204kB)
[img] PDF
DAFTAR_PUSTAKA.pdf

Download (233kB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (210kB)

Abstract

Implementasi augmentasi audio untuk pengenalan ucapan pada model Wav2Vec2 dalam bahasa Jawa dan Sunda didorong oleh kegunaan sistem pengenalan ucapan yang sudah dapat terlihat berdampak besar. Namun, penerapannya pada bahasa-bahasa yang dikategorikan sebagai low-resource masih menghadapi berbagai tantangan. Contohnya, Indonesia yang memiliki 700 bahasa menghadapi ancaman kepunahan terhadap 400 bahasanya. Hal ini disebabkan oleh kurangnya dokumentasi yang baik, sehingga bahasa-bahasa ini tidak dapat secara optimal digunakan dalam pembelajaran mesin. Metode yang digunakan dalam penelitian ini dirancang dengan menggunakan model Wav2Vec2 yang dipadukan dengan algoritma connectionist temporal classification dan teknologi augmentasi untuk meningkatkan akurasi dan ketangguhan model. Hasil penelitian menunjukkan kesuksesan implementasi pengenalan ucapan dengan peningkatan akurasi sebesar 24,43% dari model awal yang tidak mengimplementasikan augmentasi pada audionya. Lalu, dilakukan hal yang sama pada bahasa Jawa dan ditemukan peningkatan sebesar 8,2% dari model awal. Walaupun masih jauh dari kondisi optimal, model augmentasi telah menunjukkan keunggulannya dibandingkan model tanpa augmentasi. Sehingga dapat ditarik sebuah kesimpulan bahwa implementasi augmentasi terbukti efektif dalam meningkatkan ketangguhan sistem pengenalan ucapan, terutama dalam konteks bahasa-bahasa low-resource seperti bahasa Jawa dan Sunda.

Item Type: Thesis (Bachelor Thesis)
Keywords: Augmentasi Audio, Bahasa Jawa, Bahasa Sunda, Pengenalan Ucapan Otomatis, Wav2Vec2
Subjects: ?? T58.5-58.64 ??
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 09 Nov 2024 12:08
Last Modified: 09 Nov 2024 12:08
URI: https://kc.umn.ac.id/id/eprint/33983

Actions (login required)

View Item View Item