Implementasi Arsitektur CRF dan IndoT5 untuk Deteksi serta Koreksi Otomatis Huruf Miring untuk Teks Berita Online

Gantar, Luis (2026) Implementasi Arsitektur CRF dan IndoT5 untuk Deteksi serta Koreksi Otomatis Huruf Miring untuk Teks Berita Online. Bachelor Thesis, Universitas Multimedia Nusantara.

[img] PDF
HALAMAN_AWAL.pdf
Restricted to Registered users only

Download (1MB)
[img] PDF
ARTIKEL.pdf
Restricted to Registered users only

Download (383kB)
[img] PDF
TURNITIN.pdf
Restricted to Registered users only

Download (1MB)
[img] PDF
LAMPIRAN.pdf
Restricted to Registered users only

Download (6MB)
[img] PDF
LETTER_OF_ACCEPTANCE.pdf
Restricted to Registered users only

Download (90kB)
[img] Archive (ZIP)
CREATION_FILE.zip
Restricted to Registered users only

Download (1MB)

Abstract

Penggunaan huruf miring dalam teks berita daring sering kali mengalami ketidakkonsistenan yang tidak sesuai dengan kaidah Pedoman Umum Ejaan Bahasa Indonesia (PUEBI). Proses penyuntingan secara manual memerlukan waktu dan ketelitian yang tinggi, sehingga diperlukan sistem otomatis yang mampu melakukan deteksi serta koreksi secara akurat. Penelitian ini memperkenalkan U-Tapis, sebuah sistem hibrida yang mengintegrasikan arsitektur Conditional Random Field (CRF) sebagai modul deteksi entitas dan arsitektur IndoT5-base sebagai modul koreksi otomatis. Sistem ini dilatih menggunakan dataset teks berita sebanyak 10.000 artikel yang diekstraksi dari Tribun News. Hasil pengujian menunjukkan bahwa model CRF mampu mendeteksi 17 kategori entitas dengan akurasi global sebesar 99,84% dan rata-rata tertimbang (weighted average) F1-Score sebesar 0,993. Sementara itu, modul koreksi IndoT5 mencapai performa yang sangat tinggi dalam merekonstruksi kalimat dengan skor ROUGE-1 sebesar 97,00, ROUGE-2 sebesar 96,41, dan ROUGE-L sebesar 97,00, yang menandakan tingkat kemiripan yang hampir identik dengan target standar pakar. Sebagai luaran, sistem ini diimplementasikan ke dalam bentuk Application Programming Interface (API) berbasis Flask untuk mendukung integrasi layanan koreksi bahasa secara real- time. Hasil penelitian ini membuktikan bahwa penggabungan metode berbasis fitur dan deep learning mampu menjadi solusi efektif dalam meningkatkan kualitas formalitas teks berita di Indonesia.

Item Type: Thesis (Bachelor Thesis)
Creators: Gantar, Luis (00000073190)
Contributors: Vasty Overbeek, Marlinda
Keywords: API, Conditional Random Field, Huruf Miring, IndoT5, PUEBI, Sistem Hibrida.
Subjects: 000 Computer Science, Information and General Works
Divisions: Faculty of Engineering & Informatics > Informatics
Date Deposited: 08 May 2026 07:57
URI: https://kc.umn.ac.id/id/eprint/45433

Actions (login required)

View Item View Item