Implementasi Word Embedding untuk Klasifikasi Berita Penyandang Disabilitas Menggunakan Logistic Regression

Tjendry, Djasen (2021) Implementasi Word Embedding untuk Klasifikasi Berita Penyandang Disabilitas Menggunakan Logistic Regression. Bachelor Thesis thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (845kB)
[img]
Preview
Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (194kB) | Preview
[img]
Preview
Text
BAB_I.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (146kB) | Preview
[img]
Preview
Text
BAB_II.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (381kB) | Preview
[img]
Preview
Text
BAB_III.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (1MB) | Preview
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (1MB)
[img]
Preview
Text
BAB_V.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (114kB) | Preview
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (833kB)

Abstract

Banyaknya penyandang disabilitas menjadi perhatian bagi beberapa orang, organisasi, bahkan negara. Di Indonesia masih kurang peka akan keberadaan kaum disabilitas, ini disebabkan karena kurangnya informasi yang tidak terdokumentasi di media massa. Pemberitaan berita sangatlah penting untuk membangun kesadaran masyarakat mengenai peyandang disabilitas. Mengkategorikan sebuah berita dengan jumlah banyak membutuhkan banyak waktu dan tenaga, maka dibutuhkannya pembelajaran mesin yang dapat mengkategorikan berita secara otomatis. Salah satu metode pembelajaran mesin yaitu Logistic Regression yang dapat menghasilkan probabilitas kategorisasi dan menggunakan FastText sebagai pre-trained model word embedding untuk membantu Logistic Regression memahami konteks dari sebuah teks. Penelitian ini dimulai dari proses scraping, data preprocessing, pembuatan model word embedding FastText, dan menggunakan model FastText untuk mengubah kata menjadi vector sehingga dapat digunakan untuk melatih model Logistic Regression. Hasil terbaik yang didapat dalam penelitian ini dengan data yang di-augmentation sehingga jumlah data menjadi hampir dua kali lipat daripada sebelumnya. Model FastText Skip-gram yang mempunyai 300 dimensi vector digunakan oleh Logistic Regression mempunyai hasil terbaik dengan nilai Precision: 77,78%, Recall: 77%, f1-score: 76,24%, dan Accuracy: 76,31%.

Item Type: Thesis (Bachelor Thesis)
Keywords: Data Augmentation, Disabilitas, FastText, Klasifikasi Berita, Logistic Regression, Word Embedding
Subjects: 300 Social Sciences > 340 Law > 344 Labor, Social Service, Public Health, Safety Measures > 344.04 Public Health
Divisions: Faculty of Engineering & Informatics > Informatics
SWORD Depositor: Administrator UMN Library
Depositing User: Administrator UMN Library
Date Deposited: 24 Aug 2021 11:48
Last Modified: 08 Aug 2023 08:05
URI: https://kc.umn.ac.id/id/eprint/17880

Actions (login required)

View Item View Item