Racang Bangun Sistem Image Recognition, Text Processing, dan ETL

Wijaya Arifin, Michael (2020) Racang Bangun Sistem Image Recognition, Text Processing, dan ETL. Internship thesis, Universitas Multimedia Nusantara.

[img] Text
HALAMAN_AWAL.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (450kB)
[img]
Preview
Text
DAFTAR_PUSTAKA.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (31kB) | Preview
[img]
Preview
Text
BAB_I.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (15kB) | Preview
[img]
Preview
Text
BAB_II.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (110kB) | Preview
[img]
Preview
Text
BAB_III.pdf
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (198kB) | Preview
[img] Text
BAB_IV.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (1MB)
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (1MB)

Abstract

Penulis melakukan kerja magang di Kompas Media Nusantara. Selama penulis magang, penulis diberikan tiga tugas oleh supervisor. Tugas pertama yang diberikan adalah membuat sistem image recognition yang dapat membaca gambar yang dikirimkan pengguna dan menentukan nomor halaman gambar tersebut di koran kompas. Untuk menentukan lokasi gambar di koran, penulis menggunakan Python, library OpenCV, algoritma ORB dan FLANN untuk membandingkan gambar dengan gambar halaman koran kompas. Tugas kedua adalah membuat sistem text processing yang dapat membaca artikel berita dan menggunakan Named Entity Recognition untuk menentukan lokasi kejadian yang diuraikan pada artikel tersebut. Untuk membuat sistem ini, penulis menggunakan SpaCy NER. Sayangnya akurasi SpaCy NER kurang memuaskan sehingga supervisor menganggap tugas ini tidak layak. Tugas terakhir yang diberikan adalah membuat sistem ETL menggunakan ELK Stack yang dapat mengekstrak file dari tiga kantor berita, mengtransformasi file ke bentuk yang dapat dibaca oleh Elasticsearch, dan memuat file tersebut ke Elasticsearch menggunakan Logstash. Dalam pengerjaan tugas, penulis menemukan bahwa timestamp file tidak dapat dibaca oleh Elasticsearch sehingga penulis harus membuat script Ruby untuk merubah timestamp ke bentuk yang dapat dibaca. Semua sistem yang telah dibuat diunggah ke situs Github untuk di deploy di server Kompas dan semua kode sistem didokumentasikan.

Item Type: Thesis (Internship)
Keywords: Elasticsearch, ELK Stack, Image Recognition, Logstash, Named Entity Recognition
Subjects: 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 006 Special Computer Methods > 006.4 Computer Pattern Recognition, Barcode, Computer Graphics
Divisions: Faculty of Engineering & Informatics > Computer Engineering
SWORD Depositor: mr admin umn
Depositing User: mr admin umn
Date Deposited: 05 Dec 2020 03:07
Last Modified: 08 Jun 2023 03:09
URI: https://kc.umn.ac.id/id/eprint/13837

Actions (login required)

View Item View Item