Wijaya Arifin, Michael (2020) Racang Bangun Sistem Image Recognition, Text Processing, dan ETL. Internship thesis, Universitas Multimedia Nusantara.
Text
HALAMAN_AWAL.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (450kB) |
||
|
Text
DAFTAR_PUSTAKA.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (31kB) | Preview |
|
|
Text
BAB_I.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (15kB) | Preview |
|
|
Text
BAB_II.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (110kB) | Preview |
|
|
Text
BAB_III.pdf Available under License Creative Commons Attribution Non-commercial Share Alike. Download (198kB) | Preview |
|
Text
BAB_IV.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (1MB) |
||
Text
LAMPIRAN.pdf Restricted to Registered users only Available under License Creative Commons Attribution Non-commercial Share Alike. Download (1MB) |
Abstract
Penulis melakukan kerja magang di Kompas Media Nusantara. Selama penulis magang, penulis diberikan tiga tugas oleh supervisor. Tugas pertama yang diberikan adalah membuat sistem image recognition yang dapat membaca gambar yang dikirimkan pengguna dan menentukan nomor halaman gambar tersebut di koran kompas. Untuk menentukan lokasi gambar di koran, penulis menggunakan Python, library OpenCV, algoritma ORB dan FLANN untuk membandingkan gambar dengan gambar halaman koran kompas. Tugas kedua adalah membuat sistem text processing yang dapat membaca artikel berita dan menggunakan Named Entity Recognition untuk menentukan lokasi kejadian yang diuraikan pada artikel tersebut. Untuk membuat sistem ini, penulis menggunakan SpaCy NER. Sayangnya akurasi SpaCy NER kurang memuaskan sehingga supervisor menganggap tugas ini tidak layak. Tugas terakhir yang diberikan adalah membuat sistem ETL menggunakan ELK Stack yang dapat mengekstrak file dari tiga kantor berita, mengtransformasi file ke bentuk yang dapat dibaca oleh Elasticsearch, dan memuat file tersebut ke Elasticsearch menggunakan Logstash. Dalam pengerjaan tugas, penulis menemukan bahwa timestamp file tidak dapat dibaca oleh Elasticsearch sehingga penulis harus membuat script Ruby untuk merubah timestamp ke bentuk yang dapat dibaca. Semua sistem yang telah dibuat diunggah ke situs Github untuk di deploy di server Kompas dan semua kode sistem didokumentasikan.
Item Type: | Thesis (Internship) |
---|---|
Keywords: | Elasticsearch, ELK Stack, Image Recognition, Logstash, Named Entity Recognition |
Subjects: | 000 Computer Science, Information and General Works > 000 Computer Science, Knowledge and Systems > 006 Special Computer Methods > 006.4 Computer Pattern Recognition, Barcode, Computer Graphics |
Divisions: | Faculty of Engineering & Informatics > Computer Engineering |
SWORD Depositor: | Administrator UMN Library |
Depositing User: | Administrator UMN Library |
Date Deposited: | 05 Dec 2020 03:07 |
Last Modified: | 08 Jun 2023 03:09 |
URI: | https://kc.umn.ac.id/id/eprint/13837 |
Actions (login required)
View Item |