ANALISIS SENTIMEN HASHTAG KULINER DI INDONESIA MENGGUNAKAN NAIVE BAYES
PDF

Keywords

analisis sentimen
klasifikasi
Twitter
Naive Bayes

How to Cite

RahmaA. F., Agussalim, & Dhian Satria Yudha Kartika. (2021). ANALISIS SENTIMEN HASHTAG KULINER DI INDONESIA MENGGUNAKAN NAIVE BAYES. Jurnal Informatika Dan Sistem Informasi (JIFoSI), 2(1), 19-25. Retrieved from http://jifosi.upnjatim.ac.id/index.php/jifosi/article/view/282

Abstract

Seiring dengan berkembangnya zaman, teknologi baru semakin banyak bermunculan. Banyaknya teknologi baru tersebut mengakibatkan jumlah data yang dihasilkan semakin meningkat. Munculnya media sosial bernama twitter pada tahun 2006 juga ikut menyumbang peningkatan jumlah data yang ada. Penggunaan media sosial twitter ini dapat menjadikan penggunanya berbagi tentang keseharian ataupun informasi dengan rekan atau kerabat secara realtime. Jumlah pengguna twitter yang sangat tinggi dapat menjadi sarana bagi masyarakat untuk melakukan jual beli (promosi), dapat juga untuk menuliskan perasaan apa yang dirasakan, produk apa saja yang sedang digunakan dan juga referensi tempat makan atau kuliner di Indonesia. Hal tersebut adalah salah satu alasan mengapa twitter merupakan sosial media yang tepat didalam melakukan analisis sentimen. Analisis sentimen sendiri perlu dilakukan karena penggunaan media sosial yang semakin meningkat sehingga dapat mempengaruhi perkembangan opini publik.

Pembuatan model analisis sentimen dengan hashtag kuliner pada twitter di Indonesia ini dibangun menggunakan python. Penelitian dilakukan dengan melakukan tahapan pengumpulan data, preprocessing, pelabelan data (positif, negatif, dan netral), pembobotan teks, pembagian data, Naive Bayes Classifier, evaluasi model klasifikasi serta visualisasi. Model ini dibangun dengan menggunakan dua skenario. Pada tahapan pembobotan teks, skenario pertama adalah menggunakan Bag of Words selanjutnya pada skenario kedua menggunakan TFIDF. Dataset yang digunakan memiliki jumlah 748 tweet yang diambil dalam waktu 1 Januari 2020 hingga 30 November 2020. Dataset sudah diberi 3 label yaitu positif, negatif dan netral. Pengambilan dataset diambil dengan menggunakan kata kunci yang memiliki hashtag kuliner. Hasil dari akurasi terbaik yang didapat adalah 98% pada percobaan menggunakan algoritma Multinomial Naive Bayes pada skenario 1 dengan nilai akurasi 0.71, rata-rata precision 0.80, rata-rata recall 0.53, dan rata-rata f-score 0.53.

PDF