Implementasi Teks Mining dengan K-Nearest Neighbor pada Analisis Sentimen

Authors

  • Risyad Ahyan Politeknik Caltex Riau
  • Warnia Nengsih Sikumbang Politeknik Caltex Riau
  • Silavana Rasio Henim Politeknik Caltex Riau

Abstract

Twitter merupakan media sosial yang dapat menjadi penyebar informasi yang sangat cepat saat ini. Informasi yang beredar melalui media ini sangat bebas dan beragam seperti berita, pertanyaan, opini, komentar, kritik baik yang bersifat positif maupun negatif. Analisis sentimen merupakan salah satu cabang penelitian pada domain Text Mining atau penggalian data berupa teks. Manfaat analisis sentimen dalam dunia usaha antara lain untuk melakukan pemantauan terhadap sebuah produk. Analisis sentimen dapat digunakan sebagai alat bantu untuk melihat respon konsumen atau masyarakat terhadap suatu produk tertentu, sehingga dapat segera diambil langkah-langkah strategis berikutnya. Proses pada analisis sentimen diawali dengan preprocessing, dilanjutkan dengan pembobotan kata, kemudian pengkategorian yang terdiri dari penghitungan cosine similarity dan klasifikasi sentimen. Preprocessing terdiri dari beberapa tahap yaitu pembersihan dokumen, tokenizing, stopword removal, dan stemming. Metode pembobotan kata yang digunakan adalah Term Frequecny – Inverse Document Frequency (TF-IDF) dan menggunakan K-Nearest Neighbor (K-NN) sebagai metode klasifikasinya.Kata kunci: Analisis Sentimen, Text Mining,  K-Nearest Neighbor (K-NN)

Author Biographies

Risyad Ahyan, Politeknik Caltex Riau

Sistem Informasi

Warnia Nengsih Sikumbang, Politeknik Caltex Riau

Sistem Informasi

Silavana Rasio Henim, Politeknik Caltex Riau

Teknik Komputer

References

Boyd, M. D., & Ellison, N. B. (2008). Social Network Sites: Definition, History, and Scholarship. Journal of Computer-Mediated Communication.

Dehaff, M. 2010. Sentiment Analysis, Hard But Worth It! [Online]. Tersedia di: http://www.customerthink.com/blog/sentiment_analysis_hard_but_worth_it

Feldman, R & Sanger, J. 2007. The Text Mining Handbook : Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press : New York.

Liu, Bing. 2012. Sentiment Analysis And Opinion Mining. Chicago: Morgan & Claypool

Intan, Rolly dan Andrew Defeng, 2006, Subject Based Search Engine Menggunakan TF-IDF dan Jaccard’s Coefficient, Universitas Kristen Petra, Surabaya.

Manning, C. D., Raghavan, P., Schutze, H 2008. Introduction of Information Retrieval. New York: Camridge University Press.

Twitter. https://support.twitter.com/

Zarella, Dan. (2010). The Social Media Marketing Book. Sebastopol, Canada: O’Reilly Media, Inc.

Published

2017-01-31

Issue

Section

Artikel