Path: Top > S1-Final_Project > Fakultas_Teknik_dan_Ilmu_Komputer > Teknik_Informatika > 2017

Perbandingan Seleksi Fitur Untuk Klasifikasi Sentimen SVM Pada Twitter

2017
Undergraduate Theses from JBPTUNIKOMPP / 2017-07-04 07:58:35
By : Dede Juniawan Suri NIM. 10112664, Perpustakaan UNIKOM
Created : 2017-07-04, with 10 files

Keyword : Analisis Sentimen, Seleksi Fitur, TF-IDF, Ratio, N-Gram, Support Vector Machine, Twitter
Url : http://alumni.unikom.ac.id

Analisis sentimen adalah bidang studi untuk menganalisis pendapat, sentimen, evaluasi, penilaian sikap dan emosi terhadap entitas seperti produk, jasa, organisasi, individu, peristiwa, dan atribut lainnya. Seleksi fitur memiliki peran penting dalam klasifikasi teks termasuk analisis sentimen, penggunaan metode seleksi fitur membantu memahami atribut yang relevan untuk kelas tertentu serta meningkatkan akurasi klasifikasi. Metode seleksi fitur TF-IDF, Ratio, dan N-Gram telah diterapkan dalam klasifikasi pesan singkat twitter, metode-metode tersebut menghasilkan akurasi yang baik, akan tetapi belum diketahui metode yang lebih baik karena dilakukan dalam penelitian yang berbeda. Berdasarkan hasil penelitian dengan dataset 1100 tweet yang dibagi menjadi 500 untuk training filter tweet, 500 untuk training klasifikasi sentimen, 50 untuk testing filter tweet, dan 50 untuk testing klasifikasi sentimen. Metode TF-IDF menghasilkan akurasi tertinggi yaitu 74% pada klasifikasi filter tweet dan 80% pada klasfikasi sentimen, Ratio menghasilkan akurasi 72% pada klasifikasi filter tweet dan 74% pada klasfikasi sentimen, dan N-Gram menghasilkan akurasi 64% pada klasifikasi filter tweet dan 78% pada klasfikasi sentimen.

Description Alternative :

Sentiment analysis is the field of study to analyze the opinions, sentiments, evaluation, assessment and emotional attitude towards entities such as products, services, organizations, individuals, events, and other attributes. Feature selection has an important role in the classification of text including sentiment analysis, the use of feature selection methods to help understand the attributes that are relevant for a particular class and to improve classification accuracy. Feature selection methods TF-IDF, Ratio, and N-Gram has been applied in the classification of short message twitter, these methods produce good accuracy, but not known better method because it is done in different research. Based on the results of the study with 1100 tweets dataset is divided into 500 for training tweet filter, 500 for sentiment classification training, 50 for testing filter tweets, and 50 for testing sentiment classification. Methods TF-IDF produce the highest accuracy, with 74% on the classification filter tweets and 80% on the sentiment classification sentiment, Ratio produces accuracy 72% on the classification filter tweets and 74% on the sentiment classification, and N-Gram produce accuracy 64% on the classification filter tweets and 78% on sentiment classification.

Give Comment ?#(0) | Bookmark

PropertyValue
Publisher IDJBPTUNIKOMPP
OrganizationP
Contact Namedyah@unikom.ac.id
AddressJl. Dipati Ukur No.116 Lt.7
CityBandung
RegionWest Java
CountryIndonesia
Phone022-2533825 ext.112
Fax022-2533754
Administrator E-mailperpus@unikom.ac.id
CKO E-mailperpus@unikom.ac.id