Please use this identifier to cite or link to this item: http://hdl.handle.net/11547/1592
Full metadata record
DC FieldValueLanguage
dc.contributor.authorYelmen, İlkay-
dc.date.accessioned2019-04-29T06:15:26Z-
dc.date.available2019-04-29T06:15:26Z-
dc.date.issued2016-08-
dc.identifier.urihttp://hdl.handle.net/11547/1592-
dc.description.abstractİnternetin sürekli olarak gelişmesi ve hayatımızın vazgeçilmesi olması ile beraber birtakım sosyal paylaşım siteleri ortaya çıkmıştır. İnsanların fikirlerini paylaştığı ve etkileşimde bulunduğu bu sosyal medya platformları veri kaynağı açısından bilim insanlarının adresi olmuştur. İnsanlar günümüzde istedikleri bilgiye internet üzerinden yaptıkları aramalarla kolaylıkla ulaşabilmektedir. İnternetteki bilgilerin çoğu geribildirime açık olup bu geri bildirimler anketler ve forum siteleri aracılığıyla yeni fikirlerin analizi için toplanmaktadır. Çok fazla internet kullanıcısı olmasından dolayı geri bildirimlerin insan tarafından analiz edilmesi çok zordur. İşte bu noktada duygu analizi kavramı ortaya çıkmıştır. Duygu analizi, metinlerdeki bir konu hakkındaki duygu ve düşüncenin analiz edilerek duygunun pozitif ve negatif olarak sınıflandırılmasını amaçlar. Öznitelik seçimi sınıflandırma performansı ve başarısını arttırmak için günümüzde sıklıkla kullanılmaktadır. Bu seçimde farklı metotlar kullanılmakta olup amaçlanan veri kümesi içinden sınıflandırmadaki başarıyı etkileyen alakasız niteliklerin devre dışı bırakılıp önemli niteliklerin seçilmesidir. Bu şekilde başarı oranı arttırılabilir. Bu tez çalışmasında günlük konuşma dili ile yazılan Türkçe metinlerden öznitelik seçimine odaklanılmış olup detaylı ön işlemeden geçen veri üzerinde destek vektör makineleri, yapay sinir ağları ve centroid tabanlı sınıflandırma algoritmaları kullanılmıştır. 3 ayrı GSM operatörünün takipçilerine ait tweetler üzerinde Gini İndeks, Bilgi Kazancı ve Genetik Algoritma 3 farklı sınıflandırma algoritmasıyla hibrit olarak kullanılmıştır. Özellikle boyut indirgemede önemli bir yere sahip olan ve sezgisel olarak çalışan genetik algoritma ile destek vektör makineleri hibrit olarak kullanıldığında 3 farklı GSM operatörü için de %100 başarı elde edilmiştir.tr_TR
dc.language.isotrtr_TR
dc.publisherİSTANBUL AYDIN ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜtr_TR
dc.subjectDuygu Analizitr_TR
dc.subjectÖznitelik Seçimitr_TR
dc.subjectGenetik Algoritmatr_TR
dc.subjectSosyal Medyatr_TR
dc.subjectTwittertr_TR
dc.subjectSınıflandırmatr_TR
dc.subjectMetin Madenciliğitr_TR
dc.subjectSentiment Analysistr_TR
dc.subjectFature Selectiontr_TR
dc.subjectGenetic Algorithmtr_TR
dc.subjectSocial Mediatr_TR
dc.subjectTwittertr_TR
dc.subjectClassificationtr_TR
dc.subjectText Miningtr_TR
dc.titleDOĞAL DİL İŞLEME YÖNTEMLERİYLE TÜRKÇE SOSYAL MEDYA VERİLERİ ÜZERİNDE DUYGU ANALİZİtr_TR
dc.typeThesistr_TR
dc.description.abstractolSeveral social media websites are showed up as Internet’s improving continously and becoming an irreplaceable part of our lives. Those sites that people share their opinions and interact with others have become the address of scientists in terms of data source. People can access any information they need easily by doing research on Internet these days. Many of the data are open for feedbacks and these feedbacks are gathered for analyses of new ideas by surveys and forum sites. It is too hard to analyze feedbacks by a person as there are so many Internet users. At this point, emotion analysis concept showed up. Emotion analysis is aimed at classify the emotion as positive and negative by analyze the emotion and thought about a topic in texts. Entity property selection is used frequently nowadays in order to increase the performance and success in classification. Different methods are used in this selection and it is selecting the important qualities by eliminating the irrelevant features that affect the success in classification in target data set. Thus, hit ratio may increase. In this thesis, feature selection from Turkish texts written as colloquial is focused and support vector machine, artificial neural networks and centroid based classification algorithms are used on data that has detailed preprocessing. Gini Index, Information Gain and Genetic Algorithm are used as hybrids with 3 different classification algorithms on tweets belonging to 3 different GSM operators’ followers. 100% success is achieved for 3 different GSM operators when genetic algorithm, which works as intuitively and has an important role in dimension reduction, and support vector machines are used hybridly.tr_TR
dc.publisher.firstpagenumber1tr_TR
dc.publisher.lastpagenumber71tr_TR
Appears in Collections:Tezler -Thesis

Files in This Item:
File Description SizeFormat 
DOĞAL DİL İŞLEME YÖNTEMLERİYLE TÜRKÇE SOSYAL MEDYA VERİLERİ ÜZERİNDE DUYGU ANALİZİ.pdfTez Dosyası1.7 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.