Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.14365/21
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorİnce, Türker-
dc.contributor.advisorÇankaya, Hakkı Candan-
dc.contributor.authorYabaş, Utku-
dc.date.accessioned2023-06-16T12:27:28Z-
dc.date.available2023-06-16T12:27:28Z-
dc.date.issued2014-
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=1zw6GvYMe-q3Hf6HR-3US5iZAo7DuRsgzhIKGnEM0Z9SCxURTLm_-h0hrYV90myu-
dc.identifier.urihttps://hdl.handle.net/20.500.14365/21-
dc.description.abstractMüşteri kaybetmek, telekom firmaları açısından kaybettirdiği para bakımından önemli bir endişedir. Bu tez çalışmasında, en son veri madenciliği yöntemlerini analiz ederek, servislerden ayrılacak veya başka bir firmanın servisini kullanmayı düşünen müşterileri tahmin etmek için yeni metotlar geliştirdik. Önerdiğimiz yaklaşımın performansını yoğun bir şekilde değerlendirdik. Bu değerlendirmeyi yapmak için Orange Telecom tarafından "Knowledge Discovery and Data Mining 2009"(KDD) yarışması için sunduğu gerçek ve kullanıma açık bir veri kümesi kullandık. Bu veri kümesinde toplam 100.000 örnek ve 230 değişken bulunmaktadır. Bu yüzden veri kümesi "büyük veri" kapsamına girmektedir. IBM bu yarışmada birinci olmuştur, ancak önemli ölçüde bilişimsel kaynak kullanmaktadır. Biz alternatif metotlar ve daha uygun kaynaklar kullanarak, yarışmadaki en yüksek skorlara ulaşmayı hedefledik. Bu çalışmada, toplu sınıflandırıcı teknikleri üzerine yoğunlaştık. Tek ve güçlü sınıflandırıcılar ile en son toplu sınıflandırıcıları "müşteri ayrılma" problemi için karşılaştırdık. Ayrıca, bu metotların performanslarını arttırmak için iyi performans gösteren sınıflandırıcıları seçerek; bunları oylayıcı sınıflandırıcı ile birleştirdik. Genel olarak, elde ettiğimiz sonuçlar, yarışmanın en yüksek sonuç alan resmi yarışmacıları ile yakındı. Önerdiğimiz yaklaşımın, "müşteri ayrılması tahmini" dışındaki başka zorlayıcı otomatik öğrenme problem alanları için de değerli olabileceğine inanıyoruz. Yöntemimizin doğruluğunu onaylamak için, UCI Machine Learning kütüphanesinden topladığımız veri kümeleri ile deneyler yaptık. Bu deneyler sonucunda çoğu veri kümesinde yöntemimiz, içinde bulunan toplu sınıflandırıcıdaki bütün algoritmalardan daha iyi sonuçlar elde etmiştir.en_US
dc.description.abstractCustomer churn is a concern for telecommunication service providers due to its associated costs. In this thesis, we analysed state-of-the-art data mining algorithms and developed novel methods to accurately predict customers who will change and turn to another provider for the same or similar service. We extensively evaluated performance of our proposed approach using a public and real dataset compiled by Orange Telecom for the Knowledge Discovery and Data Mining (KDD) 2009 Competition. This dataset has $100,000$ instances with $230$ attributes, which makes it a ``big data''. IBM achieved the highest score on this dataset requiring significant amount of computational resources. We aimed to find alternative methods that can match or improve the recorded highest score with more efficient use of resources. In our study, we focus on ensemble of classifiers techniques. We compared performance of single, powerful classifiers to state-of-the-art ensemble methods for churn detection problem. Additionally, we showed that these results can be further improved by combining selected subset of well performing classifiers by a voting classifier. Overall, the results with our proposed approach were similar to the official top scorers of the competition. We believe that our proposed approach can be valuable for solving other challenging machine learning problem domains (such as ``big data'' problems) rather than churn prediction.Also, we performed experiments using the selected datasets from the UCI Machine Learning repository. Our proposed approach outperforms the single powerful algorithms contained in the ensemble for most of the datasets tested.en_US
dc.language.isoenen_US
dc.publisherİzmir Ekonomi Üniversitesien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectm¨u¸steri kayıp tahminien_US
dc.subject¸coklu sını?andırıcıen_US
dc.subjectoylayan sını?andırıcıen_US
dc.subjectotomatik ¨o^grenmeen_US
dc.subjectveri madencili^gi.en_US
dc.subjectchurn predictionen_US
dc.subjectensemble classi?eren_US
dc.subjectvoting classi?eren_US
dc.subjectdata mining,machine learning.en_US
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolen_US
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleCustomer churn prediction for telecommunications industryen_US
dc.title.alternativeTelekomünikasyon servislerinden aboneliklerini i·ptal edecek müşterileri önceden tahmin etmeken_US
dc.typeMaster Thesisen_US
dc.departmentİEÜ, Lisansüstü Eğitim Enstitüsü, Akıllı Mühendislik Sistemleri Ana Bilim Dalıen_US
dc.identifier.startpage1en_US
dc.identifier.endpage103en_US
dc.institutionauthorYabaş, Utku-
dc.relation.publicationcategoryTezen_US
dc.identifier.yoktezid353633en_US
item.grantfulltextopen-
item.openairetypeMaster Thesis-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.fulltextWith Fulltext-
item.languageiso639-1en-
item.cerifentitytypePublications-
crisitem.author.dept05.04. Software Engineering-
Appears in Collections:Lisansüstü Eğitim Enstitüsü Tez Koleksiyonu
Files in This Item:
File SizeFormat 
21.pdf1.39 MBAdobe PDFView/Open
Show simple item record



CORE Recommender

Page view(s)

86
checked on Nov 18, 2024

Download(s)

22
checked on Nov 18, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.