Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.14365/263
Title: | A new rna-seq data classifier based on quantile transformation | Other Titles: | Kuantil transformasyon tabanlı yeni bir rna-sekans veri sınıflandırıcısı | Authors: | Koçhan, Necla | Advisors: | Aşçı, Gözde Yazgı Tütüncü | Keywords: | Biyoistatistik Biostatistics |
Publisher: | İzmir Ekonomi Üniversitesi | Abstract: | Son zamanlarda kanser araştırmalarında, bilinen bir kanser tipi olan bir hastanın o kanserin çeşidine göre doğru sınıflandırılması o hasta için daha iyi tahminlere dayanan ve kişiye özel tedavi sağlamaktadır. Bu nedenle, hastanın kanser çeşidine göre sınıflandırılması çok önemlidir ve bu, genetik bilgi kullanılarak yapılabilinmektedir. Mevcut sınıflandırıcıların çoğu genlerin bağımsız olduğu varsayımına dayanmaktadır; ancak, bu varsayım asıl RNA-Sekans sınıflandırma problemleri için gerçekçi bir yaklaşım değildir. Bu nedenle, bu tezde, genler arasındaki bağımlılık yapısını dikkate alan yeni bir sınıflandırıcı önerilmektedir. Genler arasındaki bağımlılık önce kovaryans matrisi ve daha sonra lokal kovaryans matrisi ile modellenmektedir. Lokal kovaryans matrisi, lokal bağımlılık fonksiyonu kullanılarak tahmin edilmektedir. Sınıflama algoritması R programlama dilinde kodlanmış olup RNA-Sekans verileri için yeni bir sınıflama paketi geliştirilmiştir. Yeni sınıflandırıcının performansı, gerçek RNA-Sekans verileri kullanılarak mevcut sınıflandırıcılar ile sınıflandırma hataları açısından karşılaştırılmıştır. Recently in cancer research, true classification of the sub-type of a patient with a particular cancer, leads a better predictive and a customized treatment for that patient. Therefore, classification of a patient to a cancer sub-type has a crucial importance and can be done by using genetic information. Most of the existing classifiers assume that genes are independent; however, this is not a realistic approach for real RNA-Seq classification problems. For this reason, in this thesis a new classifier, which incorporates the dependence structure between genes into a model, is proposed. The dependency between genes is first modelled by sample covariance matrix and then by local covariance matrix. The local covariance matrix is estimated by the local dependency approximation. The classification algorithm is coded in R programming language and a new classification package for RNA-Seq data is developed. The performance of this new classifier is compared with the existing classifiers over real RNA-Seq data sets, in terms of classification error rates. |
URI: | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=Eb5EkakJlp3olBdo_wNEGTwV43jOrwc8sBHBc_UC8WtdHhjqysoFu2PGAp9lbIkI https://hdl.handle.net/20.500.14365/263 |
Appears in Collections: | Lisansüstü Eğitim Enstitüsü Tez Koleksiyonu |
Show full item record
CORE Recommender
Page view(s)
92
checked on Nov 18, 2024
Download(s)
34
checked on Nov 18, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.