Topluluk Yöntemi ve İlaç İmzaları Kullanılarak Anti Kanser İlaçların Aktivite Tahmini

Tolan, Ertan

Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/2307

Title:	Topluluk Yöntemi ve İlaç İmzaları Kullanılarak Anti Kanser İlaçların Aktivite Tahmini
Other Titles:	Activity Prediction of Anti Cancer Drugs by Using Ensemble Learning and Drugs' Signatures
Authors:	Tolan, Ertan
Advisors:	Tan, Mehmet
Keywords:	Cancer Activity prediction Regression Machine learning Multi-task learning Ensemble learning Drug activity signature Kanser Aktivite tahmini Regresyon Yapay ögrenme Çoklu-iş ögrenme Topluluk modeli ilaç aktivite imzası
Publisher:	TOBB University of Economics and Technology,Graduate School of Engineering and Science TOBB ETÜ Fen Bilimleri Enstitüsü
Source:	Tolan, E. (2016). Topluluk yöntemi ve ilaç imzaları kullanılarak anti kanser ilaçların aktivite tahmini. Ankara: TOBB ETÜ Fen Bilimleri Enstitüsü. [Yayınlanmamış yüksek lisans tezi]
Abstract:	Personalized cancer treatment is an ever-evolving approach due to complexity of cancer. As a part of personalized therapy, effectiveness of a drug on a cell line is measured at the laboratory environments. However, these experiments are backbreaking and money consuming. To surmount these difficulties, computational methods are used with the provided data sets. In the present study, we considered this as a regression problem and firstly designed an ensemble model by combining three different regression models to reduce prediction error for each drug-cell line pair. We defined our base models as gradient boosting regression, kernelized bayesian multi-task learning and trace-norm regularized multi-task learning. Two major data sets, genomics of drug sensitivity in cancer and cancer therapeutics response portal, were used to evaluate our method. Results of this evaluation show that predictions of ensemble method are significantly better than models per se. Furthermore, we report the cytotoxicty predictions of our model for the drug-cell line pairs that do not appear in the original data sets. The another method to predict anti cancer drug activity is similarity of signature regularized multi-task learning. To constitute this model, firstly, drug signature is generated by examining drug-cell line experiments found in LINCS data set. Then, by using these activity signatures of drugs, similarities between drugs are calculated and a powerful model which overperforms the models which ignore drug similarities is designed. Also this model is evaluated with genomics drug sensitivity in cancer and cancer therapeutics response portal data sets and results of the both data sets show that constituted model have significantly more predictive power than contrasted model. Kişiselleştirilmiş kanser tedavisi, kanserin karmaşıklığı da göz önünde bulundurulduğunda, gelişmekte olan bir yaklaşımdır. Kişiselleştirilmiş tedavinin bir parçası olarak, bir ilacın bir hücre hattındaki etkinliği labarotuvar ortamında ölçülür. Ancak, bu deneylerin yapılması çok zordur ve önemli bir maddi kaynak gerektirir. Bu zorlukların üstesinden gelmek için hesaplayıcı yöntemler, sağlanan veri kümeleri ile birlikte bilgisayar ortamında kullanılır. Bu çalışmada aktivite tahmini problemi bir regresyon problemi olarak ele alınmıştır ve öncelikle her bir ilaç-hücre hattı çiftinin tahmin hatasının azaltılması için üç farklı regresyon modeli birleştirilerek bir topluluk modeli tasarlanmıştır. Temel modeller; gradyan destekli regresyon, çekirdekli bayes çoklu-iş öğrenme ve iz-norm regülarizasyonlu çoklu-iş öğrenme olarak tanımlanmıştır. Oluşturulan modeli değerlendirmek için iki büyük veri kümesi, genomics of drug sensitivity in cancer ve cancer therapeutics response portal, kullanılmıştır. Bu değerlendirmenin sonuçları, topluluk yönteminin tahminlerinin temel modellerin her birinin tek başlarına yaptıkları tahminlerden önemli ölçüde daha iyi olduğunu göstermektedir. Bunun sonucunda orijinal veri kümelerinde görülmeyen ilaç-hücre hattı çiftleri için oluşturulan modelin sitotoksisite tahminleri rapor edilmiştir. Araştırmacılar tarafından yapılan canlı içi (in vivo) laboratuvar çalışmaları da, rapor sonuçlarını desteklemektedir. İlaç aktivitelerini tahmin etmesi için oluşturulan bir diğer model de imza benzerlik tabanlı regülarizasyonlu çoklu-iş öğrenme modelidir. Bu modelin oluşturulması için öncelikle LINCS veri kümesinde bulunan ilaç-hücre hattı deneyleri incelenerek ilaçlar için aktivite imzaları oluşturulmuştur. Oluşturulan bu ilaç imzaları ile ilaçların arasındaki benzerlikler hesaplanarak, ilaçların benzerliklerini gözardı eden modellerden daha güçlü bir tahmin edici model üretilmiştir. Bu model yine genomics of drug sensitivity in cancer ve cancer therapeutics response portal veri kümeleri kullanılarak değerlendirilmiştir ve her iki veri kümesinde de karşılaştırılan modellere göre belirgin bir üstünlük sağlandığı gözlenmiştir.
URI:	https://hdl.handle.net/20.500.11851/2307 https://tez.yok.gov.tr/UlusalTezMerkezi/tezSorguSonucYeni.jsp
Appears in Collections:	Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses