Show simple item record

dc.contributor.advisorAllmaer, Jensen_US
dc.contributor.authorSuluyayla, Rabia
dc.dateinfo:eu-repo/date/embargoEnd/2019-08-31
dc.date.accessioned2017-02-16T13:52:10Z
dc.date.available2017-02-16T13:52:10Z
dc.date.issued2016-08
dc.identifier.citationSuluyayla, R. (2016). Cost and benefit analysis of features used in machine learning based pre-miRNA detection. Unpublished master's thesis, İzmir Institute of Technology, İzmir, Turkeyen_US
dc.identifier.urihttp://hdl.handle.net/11147/4850
dc.descriptionThesis (Master)--Izmir Institute of Technology, Molecular Biology and Genetics, Izmir, 2016en_US
dc.descriptionFull text release delayed at author's request until 2019.08.31en_US
dc.descriptionIncludes bibliographical references (leaves: 41-46)en_US
dc.descriptionText in English; Abstract: Turkish an Englishen_US
dc.descriptionxi, 78 leavesen_US
dc.description.abstractMicroRNAs (miRNAs) are short RNA molecules which play important roles in the post-trancriptional regulation of gene expression. Their transcription is followed by two RNA III endonuclease processing steps leading to mature miRNA formation. They are then incorporated into the RISC-complex which mediates mRNA targeting. Experimental miRNA prediction is difficult since detection relies on many factors therefore, computational methods have become indispensable. Therefore, machine learning methods rely on features describing precursor-miRNAs (pre-miRNAs) to be able to differentiate them from other hairpins in a genome. It is important to define feature groups which are informative, not highly correlated, and don’t incur a large computational cost in order to facilitate accurate miRNA detection. In this study for more than 800 pre-miRNA features the computational cost and benefit was analyzed. From these analyses five features (assl, lsr(%bp), lscm, asal and hpmfe rf I3), (four structural and one structuralthermodynamic one), which aren’t correlated, informative and are not computationally expensive are noticeable. Analyses are done with human hairpins, pseudo data; and a case study using the measles virus and the measles KEGG pathway genes. Overall calculation of human hairpins and measles virus took approximately 2 USD (United States Dollar) on Amazon web services. Supervised learning and random forest machine learning for miRNA prediction was applied and to two genes (TAB2 and BCC3) within the measles KEGG pathway and three hairpins were predicted. They were found to have human mature miRNA sequences embedded in them and their already annotated targets helped enlarge the KEGG measles pathway.en_US
dc.description.abstractGen ifadesinin post-transkripsiyonel regülasyonunda önemli bir rolü olan kısa RNA moleküller mikroRNAlardır (miRNA). Transkripsionlarını iki RNA III endonükleaz işlemi takip eder ve olgun miRNA oluşumuyla RISC-kompleksi mRNA hedeflemesini başlatır. Deneysel miRNA tahmini zordur çünkü miRNA ifadesni belirleme işlemi birçok faktöre dayanır bu yüzden bilişimsel metotlar daha umut vericidir. Genomdaki diğer saç tokası yapılarından (hairpin) ayırt edebilmek ve miRNA tespiti için, miRNAların karakteristik özellikleri tanımlanmalıdır. Bu sebeple, Veri Madenciliği metodları öncül miRNA (pre-miRNA) özelliklerini temel alır. Bu çalışmada 800den fazla pre-miRNA özelliğinin maliyet ve yarar analizi yapılmıştır. Bilgi kazanımı skoru özelliğin ne kadar ayırt edici olduğunu, Linear Korelasyon katsayısı özelliklerin birbirleriyle nasıl bağlı olduğunu ve zaman ölçümü de bir özelliğin ne kadar bilşimsel maliyetinin olduğunu gösterir. Sonuçardan yavaş olmayan ve bilgi verici beş özellik (assl, lsr(%bp), lscm, asal and hpmfe rfI3) (dört yapısal ve bir yapısal-enerjik) seçildi ve birbiriyle korelasyonları olmadığı görüldü. Analizler insan hairpin, sözde (pseudo) veri ve kızamık (measles) virüsü, Measles insan KEGG Patikası genleri ile yapılmıştır. İnsan hairpin ve measles virüsünün genel hesaplanması Amazon serverında yaklaşık olarak 2 USD (Amerikan Doları) tutmuştur. Gözetimli öğrenme ve Rastgele Orman karar ağacı Veri Madenciliği kullanılarak iki measles KEGG patikası geninden (TAB2 and BCC3) üç miRNA tahmin edilmiştir. Bunlarda olgun miRNA dizlileri gömülü bulunmuştur.en_US
dc.description.sponsorshipTUBITAK (Grant number: 113E326)en_US
dc.language.isoengen_US
dc.publisherIzmir Institute of Technologyen_US
dc.rightsinfo:eu-repo/semantics/embargoedAccessen_US
dc.subjectMicroRNAsen_US
dc.subjectRNA moleculesen_US
dc.subjectmiRNA detectionen_US
dc.subjectMachine learningen_US
dc.subjectCost analysisen_US
dc.subjectBenefit analysisen_US
dc.titleCost and benefit analysis of features used in machine learning based pre-miRNA detectionen_US
dc.title.alternativeMakine öğrenimine dayalı öncül miRNA tespitinde kullanılan özelliklerin fayda ve maliyet analizien_US
dc.typemasterThesisen_US
dc.contributor.departmentIzmir Institute of Technology. Molecular Biology and Geneticsen_US
dc.request.emailrabiasuluyayla@gmail.com
dc.request.fullnameRabia Suluyayla
dc.relation.publicationcategoryTezen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record