Show simple item record

dc.contributor.advisorKaraçalı, Bilgeen_US
dc.contributor.authorKöktürk Güzel, Başak Esin
dc.dateinfo:eu-repo/date/embargoEnd/2019-08-10
dc.date.accessioned2017-12-22T12:20:10Z
dc.date.available2017-12-22T12:20:10Z
dc.date.issued2017-07
dc.identifier.citationKöktürk Güzel, B. E. (2017). Development of a unified analysis framework for multicolor flow cytometry data based on quasi-supervised learning. Unpublished doctoral dissertation, İzmir Institute of Technology, İzmir, Turkeyen_US
dc.identifier.urihttp://hdl.handle.net/11147/6622
dc.descriptionThesis (Doctoral)--Izmir Institute of Technology, Electronics and Communication Engineering, Izmir, 2017en_US
dc.descriptionFull text release delayed at author's request until 2019.08.10en_US
dc.descriptionIncludes bibliographical references (leaves: 89-93)en_US
dc.descriptionText in English; Abstract: Turkish and Englishen_US
dc.description.abstractIn this dissertation, automatic compensation and gating strategies are investigated for multi-color flow cytometry data analysis. We propose two clustering algorithms that combine the quasi-supervised learning algorithm with an expectation-maximization routine for automatic gating. The quasi-supervised learning algorithm estimates the posterior probabilities of the different cell populations at each sample in a dataset in a manner that does not involve fitting a parametric model to the data. We have developed two different binary divisive clustering algorithms based on expectation maximization with responsibility values calculated using the quasi-supervised learning algorithm instead of the probabilistic models used in conventional expectation maximization applications. Our clustering algorithms determine the number of clusters in run-time by measuring the overlap between the estimated clusters in each provisional division and comparing it with the previous one to determine whether the division is warranted or not. Since this type of clustering is indifferent to the underlying distribution of dataset, it is well suited to automatic flow cytometry gating. The second clustering algorithm improves upon the first one using a simulated annealing approach. Its iterative structure allows finding the global minimum of a cost functional that achieves the best separation point by gradually smoothing the decision regions in each iteration. Finally, we have developed a joint diagonalization and clustering method for automatic compensation of flow data based on the methods above. The proposed method identifies cell sub groups using the annealing-based model-free expectation-maximization algorithm and finds a data transformation matrix that achieves orthogonality of the covariance structure of each identified cell cluster using fast Frobenius diagonalization. We have tested all proposed algortihms on both synthetically created datasets and real multi-color flow cytometry datasets. The results show that our automated gating algorithms are very successful in identifying the distinct cell groups so long as there is enough statistical evidence for their presence. In addition, the automated compensation procedure was also successfully applied on the synthetically created dataset and real multi-color flow cytometry data of lymphocytes that are a low autofluorescence cell group. However, the automated compensation algorithm needs further study to be generalized to high autofluorescence cell types where proper compensation does not necessarily coincide with an orthogonal covariance structure.en_US
dc.description.abstractBu tezde, çok renkli akış sitometri veri analizi için otomatik kompensasyon ve kapılama stratejileri incelenmiştir. Otomatik kapılama için yarı-güdümlü öğrenme algoritmasını ve beklenti en iyileme rutinini birleştirerek iki gruplama algoritması önerilmiştir. Yarı-güdümlü öğrenme algoritması veriye parametrik bir model uydurmadan, her bir örnekteki farklı hücre popülasyonlarının sonsal olasılıklarını tahmin eder. Sorumluluk değerleri konvansiyonel beklenti en iyileme uygulamalarında kullanılan olasılık modelleri yerine, yarı-güdümlü öğrenme algoritması ile hesaplanarak beklenti en iyilemeye dayalı iki tane ikili kümeleme algoritması geliştirilmiştir. Kümeleme algoritmalarımız, her bir geçici bölünmede tahmini kümeler arasındaki örtüşmeyi ölçerek ve bu örtüşmeyi bir önceki ile karşılaştırarak, bölünmenin doğru olup olmadığı belirler ve böylelikle işleyiş sürecinde küme sayısını belirler. Bu tür kümeleme, veri kümesinin altında yatan dağılıma kayıtsız olduğundan, otomatik akış sitometri kapılaması için uygundur. İkinci kümeleme algoritması benzetimli tavlama yaklaşımını kullanarak ilk kümeleme algoritmasını geliştirmiştir. Benzetimli tavlama yaklaşımının tekrarlayıcı yapısı bir maaliyet fonksiyonun global minimumunu bulmayı sağlar ve biz bu yaklaşımı karar bölgelerini her tekrarda kademeli olarak yumuşatarak en iyi ayrışma noktasını bulmak için kullandık. Son olarak, yukarıdaki kapılama yöntemlerine dayalı olarak akış verisinin otomatik olarak kompensasyonu için bir ortak köşegenleştirme ve kümeleme yöntemi geliştirdik. Kompensasyon, farklı florokrom kanalları arasındaki spektral yayılımı gidermek için kullanılan bir prosedürdür. Önerilen yöntem, hücre alt gruplarını tavlama temelli modelden bağımsız beklenti en iyileme algoritması kullanarak tanımlamakta ve tanımlanan her bir hücre kümesinin kovaryans yapısının dikkenliğini, hızlı Frobenius kös¸egenleştirme yöntemini kullanarak elde eden bir veri dönüşüm matrisi bularak sağlamaktadır. Önerilen algoritmaları sentetik olarak oluşturulan veri kümeleri ve gerçek çok renkli akış sitometrisi veri kümeleri üzerinde test edilmiştir. Sonuçlar, otomatik kapılama algoritmalarımızın yeterli istatistiksel kanıtı olduğu sürece farklı hücre gruplarını tanımada çok başarılı olduğunu göstermektedir. Buna ek olarak, otomatik kompensasyon prosedürü, başarılı bir şekilde sentetik olarak oluşturulmuş veri setine ve gerçek düşük otofloresanslı lenfosit hücre gruplarına başarıyla uygulanmıştır, ancak, dikgen kovaryans matrisinin geçerli olmadığı yüksek otofloresanslı hücre türlerine genellenebilmesi için daha fazla bir çalışmaya ihtiyaç duyulmaktadıren_US
dc.format.extentxi, 93 leavesen_US
dc.language.isoengen_US
dc.publisherIzmir Institute of Technologyen_US
dc.rightsinfo:eu-repo/semantics/embargoedAccessen_US
dc.subjectFlow cytometeren_US
dc.subjectBiomedical signalsen_US
dc.subjectBiomedical data analysisen_US
dc.subjectHierarchical clusteringen_US
dc.subjectQuasi-supervised learningen_US
dc.titleDevelopment of a unified analysis framework for multicolor flow cytometry data based on quasi-supervised learningen_US
dc.title.alternativeÇok renkli akış sitometrisi verileri için yarıgüdümlü öğrenme temelli tümleşik bir analiz platformu geliştirilmesien_US
dc.typedoctoralThesisen_US
dc.contributor.departmentIzmir Institute of Technology. Electronics and Communication Engineeringen_US
dc.request.emailposta@basakesin.net
dc.request.fullnameBaşak Esin Köktürk Güzel
dc.relation.publicationcategoryTezen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record