Please use this identifier to cite or link to this item:
https://hdl.handle.net/11147/6622
Title: | Development of a unified analysis framework for multicolor flow cytometry data based on quasi-supervised learning | Other Titles: | Çok renkli akış sitometrisi verileri için yarıgüdümlü öğrenme temelli tümleşik bir analiz platformu geliştirilmesi | Authors: | Köktürk Güzel, Başak Esin | Advisors: | Karaçalı, Bilge | Keywords: | Flow cytometer Biomedical signals Biomedical data analysis Hierarchical clustering Quasi-supervised learning |
Publisher: | Izmir Institute of Technology | Source: | Köktürk Güzel, B. E. (2017). Development of a unified analysis framework for multicolor flow cytometry data based on quasi-supervised learning. Unpublished doctoral dissertation, İzmir Institute of Technology, İzmir, Turkey | Abstract: | In this dissertation, automatic compensation and gating strategies are investigated for
multi-color flow cytometry data analysis. We propose two clustering algorithms that combine
the quasi-supervised learning algorithm with an expectation-maximization routine for automatic
gating. The quasi-supervised learning algorithm estimates the posterior probabilities of
the different cell populations at each sample in a dataset in a manner that does not involve
fitting a parametric model to the data.
We have developed two different binary divisive clustering algorithms based on expectation
maximization with responsibility values calculated using the quasi-supervised learning
algorithm instead of the probabilistic models used in conventional expectation maximization
applications. Our clustering algorithms determine the number of clusters in run-time by measuring
the overlap between the estimated clusters in each provisional division and comparing
it with the previous one to determine whether the division is warranted or not. Since this
type of clustering is indifferent to the underlying distribution of dataset, it is well suited to
automatic flow cytometry gating.
The second clustering algorithm improves upon the first one using a simulated annealing
approach. Its iterative structure allows finding the global minimum of a cost functional
that achieves the best separation point by gradually smoothing the decision regions in each
iteration.
Finally, we have developed a joint diagonalization and clustering method for automatic
compensation of flow data based on the methods above. The proposed method identifies cell
sub groups using the annealing-based model-free expectation-maximization algorithm and
finds a data transformation matrix that achieves orthogonality of the covariance structure of
each identified cell cluster using fast Frobenius diagonalization.
We have tested all proposed algortihms on both synthetically created datasets and real
multi-color flow cytometry datasets. The results show that our automated gating algorithms
are very successful in identifying the distinct cell groups so long as there is enough statistical
evidence for their presence. In addition, the automated compensation procedure was also
successfully applied on the synthetically created dataset and real multi-color flow cytometry
data of lymphocytes that are a low autofluorescence cell group. However, the automated
compensation algorithm needs further study to be generalized to high autofluorescence cell
types where proper compensation does not necessarily coincide with an orthogonal covariance
structure. Bu tezde, çok renkli akış sitometri veri analizi için otomatik kompensasyon ve kapılama stratejileri incelenmiştir. Otomatik kapılama için yarı-güdümlü öğrenme algoritmasını ve beklenti en iyileme rutinini birleştirerek iki gruplama algoritması önerilmiştir. Yarı-güdümlü öğrenme algoritması veriye parametrik bir model uydurmadan, her bir örnekteki farklı hücre popülasyonlarının sonsal olasılıklarını tahmin eder. Sorumluluk değerleri konvansiyonel beklenti en iyileme uygulamalarında kullanılan olasılık modelleri yerine, yarı-güdümlü öğrenme algoritması ile hesaplanarak beklenti en iyilemeye dayalı iki tane ikili kümeleme algoritması geliştirilmiştir. Kümeleme algoritmalarımız, her bir geçici bölünmede tahmini kümeler arasındaki örtüşmeyi ölçerek ve bu örtüşmeyi bir önceki ile karşılaştırarak, bölünmenin doğru olup olmadığı belirler ve böylelikle işleyiş sürecinde küme sayısını belirler. Bu tür kümeleme, veri kümesinin altında yatan dağılıma kayıtsız olduğundan, otomatik akış sitometri kapılaması için uygundur. İkinci kümeleme algoritması benzetimli tavlama yaklaşımını kullanarak ilk kümeleme algoritmasını geliştirmiştir. Benzetimli tavlama yaklaşımının tekrarlayıcı yapısı bir maaliyet fonksiyonun global minimumunu bulmayı sağlar ve biz bu yaklaşımı karar bölgelerini her tekrarda kademeli olarak yumuşatarak en iyi ayrışma noktasını bulmak için kullandık. Son olarak, yukarıdaki kapılama yöntemlerine dayalı olarak akış verisinin otomatik olarak kompensasyonu için bir ortak köşegenleştirme ve kümeleme yöntemi geliştirdik. Kompensasyon, farklı florokrom kanalları arasındaki spektral yayılımı gidermek için kullanılan bir prosedürdür. Önerilen yöntem, hücre alt gruplarını tavlama temelli modelden bağımsız beklenti en iyileme algoritması kullanarak tanımlamakta ve tanımlanan her bir hücre kümesinin kovaryans yapısının dikkenliğini, hızlı Frobenius kös¸egenleştirme yöntemini kullanarak elde eden bir veri dönüşüm matrisi bularak sağlamaktadır. Önerilen algoritmaları sentetik olarak oluşturulan veri kümeleri ve gerçek çok renkli akış sitometrisi veri kümeleri üzerinde test edilmiştir. Sonuçlar, otomatik kapılama algoritmalarımızın yeterli istatistiksel kanıtı olduğu sürece farklı hücre gruplarını tanımada çok başarılı olduğunu göstermektedir. Buna ek olarak, otomatik kompensasyon prosedürü, başarılı bir şekilde sentetik olarak oluşturulmuş veri setine ve gerçek düşük otofloresanslı lenfosit hücre gruplarına başarıyla uygulanmıştır, ancak, dikgen kovaryans matrisinin geçerli olmadığı yüksek otofloresanslı hücre türlerine genellenebilmesi için daha fazla bir çalışmaya ihtiyaç duyulmaktadır |
Description: | Thesis (Doctoral)--Izmir Institute of Technology, Electronics and Communication Engineering, Izmir, 2017 Full text release delayed at author's request until 2019.08.10 Includes bibliographical references (leaves: 89-93) Text in English; Abstract: Turkish and English |
URI: | http://hdl.handle.net/11147/6622 |
Appears in Collections: | Phd Degree / Doktora |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
T001642.pdf | DoctoralThesis | 21.18 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
234
checked on Nov 18, 2024
Download(s)
114
checked on Nov 18, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.