Please use this identifier to cite or link to this item: https://hdl.handle.net/11147/13910
Title: Deep learning based real-time sequential facial expression analysisusing geometric features
Other Titles: Derin öğrenme tabanlı geometrik özellikleri kullanarak gerçek zamanlı sıralı yüz ifadesi analizi
Authors: Gümüş, Abdurrahman
Köksal, Talha Enes
Keywords: Deep learning
Data sets
Landmarks
Issue Date: Jul-2023
Publisher: 01. Izmir Institute of Technology
Abstract: In this thesis, macro and micro facial expression sequences from various datasets are trained using neural networks to classify them in one of the basic emotions. In macro expression experiments, for each frame of the sequences facial landmarks are extracted using MediaPipe FaceMesh solution and geometric features using both spatial and temporal information based on these landmarks are created. To classify the features, ConvLSTM2D followed by multilayer perceptron blocks are used. In order to achieve real time classification performance, all algorithms are implemented compatible to run on GPU. The proposed method for macro expressions is tested with CK+, Oulu-CASIA VIS, Oulu-CASIA NIR and MMI datasets. In micro expression experiments, apart from geometric features also blendshape features provided by MediaPipe are used. In order to improve classification performance, Phase-Based Video Motion Processing technique is used to magnify subtle facial movements of micro expressions. Experiments are conducted separately on same classification layers that consist of ConvLSTM1D followed by multilayer perceptron blocks. The proposed method for micro expressions is tested with SAMM and CASME II datasets. The datasets utilized in this study were accessed upon signing corresponding license agreements. Each dataset is specifically designated for academic purposes and is made available under these agreements. Only data from subjects who provided consent for their information to be used in publications was included in the thesis. The license agreements for each dataset can be found in the appendices section.
Bu tezde, çeşitli veri setlerinden makro ve mikro yüz ifadesi dizileri, temel duygulardan birinde sınıflandırmak için sinir ağları kullanılarak eğitilmiştir. Makro ifade deneylerinde, dizilerin her bir karesi için MediaPipe FaceMesh çözümü kullanılarak yüz işaretleri çıkarılır ve bu noktalara dayalı olarak hem uzamsal hem de zamansal bilgiler kullanılarak geometrik özellikler oluşturulur. Öznitelikleri sınıflandırmak için ConvLSTM2D ve ardından çok katmanlı algılayıcı blokları kullanılır. Gerçek zamanlı sınıflandırma performansı elde etmek için, tüm algoritmalar GPU üzerinde çalışacak şekilde uyarlanmıştır. Makro ifadeler için önerilen yöntem CK+, Oulu-CASIA VIS, Oulu-CASIA NIR ve MMI veri setleri ile test edilmiştir. Mikro ifade deneylerinde geometrik özelliklerin yanı sıra MediaPipe tarafından sağlanan blendshape özellikleri de kullanılmaktadır. Sınıflandırma performansını iyileştirmek için, mikro ifadelerin ince yüz hareketlerini büyütmek için Faz Tabanlı Video Hareket İşleme tekniği kullanılır. Deneyler, ConvLSTM1D'yi takip eden çok katmanlı algılayıcı bloklardan oluşan aynı sınıflandırma katmanları üzerinde ayrı ayrı yürütülür. Mikro ifadeler için önerilen yöntem, SAMM ve CASME II veri setleri ile test edilmiştir. Bu çalışmada kullanılan veri setlerine, ilgili lisans sözleşmelerinin imzalanmasından sonra erişilmiştir. Her veri setinin akademik amaçlar için kullanmaya uygunluğu sözleşmelerde belirtilmiş ve bu anlaşmalar kapsamında kullanmıştır. Tezde sadece bilgilerinin yayınlarda kullanılmasına izin veren kişilerden elde edilen verilere yer verilmiştir. Her veri seti için lisans sözleşmeleri ekler bölümünde bulunmaktadır.
Description: Thesis (Master)--İzmir Institute of Technology, Electronics and Communication Engineering, Izmir, 2023
Includes bibliographical references (leaves. 47-51)
Text in English; Abstract: Turkish and English
URI: https://hdl.handle.net/11147/13910
Appears in Collections:Master Degree / Yüksek Lisans Tezleri

Files in This Item:
File Description SizeFormat 
10566043.pdfMaster Thesis30.46 MBAdobe PDFView/Open
Show full item record



CORE Recommender

Page view(s)

14
checked on Feb 23, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.