Please use this identifier to cite or link to this item:
https://hdl.handle.net/11147/6855
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Baştanlar, Yalın | en_US |
dc.contributor.author | Orhan, Semih | - |
dc.date.accessioned | 2018-04-06T06:56:55Z | - |
dc.date.available | 2018-04-06T06:56:55Z | - |
dc.date.issued | 2017-12 | - |
dc.identifier.citation | Orhan, S. (2017). Localization of certain animal species in images via training neural networks with image patches. Unpublished master's thesis, İzmir Institute of Technology, İzmir, Turkey | en_US |
dc.identifier.uri | http://hdl.handle.net/11147/6855 | - |
dc.description | Thesis (Master)--Izmir Institute of Technology, Computer Engineering, Izmir, 2017 | en_US |
dc.description | Includes bibliographical references (leaves: 38-42) | en_US |
dc.description | Text in English; Abstract: Turkish and English | en_US |
dc.description.abstract | Object detection is one of the most important tasks for computer vision systems. Varying object size, varying view angle, illumination conditions, occlusion etc. effect the success rate. In recent years, convolutional neural networks (CNNs) have shown great performance in different problems of computer vision including object detection and localization. In this work, we propose a novel training approach for CNNs to localize some animal species whose bodies have distinctive pattern, such as speckles of leopards, black-white lines of zebras, etc. To learn characteristic patterns, small patches are taken from different body parts of animals and they are used to train models. To find object location, in a test image, all locations are visited in a sliding window fashion. Crops are fed to CNN, then classification scores of all patches are recorded. To illustrate object location, heat map is generated by the classification scores of the patches. Afterwards, heat maps are converted to binary images and end up with bounding box estimates of objects. The localization performance of our Patch-based training is compared with Faster R-CNN – a state-of-the-art CNN-based object detection and localization algorithm. While evaluating the performances, in addition to the standard precision-recall metric, we use area-precision and area-recall which represent the potential of Patch-based Model better. Experiment results show that the proposed training method has better performance than Faster R-CNN for most of the evaluated classes. We also showed that Patch-based Model can be used with Faster R-CNN to increase its localization performance. | en_US |
dc.description.abstract | Nesne bulma bilgisayarla görü sistemlerinin en önemli görevlerinden biridir. Değişen nesne boyutu, değişen bakış açısı, ortam aydınlatması, örtüşen nesneler ve benzeri etkenler başarım üzerinde etkilidir. Son yıllarda, Evrişimli Yapay Sinir Ağları (EYSA) birçok bilgisayarla görü problemlerinde (nesne konumlandırma ve nesne tespiti) çok iyi bir performans göstermiştir. Bu çalışmada, bedeni üzerinde ayırt edici bir desene sahip hayvanların, örneğin: benekli leoparlar, siyah beyaz çizgili zebralar gibi, konumunu bulmak için EYSA kullanan yeni bir yaklaşım öneriyoruz. Desen özelliklerini öğrenmek için, vücudun çeşitli bölgelerinden küçük parçalar alınır ve modelleri eğitmek için kullanılır. Test imgelerinde nesne konumunu bulmak için bütün konumlara kayan pencere yaklaşımı ile uğranır. Parçalar EYSA’na verilir ve tüm parçaların sınıflandırma skorları kaydedilir. Nesne konumlarını görselleştirmek için tüm parçaların sınıflandırma skorları kullanılarak sıcaklık haritası üretilir. Daha sonra sıcaklık haritaları ikili imgelere çevrilir ve nesneyi kapsayan kutu tahmini yapılarak süreç sonuçlanır. Önerdiğimiz Parçatabanlı eğitim yönteminin nesne konumlandırma performansını EYSA kullanan güncel algoritmalardan biri olan Faster R-CNN ile karşılaştırdık. Performans değerlendirmesi yaparken standart kesinlik-anma metriğine ek olarak, Parça-tabanlı yöntemi daha iyi ifade ettiği için alan-kesinlik ve alan-anma metriğini de kullandık. Deney sonuçlarına göre önerilen eğitim yöntemi Faster R-CNN’e göre neredeyse değerlendirilen tüm sınıflar için daha iyi bir performans göstermektedir. Aynı zamanda, Parça-tabanlı yöntem Faster R-CNN ile kullanılarak Faster R-CNN’in konumlandırma başarısının artırılabileceği deştir. | en_US |
dc.description.sponsorship | TUBITAK ARDEB (115E918) | en_US |
dc.language.iso | en | en_US |
dc.publisher | Izmir Institute of Technology | en_US |
dc.relation | info:eu-repo/grantAgreement/TUBITAK/EEEAG/115E918 | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.subject | Convolutional neural networks | en_US |
dc.subject | Object detection | en_US |
dc.subject | Patch-based Model | en_US |
dc.title | Localization of certain animal species in images via training neural networks with image patches | en_US |
dc.title.alternative | İmge parçaları kullanılarak eğitilen yapay sinir ağları ile imgelerde belirli hayvan türlerinin konumlandırılması | en_US |
dc.type | Master Thesis | en_US |
dc.institutionauthor | Orhan, Semih | - |
dc.department | Thesis (Master)--İzmir Institute of Technology, Computer Engineering | en_US |
dc.relation.publicationcategory | Tez | en_US |
item.fulltext | With Fulltext | - |
item.grantfulltext | open | - |
item.languageiso639-1 | en | - |
item.openairecristype | http://purl.org/coar/resource_type/c_18cf | - |
item.cerifentitytype | Publications | - |
item.openairetype | Master Thesis | - |
crisitem.author.dept | 01.01. Units Affiliated to the Rectorate | - |
Appears in Collections: | Master Degree / Yüksek Lisans Tezleri |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
T001695.pdf | MasterThesis | 5.01 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
254
checked on Nov 18, 2024
Download(s)
84
checked on Nov 18, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.