Please use this identifier to cite or link to this item:
https://hdl.handle.net/11147/12428
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Özuysal, Mustafa | en_US |
dc.contributor.author | Uzyıldırım, Furkan Eren | en_US |
dc.date.accessioned | 2022-09-19T06:42:36Z | - |
dc.date.available | 2022-09-19T06:42:36Z | - |
dc.date.issued | 2022-06 | en_US |
dc.identifier.uri | https://hdl.handle.net/11147/12428 | - |
dc.identifier.uri | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=_F5QEpayDXGqGZlp9XiFtEF5YNs9MKZC5HkOTTrXqF4fyU92AwWCSAAUIPX0JQiy | - |
dc.description | Thesis (Doctoral)--Izmir Institute of Technology, Computer Engineering, Izmir, 2022 | en_US |
dc.description | Includes bibliographical references (leaves: 84-93) | en_US |
dc.description | Text in English; Abstract: Turkish and English | en_US |
dc.description.abstract | Understanding the geometric structure of any scene is one of the oldest problems in Computer Vision. Most scenes include planar regions that provide information about the geometric structure and their automatic detection and segmentation plays an important role in many computer vision applications. In recent years, convolutional neural network architectures have been introduced for piece-wise planar segmentation. They outperform the traditional approaches that generate plane candidates with 3D segmentation methods from the explicitly reconstructed 3D point cloud. However, most of the convolutional neural network architectures are not designed and trained for outdoor scenes, because they require manual annotation, which is a time-consuming task that results in a lack of training data. In this thesis,we propose and develop a deep learning based framework for piece-wise plane detection and segmentation of outdoor scenes without requiring manually annotated training data. We exploit a network trained on imagery with annotated targets and an automatically reconstructed point cloud from either Structure from Motion-Multi View Stereo pipeline or monocular depth estimation network to estimate the training ground truth on the outdoor images in an iterative energy minimization framework. We show that the resulting ground truth estimate of various sets of images in the outdoor domain is good enough to improve network weights of different architectures trained on ground truth annotated images. Moreover, we demonstrate that this transfer learning scheme can be repeated multiple times iteratively to further improve the accuracy of plane detection and segmentation on monocular images of outdoor scenes. | en_US |
dc.description.abstract | Sahnelerin geometrik yapılarının anlaşılması bilgisayarlı görünün en eski problemlerinden biridir. Çoğu sahne geometrik yapı hakkında bilgi sağlayan düzlemsel bölgeler içerir ve bunların otomatik olarak bölütlenmesi birçok bilgisayarlı görü uygulamasında önemli rol oynar. Son yıllarda, parçalı düzlemsel bölütleme yapan evrişimsel sinir ağı mimarileri önerilmiştir. Bunlar, düzlem adaylarını 3B bölütleme yöntemleriyle 3B nokta bulutu geriçatımından üreten geleneksel yaklaşımlardan üstün olmuştur. Fakat, çoğu evrişimsel sinir ağı mimarisi dış sahneler için tasarlanmamış ve eğitilmemiştir çünkü onların elle etiketlenmesinin zaman alıcı bir iş olması eğitim verisi eksikliğine neden olmaktadır. Bu tez çalışmasında, dış sahnelerin hiçbir şekilde elle etiketlemeye ihtiyaç olmadan parçalı düzlem tespiti ve bölütlenmesi için derin öğrenme tabanlı sistem önerilmiş ve geliştirilmiştir. Dış imgelerin mutlak doğru eğitim verilerinin tahminlenmesi için etiketlenmiş verilerle eğitilmiş bir sinir ağı mimarisinden ve Hareket ile Nesne Oluşturma-İkili Çoklu Görüntü ardışık düzeni veya tekli imgelerden derinlik tahminlemesi yapan sinir ağları mimarisinden kullanılarak elde edilen 3B otomatik nokta bulutu geriçatımından yararlanılmıştır. Dış bölgelere ait çeşitli imge kümeleri için elde edilen eğitim verilerinin mutlak doğru olarak etiketlenmiş imgelerle eğitilen farklı sinir ağı mimarilerinin ağırlıklarını yeterince iyi geliştirdiği gösterilmiştir. Buna ek olarak, bu transfer öğrenme düzeninin çoklu olarak tekrarlanabildiği ve dış sahnelerin tekli imgelerinde düzlem tespitinin ve bölütlenmesinin doğruluğunu geliştirdiği gösterilmiştir. | en_US |
dc.format.extent | ix, 93 leaves | en_US |
dc.language.iso | en | en_US |
dc.publisher | Izmir Institute of Technology | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.subject | Computer vision | en_US |
dc.subject | Deep learning | en_US |
dc.subject | Machine learning | en_US |
dc.subject | Outdoor plane estimation | en_US |
dc.title | Planar geometry estimation with deep learning | en_US |
dc.title.alternative | Derin öğrenme ile düzlemsel geometrinin tahminlenmesi | en_US |
dc.type | Doctoral Thesis | en_US |
dc.authorid | 0000-0002-4219-3416 | en_US |
dc.department | Thesis (Doctoral)--İzmir Institute of Technology, Computer Engineering | en_US |
dc.relation.publicationcategory | Tez | en_US |
dc.identifier.yoktezid | 631070 | en_US |
item.fulltext | With Fulltext | - |
item.grantfulltext | open | - |
item.languageiso639-1 | en | - |
item.openairecristype | http://purl.org/coar/resource_type/c_18cf | - |
item.cerifentitytype | Publications | - |
item.openairetype | Doctoral Thesis | - |
crisitem.author.dept | 01.01. Units Affiliated to the Rectorate | - |
Appears in Collections: | Phd Degree / Doktora |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
10148174.pdf | Doctoral Thesis | 38.15 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
702
checked on Nov 18, 2024
Download(s)
484
checked on Nov 18, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.