Please use this identifier to cite or link to this item: https://hdl.handle.net/11147/6617
Title: Spatio-temporal modeling of documents
Other Titles: Dökümanların zaman-uzamsal olarak modellenmesi
Authors: Yaşar, Damla
Advisors: Tekir, Selma
Keywords: Data mining
Text mining
Spatio-temporal modeling
Text documents
Publisher: Izmir Institute of Technology
Source: Yaşar, D. (2017). Spatio-temporal modeling of documents. Unpublished master's thesis, İzmir Institute of Technology, İzmir, Turkey
Abstract: Temporal and geographic information is important aspects of text documents. Thus, it also occurs frequently in many types of text documents in the form of temporal and geographic expressions. Spatio-temporal expressions can be normalized so that their meaning is unambiguous and can be placed on a timeline or pinpointed on a map. A general text document can contain many spatio-temporal expressions that are unrelated to their content. In this thesis, we propose estimating the focus time and focus place of documents that are defined as the time and place that the document’s content refers to. We utilize statistical knowledge from Wikipedia English to calculate association scores that are used to estimate the focus time and place contained in the document. We implement two different association score calculation methodologies and compare their accuracy respectively. The effectiveness of our methods are evaluated on three different time-tagged datasets of documents about historical events in total time frame of 4000 years. Our methods achieve average error of less than 15 years. Our methods are also able to estimate focus place of each document correctly.
Zaman ve coğrafi bilgiler, metin belgelerinin önemli yönleridir. Bu nedenle, birçok metin belgesinde yer ve coğrafi ifadeler sıklıkla görülür. Zaman-uzamsal ifadeler, anlamlarının açıkça anlaşılacağı şekilde normalleştirilebilir ve bir zaman çizelgesine yerleştirilebilir veya bir haritada işaretlenebilir. Genel bir metin belgesi, içerikleriyle ilgisi olmayan birçok uzamsal ve zamansal ifadeler içerebilir. Bu tezde, belgenin içeriğinin ifade ettiği belgenin odak zamanı ve odak yerinin tahmin edilmesini öneriyoruz. Belgede yer alan odak zamanı ve yeri tahmin etmek için kullanılan ilişkilendirme değerlerini hesaplamak için İngilizce Vikisözlük istatistiksel bilgilerini kullanıyoruz. İki farklı ilişki değer tahmin metodolojisi uyguluyor ve doğruluklarını sırasıyla karşılaştırıyoruz. Yöntemlerimizin hesaplama etkililiği, tarihsel olaylar ile ilgili dört farklı zaman etiketli veri kümesi üzerinde toplam 4000 yıllık zaman aralığında değerlendirilmektedir. Yöntemlerimiz ortalama 15 yılın altında hata üretmektedir. Yöntemlerimiz her belgenin yer odağını doğru olarak tahmin edebilmektedir.
Description: Thesis (Master)--Izmir Institute of Technology, Computer Engineering, Izmir, 2017
Full text release delayed at author's request until 2019.08.20
Includes bibliographical references (leaves: 54-56)
Text in English; Abstract: Turkish and English
URI: http://hdl.handle.net/11147/6617
Appears in Collections:Master Degree / Yüksek Lisans Tezleri

Files in This Item:
File Description SizeFormat 
T001647.pdfMasterThesis1.68 MBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Page view(s)

88
checked on Apr 22, 2024

Download(s)

48
checked on Apr 22, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.