Please use this identifier to cite or link to this item:
https://hdl.handle.net/11147/12824
Title: | Gender bias in occupation Classification from the New York Times obituaries | Other Titles: | New York Times anma yazılarından meslek sınıflandırmasında cinsiyet yanlılığı | Authors: | Atik, Ceren Tekir, Selma |
Keywords: | Gender bias Occupation classification Multi-task learning Obituaries |
Publisher: | Dokuz Eylül Üniversitesi | Abstract: | Technological developments such as artificial intelligence can strengthen social prejudices prevailing in society, regardless of the developer's intention. Therefore, researchers should be aware of the ethical issues that may arise from a developed product/solution. In this study, we investigate the effect of gender bias on occupational classification. For this purpose, a new dataset was created by collecting obituaries from the New York Times website and is provided in two different versions: With and without gender indicators. Category distributions from this dataset show that gender and occupation variables have dependence. Thus, gender affects occupation classification. To test the effect, we perform occupation classification using SVM (Support Vector Machine), HAN (Hierarchical Attention Network), and DistilBERT-based classifiers. Moreover, to get further insights into the relationship of gender and occupation in classification problems, a multi-tasking model in which occupation and gender are learned together is evaluated. Experimental results reveal that there is a gender bias in job classification. Yapay zeka gibi teknolojik yenilikler, geliştiricilerin niyetlerinden bağımsız olarak toplumda mevcut olan ön yargıyı arttırabilirler. Bu sebeple, araştırmacılar geliştirilen bir ürün/çözüm ile birlikte gelebilecek etik sorunların farkında olmalıdırlar. Bu çalışmada, sosyal ön yargılardan biri olan cinsiyet yanlılığının meslek sınıflandırması üzerindeki etkisi araştırılmaktadır. Bunun için New York Times web sitesinden anma yazıları toplanarak yeni bir veri kümesi oluşturulmuş ve bu anma yazıları cinsiyet göstergeleri dahil ve hariç olmak üzere iki farklı versiyonuyla sunulmuştur. Bu veri kümesindeki sınıf dağılışları incelendiğinde cinsiyet ve meslek değişkenleri arasında bir bağımlılık ilişkisi görülmektedir. Dolayısıyla cinsiyet göstergelerinin meslek tahmini üzerinde bir etkisi olması beklenmektedir. Bu etkiyi sınamak üzere, SVM (Karar Destek Makineleri), HAN (Hiyerarşik İlgi Ağı) ve DistilBERT algoritmaları kullanılarak meslek sınıflandırması yapılmıştır. Sadece meslek sınıflandırması yapan bu modellerin yanında meslek ve cinsiyetin eş zamanlı öğrenildiği bir model de değerlendirilmiştir. Deneysel sonuçlar, meslek tahmininde cinsiyet yanlılığının etkili olduğunu ortaya koymaktadır. |
URI: | https://doi.org/10.21205/deufmd.2022247109 https://hdl.handle.net/11147/12824 https://search.trdizin.gov.tr/yayin/detay/1110196 |
ISSN: | 1302-9304 |
Appears in Collections: | Computer Engineering / Bilgisayar Mühendisliği TR Dizin İndeksli Yayınlar / TR Dizin Indexed Publications Collection |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Gender Bias.pdf | Article File | 1.04 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
220
checked on Nov 18, 2024
Download(s)
78
checked on Nov 18, 2024
Google ScholarTM
Check
Altmetric
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.