Kumova Metin, Senem

Loading...
Profile Picture
Name Variants
Kumova Meti̇n, Senem
Metin, Senem Kumova
Kumova Metin, S.
Metin, S.K.
Job Title
Email Address
senem.kumova@ieu.edu.tr
Main Affiliation
05.04. Software Engineering
Status
Current Staff
Website
Scopus Author ID
Turkish CoHE Profile ID
Google Scholar ID
WoS Researcher ID

Sustainable Development Goals

Documents

35

Citations

172

h-index

6

Documents

28

Citations

92

Scholarly Output

48

Articles

20

Views / Downloads

27/714

Supervised MSc Theses

7

Supervised PhD Theses

0

WoS Citation Count

92

Scopus Citation Count

172

WoS h-index

5

Scopus h-index

6

Patents

0

Projects

15

WoS Citations per Publication

1.92

Scopus Citations per Publication

3.58

Open Access Source

14

Supervised Theses

7

JournalCount
Current Page: 1 / NaN

Scopus Quartile Distribution

Competency Cloud

GCRIS Competency Cloud

Scholarly Output Search Results

Now showing 1 - 10 of 48
  • Article
    Citation - WoS: 14
    Citation - Scopus: 14
    Feature Selection in Multiword Expression Recognition
    (Pergamon-Elsevier Science Ltd, 2018) Metin, Senem Kumova
    In multiword expression (MWE) recognition, there exist many studies where different learning methods are employed to decide whether given word combination is a multiword expression. The recognition methods commonly utilize a number of features that are extracted from a data source, frequently from the given text. Though the recognition methods and the features are well studied, we believe that to achieve the best possible performance with a learning method, different subsets of features should also be considered and the best performing subset must be selected. In this paper, we propose a procedure that covers the performance comparison of well-known feature selection methods to obtain the best feature subset in MWE recognition. The evaluation tests are performed on a Turkish MWE data set and the performance is measured by precision, recall and Fl values. The highest Fl value =0.731 is obtained by C4.5 classifier employing either wrapper or filtering method in feature selection. In the regarding setting(s), it is examined that the performance is increased by 1.11% compared to the setting where all features are employed in classification. Based on the experimental results, it may be stated that feature selection improves the performance of MWE recognition by eliminating the noisy/non-effective features. Moreover, it is obvious that proposed feature selection method contributes to the overall MWE recognition system by reducing the measurement and storage requirements due to the lower number of features in classification, providing a faster and more -cost effective learning model. (C) 2017 Elsevier Ltd. All rights reserved.
  • Conference Object
    Collaborative Emotion Annotation: Assessing the Intersection of Human and Ai Performance With Gpt Models
    (Science and Technology Publications, Lda, 2023) Uymaz, H.A.; Metin, S.K.
    In this study, we explore emotion detection in text, a complex yet vital aspect of human communication. Our focus is on the formation of an annotated dataset, a task that often presents difficulties due to factors such as reliability, time, and consistency. We propose an alternative approach by employing artificial intelligence (AI) models as potential annotators, or as augmentations to human annotators. Specifically, we utilize ChatGPT, an AI language model developed by OpenAI. We use its latest versions, GPT3.5 and GPT4, to label a Turkish dataset having 8290 terms according to Plutchik's emotion categories, alongside three human annotators. We conduct experiments to assess the AI's annotation capabilities both independently and in conjunction with human annotators. We measure inter-rater agreement using Cohen's Kappa, Fleiss Kappa, and percent agreement metrics across varying emotion categorizations- eight, four, and binary. Particularly, when we filtered out the terms where the AI models were indecisive, it was found that including AI models in the annotation process was successful in increasing inter-annotator agreement. Our findings suggest that, the integration of AI models in the emotion annotation process holds the potential to enhance efficiency, reduce the time of lexicon development and thereby advance the field of emotion/sentiment analysis. Copyright © 2023 by SCITEPRESS - Science and Technology Publications, Lda. Under CC license (CC BY-NC-ND 4.0)
  • Article
    Citation - Scopus: 1
    Exploring the Effectiveness of LLM-Generated Context on Emotion Lexicon Word Vectorization: A Comparative Study on Turkish and English
    (IEEE Computer Soc, 2025) Kumova Metin, Senem; Aka Uymaz, Hande
    This study explores the impact of large language models (LLMs) on emotion lexicon word vectorization on Turkish and English. Emotion analysis involves extracting affective information from various data sources, with text being a primary medium. While traditional vectorization methods lack semantic meaning, contextual vectors, such as bidirectional encoder representations from transformers (BERT), aim to capture the context of words, leading to improved performance in natural language processing tasks. We investigate the efficacy of context sentences from human-annotated datasets and sentences generated by Gemini-Pro LLM in creating word vectors. Additionally, we introduce a manually annotated Turkish emotion and sentiment lexicon (TES-Lex). Performance evaluation is conducted for both Turkish and English using BERT vectors with two approaches: cosine similarity and machine learning. Our findings indicate that LLM-generated context sentences significantly enhance the quality of word vectors, especially in Turkish, underscoring the potential of LLMs in augmenting emotion lexicon resources in low-resourced languages.
  • Master Thesis
    Multiword Expression Detection Using Word Vector Representations
    (İzmir Ekonomi Üniversitesi, 2019) Taşçıoğlu, Tansu; Metin, Senem Kumova
    Çok sözcüklü ifadeler iki ve ya daha fazla sözcüğün geleneksel olarak dilde bir araya geldiği ifadelerdir. Çok sözcüklü ifadelerin çoğunda, kelimeler yeni bir anlam oluşturmak için bir araya gelirken kendi anlamlarını kaybederler. Son yapılan doğal dil işleme çalışmalarında, kelimelerin/kelime kombinasyonlarının anlamı sözcük temsilleri ile ifade edilir. Bu yaklaşımda,komşu sözcüklerin verilen hedef kelime ile ilgili bilgiyi taşıdığı kabul edilir. Bu tez çalışmasının amacı, Türkçe'de çok sözcüklü ifadelerin tespitinde sözcük temsillerinin kullanımını araştırmaktır. Kelimeler çok sözcüklü ifadeler oluşturmak için bir araya geldiğinde vektör temsillerinde anlam değişikliği ya da kaybı olduğu kabul edilir. Bu tezde, çok sözcüklü ifade adaylarının ve adayları oluşturan sözcüklerin sözcük temsil vektörleri (gövde ve yüzeysel form) beş farklı temsil yöntemi ile oluşturulmuştur. Çok sözcüklü ifade adaylarının vektör temsili on farklı sını?andırıcıya girdi olarak verilmiştir. Sını?andırma performansı 5-katlı çapraz doğrulama yöntemiyle F1-skoru kullanılarak ölçülmüştür. Deneylerde gövdelemenin çok sözcüklü ifade çıkarımında performansı geliştirmediği görülmüştür. Bununla beraber, çok sözcüklü ifade tespiti deneylerinde diğer yöntemlerden sürekli olarak üstün olan bir sını?andırma yöntemi olmadığı gözlenmiştir.
  • Master Thesis
    Pronoun Resolution With Deep Learning
    (İzmir Ekonomi Üniversitesi, 2017) Taze, Mehmet; Metin, Senem Kumova
    Dilde, bir sözcüğün sürekli tekrar eden kullanımını önlemek için, ilgili sözcüğe atıfta bulunan bir zamir veya isim öbeği kullanılır. Bu gibi durumlarda, atıfta bulunulan sözcük öncül, atıf eden zamir veya isim öbeği ise anafor olarak adlandırılır. Önceki ve/veya sonraki atıfların çözümlenmesi bir diğer deyişle öncül ve anafor arası ilişkinin ortaya çıkartılması işlemi anafor çözümlemesidir. Anafor çözümlemesi, makine çevirisi, metin özetleme, bilgi çıkarımı ve soru cevaplama sistemleri gibi birtakım farklı doğal dil işleme uygulamalarında kullanılır. Bu tez çalışmasında, anafor çözümlemesi problemi zamir çözümlemesine indirgenerek Türkçe zamirlerin çözümlenmesinde derin öğrenme ağlarının başarımı incelenmiştir. Tez kapsamında, derin çok katmanlı algılayıcı ve derin konvolüsyonel sinir ağlarına 12 öznitelik girdi olarak verilerek pek çok farklı konfigürasyonda bu ağlar gerçeklenmiştir. Türkçe çocuk hikayelerinden derlenen 593 adet doğru örnek çifti (öncül – zamir) içeren bir veri seti oluşturulmuştur. Türkçe zamir çözümlemesinde en yüksek başarımın, her katmanda çok sayıda nöron içeren ve orta sayıda (10) katmana sahip çok katmanlı algılayıcı ağ ile elde edildiği görülmüştür.
  • Conference Object
    Citation - Scopus: 1
    Combining Machine Translation and Text Similarity Metrics To Identify Paraphrases in Turkish
    (Institute of Electrical and Electronics Engineers Inc., 2018) Soleymanzadeh K.; Karaoğlan B.; Metin S.K.; Kişla T.
    Paraphrase identification (PI) is to recognize whether given two sentences are restatements of each other or not. In our study we propose an approach that exploits machine translation and text similarity metrics as features for PI. Machine learning algorithms like Support Vector Machine (SVM) with three different kernels, C4.5 Decision tree and Multinomial Naïve Bayes (NB) are trained with these features. We evaluated our system on Parder, Turkish paraphrase corpus. The experimental results show that the proposed approach offers state-of-the-art results. © 2018 IEEE.
  • Master Thesis
    Application of Vector Space Models To Detect Semantically Non-Compositional Word Combinations in Turkish
    (İzmir Ekonomi Üniversitesi, 2016) Eren, Levent Tolga; Metin, Senem Kumova
    Anlamsal birleşimlilik, kelime kombinasyonları ve bunların parçalarının anlamları arasındaki ilişkiyi tanımlamaktadır. Anlamsal birleşimli olmayan ifadelerde kelimeler bir araya gelerek farklı anlamlar meydana getirmektedir. Anlamsal birleşimli olmayan ifadelerin tanımlanması makine çevirisi, kelime anlamını belirginleştirme ve dil üretme gibi birçok dil işleme görevlerini destekleyebilmektedir. Bu tez çalışmasının amacı, Türkçe'de anlamsal birleşimli olmayan ifadelerin tespitinde uzay vektör modellerinin performanslarını araştırmaktır. Bu tezde altı farklı Türkçe derlemden elde edilen 2229 adet ikili kelime kombinasyonu içeren bir veri kümesi kullanılmıştır. Yapılan deneylerde beş farklı vektör uzay modeli içeren üç küme kullanılmıştır. Bu modeller duyarlılık, anma, ve F-ölçümü ölçütleriyle değerlendirilmiştir. Deneylerde tüm test derlemleri için kelime kombinasyonu ve kombinasyonu oluşturan ikinci kelimeye ait vektörler arası benzerliği ölçen modelin daha yüksek F değerleri ürettiği görülmüştür.
  • Master Thesis
    Emotion Analysis on Turkish Text
    (İzmir Ekonomi Üniversitesi, 2020) Giraz, Hatice Ertuğrul; Metin, Senem Kumova
    Duygular günlük hayatımızı yönetir; duygular insan deneyiminin büyük bir parçasıdır ve karar verme sürecimizi etkiler. Bizi mutlu eden eylemleri tekrarlamak isteriz, ancak bizi kızdıran veya üzen eylemlerden kaçınırız. Doğal dil işleme sayesinde; öznel bilgiler, öneriler, incelemeler, sosyal medya yayınları gibi yazılı kaynaklardan elde edilebilir. Ayrıca, metnin yazarı tarafından ifade edilen duyguları anlamamızı ve dolayısıyla buna göre hareket etmemizi sağlar. Bu tezde duygu sözlüklerinin ve sözcük vektör gösterimlerinin duygu belirleme görevindeki başarısı araştırılmıştır. Duygu sözlüğü oluşturmak için iki yöntem önerilmiştir. Buna ek olarak, cümlelerin ifadesinde cümleyi oluşturan kelimelerin duygu sözcükleri ile vektörel kıyaslanmasını temel alan üç yaklaşım önerilmiştir. Türkçe metinlerde gözetimsiz ve gözetimli yöntemler ile deneyler yürütülmüş ve deney sonuçları raporlanmıştır.
  • Article
    Certainty Factor Model in Paraphrase Detection
    (Pamukkale Univ, 2021) Metin, Senem Kumova; Karaoglan, Bahar; Kisla, Tarik; Soleymanzadeh, Katira
    In this paper, we address the problem of uncertainty management in identification of paraphrase sentence pairs. Paraphrase sentences are simply sets/pairs of sentences that express the same facts and/or opinions using different words or order of words. We propose the use of certainty factor (CF) model in paraphrase detection. A set of succeeding paraphrase detection features (generic and distance based features) is built by filtering and this set is used as evidences in CF model. The CF model is evaluated by F1 and accuracy measures on Microsoft Research Paraphrase corpus. The results are compared to the well-known Bayesian reasoning. The experimental results showed that CF model is an alternating paraphrase detection method to Bayes model.
  • Conference Object
    Citation - Scopus: 1
    Optimizing High-Dimensional Text Embeddings in Emotion Identification: a Sliding Window Approach
    (Science and Technology Publications, Lda, 2024) Uymaz, H.A.; Metin, S.K.
    Natural language processing (NLP) is an interdisciplinary field that enables machines to understand and generate human language. One of the crucial steps in several NLP tasks, such as emotion and sentiment analysis, text similarity, summarization, and classification, is transforming textual data sources into numerical form, a process called vectorization. This process can be grouped into traditional, semantic, and contextual vectorization methods. Despite their advantages, these high-dimensional vectors pose memory and computational challenges. To address these issues, we employed a sliding window technique to partition high-dimensional vectors, aiming not only to enhance computational efficiency but also to detect emotional information within specific vector dimensions. Our experiments utilized emotion lexicon words and emotionally labeled sentences in both English and Turkish. By systematically analyzing the vectors, we identified consistent patterns with emotional clues. Our findings suggest that focusing on specific sub-vectors rather than entire high-dimensional BERT vectors can capture emotional information effectively, without performance loss. With this approach, we examined an increase in pairwise cosine similarity scores within emotion categories when using only sub-vectors. The results highlight the potential of the use of sub-vector techniques, offering insights into the nuanced integration of emotions in language and the applicability of these methods across different languages. © 2024 by SCITEPRESS – Science and Technology Publications, Lda.