Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.14365/4348
Title: Türkiye Türkçesinde Eşdizimlerin İstatistiksel Yöntemlerle Belirlenmesi
Authors: Karaoğlan, Bahar
Metin, Senem Kumova
Abstract: Eşdizim, sözcüklerin bir anlam bütünlüğü oluşturmak üzere şans eseri olmayacak sıklıkla bir araya geldiği sözcük birliğidir. Eşdizimlerin belirlenmesi, Türkçe metinlerin otomatik olarak işlenmesi ve çevirilerinin yapılması, Türkçe dilinin eğitimi gibi çeşitli alanlardaki faydaları sebebiyle Türkçe doğal dil işleme çalışmalarında önemli bir konudur. Bu çalışmada, Türkçe bir derlemde (corpus) eşdizimlerin otomatik olarak belirlenmesi için çeşitli istatistiksel teknikler, gözlenme sıklığı (occurrence frequency), noktasal karşılıklı bilgi katsayısı (pointwise mutual information) ve hipotez testleri uygulanmıştır. Eşdizimlerin belirlenmesinde gövdelemenin etkisinin araştırılması amacıyla sözcüklerin yanısıra bu sözcüklere ait sözcük gövdeleri üzerinde de çalışılmış, yöntemlerin başarımı F-ölçütü (F-measure) ile değerlendirilmiştir. Ki-kare hipotez testi ve noktasal karşılıklı bilgi katsayısı Türkiye Türkçesinde eşdizimlerin belirlenmesi konusunda diğer yöntemlere göre daha başarılı olmuştur. Ayrıca, gövdelenmiş sözcüklerden oluşan veri kümelerinde başarılı ve başarısız olarak kabul edebileceğimiz yöntemler arasındaki farkın daha net ortaya çıktığı görülmüştür
URI: https://search.trdizin.gov.tr/yayin/detay/203239
https://hdl.handle.net/20.500.14365/4348
ISSN: 1301-0549
2822-6348
Appears in Collections:TR Dizin İndeksli Yayınlar Koleksiyonu / TR Dizin Indexed Publications Collection

Files in This Item:
File SizeFormat 
3398.pdf787.32 kBAdobe PDFView/Open
Show full item record



CORE Recommender

Page view(s)

80
checked on Sep 30, 2024

Download(s)

18
checked on Sep 30, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.