Feature Selection for Language Independent Speech Emotion Recognition

dc.contributor.advisor Oğuz, Kaya
dc.contributor.author Özkan, Cansu
dc.date.accessioned 2023-06-16T12:27:45Z
dc.date.available 2023-06-16T12:27:45Z
dc.date.issued 2022
dc.description.abstract Dil, kendimizi ifade etmemizi sağlayan birincil ve en önemli faktördür. Bu iletişim şeklini bilgisayar alanına da uyarlamak arzu edilen bir durumdur. Hızla gelişen bilişim sektöründe bilgisayarlar, makineler hayatımızın içinde oldukça fazla yer almaya başlamıştır. Örneğin, Cortana ve Siri gibi kişisel asistanlar çokça kullanılmakta, bunların kullanımı gitgide yaygınlaşmakta ve biz de bu kolaylıklara alışmaktayız. Bu kişisel asistanların bizim komutlarımızı anlamasını ve onlara göre tepki vermesini isteriz. Sesten duygu analizi, makinelerin insan duygularını anlamasını sağlayan oldukça popüler ve gelişmekte olan bir çalışma alanıdır. Bu sistem, ses sinyallerini çeşitli işlemlere tabi tutarak sesin içerdiği duyguları sınıflandırır. Literatürde sesten duygu analizi çalışmaları genellikle tek dili eğitip tek dilin içerdiği duyguları sınıflandırma üzerine odaklanmakta. Dünya üzerinde konuşulan çok sayıda dil olduğundan dilden bağımsız bir sistem oluşturmak bir ihtiyaç sayılabilir. Bu çalışma, sesin duygu ile ilgili en çok bilgi içeren özelliklerini bulmaya ve onları kullanarak dilden bağımsız bir sistem oluşturmaya odaklanmaktadır. Aynı zamanda bu sistemi oluşturmaya çalışırken dillerin birbiri ile olan yakınlığı ve benzerliğinin duyguları sınıflandırmadaki başarı oranına etkisini incelemektedir. Duyguların sınıflandırılması için Yapay Sinir Ağı ve AdaBoost teknikleri kullanılmıştır. Ayrıca, farklı dillerde veri setleri olarak Berlin (EMO-DB), Toronto (TESS), Italyan (EMOVO), Urdu (URDU) ve Japon (KEIO-ESD) veri setleri kullanılmıştır. en_US
dc.description.abstract Speech is the primary way of expressing ourselves. It is desired to extend this communication to computers. With the new developments in computer applications, machines are pretty much involved in our daily lives in a way that via personal assistants like Cortana or Siri. We want them to detect our commands and respond accordingly. Speech emotion recognition (SER) is a very popular and ongoing trend that enables machines to detect the human emotions. SER processes and classifies the speech signals and detects the embedded emotions in the speech. In general, the studies of SER focus on individual languages. Since the studies that focus on single and different languages are not very successful yet, and there are problems with the different accents of even English, providing a language independent SER is almost a necessity. This study focuses on finding the most informational features of speech to obtain the best recognition rates in language independent speech emotion recognition by analyzing how much the performance of the system changes according to the relations between the languages. Two classifiers which are Artificial Neural Networks (ANN) and AdaBoost was used to compare their performances. Berlin Database of Emotional Speech (EMO-DB), Toronto Emotional Speech Set (TESS), An Italian Emotional Speech Database (EMOVO), URDU Dataset, and KEIO University Japanese Emotional Speech Database (KEIO-ESD) were used as different language datasets. With the ANN classifier, 90.65 % recognition rate, and with the AdaBoost classifier, 72.60 % was obtained by using all datasets. en_US
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=sELqxhTlFGAjsbjOuuiyCGRpWe6UGuO5ft2SGpfA4bmjhkQObvj0hlVmASFK_GbA
dc.identifier.uri https://hdl.handle.net/20.500.14365/121
dc.language.iso en en_US
dc.publisher İzmir Ekonomi Üniversitesi en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol en_US
dc.subject Computer Engineering and Computer Science and Control en_US
dc.title Feature Selection for Language Independent Speech Emotion Recognition en_US
dc.title.alternative Dilden Bağımsız Sesten Duygu Analizi için Öznitelik Seçimi en_US
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.author.institutional Özkan, Cansu
gdc.coar.access open access
gdc.coar.type text::thesis::master thesis
gdc.description.department İEÜ, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı en_US
gdc.description.endpage 67 en_US
gdc.description.publicationcategory Tez en_US
gdc.description.scopusquality N/A
gdc.description.startpage 1 en_US
gdc.description.wosquality N/A
gdc.identifier.yoktezid 748635 en_US
gdc.virtual.author Oğuz, Kaya
relation.isAuthorOfPublication 352071e4-5cb7-4239-be4d-3132ba33986c
relation.isAuthorOfPublication.latestForDiscovery 352071e4-5cb7-4239-be4d-3132ba33986c
relation.isOrgUnitOfPublication b4714bc5-c5ae-478f-b962-b7204c948b70
relation.isOrgUnitOfPublication 26a7372c-1a5e-42d9-90b6-a3f7d14cad44
relation.isOrgUnitOfPublication e9e77e3e-bc94-40a7-9b24-b807b2cd0319
relation.isOrgUnitOfPublication.latestForDiscovery b4714bc5-c5ae-478f-b962-b7204c948b70

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
232-748635.pdf
Size:
1.69 MB
Format:
Adobe Portable Document Format