Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.14365/5311
Full metadata record
DC FieldValueLanguage
dc.contributor.authorDemirbilek, Burak Han-
dc.contributor.authorDemir, Alper-
dc.date.accessioned2024-05-04T14:17:59Z-
dc.date.available2024-05-04T14:17:59Z-
dc.date.issued2023-
dc.identifier.urihttps://search.trdizin.gov.tr/yayin/detay/1223160-
dc.identifier.urihttps://hdl.handle.net/20.500.14365/5311-
dc.description.abstractPekiştirmeli öğrenme, gerçek hayattaki bir öğrenme ortamını modellemeyi amaçlayan önemli bir makine öğrenme tekniğidir. Konuyla ilgili son araştırmalar, araştırmacılar arasında onu çok popüler hale getirmiş ve birçok gerçek hayat senaryosuna daha uygulanabilir olmasını sağlamıştır. Kısmi gözlemlenebilirlik altında pekiştirmeli öğrenme, çevreden toplanan sınırlı bilgi nedeniyle özellikle zorlu bir alandır. Bu gibi hallerde, etmen, verilen görev için bir hareket tarzı oluşturabilmesi için ortamın durumunu tahmin etmek için deneyimlerden oluşan bir bellek tutmak zorundadır. Bazı çalışmalar, etmenin mevcut andan önceki bir dizi gözlemi ve eylemi bellekte tutmasını sağlayan basit bir pencere tabanlı bellek yaklaşımı kullanır, ancak bu tür yöntemler, bir bilgiyi uzun süre boyunca bellekte tutmayı gerektirdiği problemlere genellenemez. Diğer çalışmalar, gerekli bilgileri yapı içinde tutan karmaşık bir model kullanır, ancak bu tür modeller, probleme çok özel olmak ve analiz için çok kapalı olmaktan dolayı yetersiz kalmaktadırlar. Bu tür problemlerde, bir eyleme karar verecek ilgili bilgi zamansal olarak uzaktır, bu nedenle etmen neyi bellekte tutacağı konusunda seçici olmak zorundadır. Yararlı bir bellek tutma problemini ele alan çalışma azdır ve uygulanabilirlikleri sınırlıdır. Bu sebeple bu alan keşfedilmemiş kalmıştır. Bu çalışmada, belleği değiştiren eylemler yapmasına izin vererek bellek kontrolünü etmene verme fikrini takip ediyoruz. Böylece etmen, bir ortamın dinamiklerine daha uyumlu hale gelir. Ayrıca, bu öğrenme mekanizmasını desteklemek için, etmenin ayırt edici olayları hatırlamasında yol gösterici olan ve ortamdaki durumunu netleştirmesini sağlayan bir içsel motivasyon yapısı oluşturduk. Genel yaklaşımımız, birkaç pekiştirmeli öğrenme yöntemine uygulanmış, uzun süreli bellek gerektiren birkaç kısmi gözlemlenebilir problem üzerinde test edilmiş ve analiz edilmiştir. Deneyler, diğer bellek tabanlı yöntemlere kıyasla öğrenme performansı açısından net bir gelişme göstermektedir.en_US
dc.language.isotren_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.titleKısmi Gözlemlenebilir Pekiştirmeli Öğrenmede Faydalı Bellek Oluşturmaen_US
dc.typeProjecten_US
dc.identifier.doi120E427-
dc.departmentİzmir Ekonomi Üniversitesien_US
dc.identifier.startpage0en_US
dc.identifier.endpage112en_US
dc.institutionauthorDemir, Alper-
dc.relation.publicationcategoryDiğeren_US
dc.identifier.trdizinid1223160en_US
dc.identifier.scopusqualityN/A-
dc.identifier.wosqualityN/A-
item.grantfulltextnone-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
item.openairetypeProject-
item.fulltextNo Fulltext-
item.languageiso639-1tr-
crisitem.author.dept05.05. Computer Engineering-
Appears in Collections:TR Dizin İndeksli Yayınlar Koleksiyonu / TR Dizin Indexed Publications Collection
Show simple item record



CORE Recommender

Page view(s)

50
checked on Sep 30, 2024

Google ScholarTM

Check




Altmetric


Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.