Kısmi Gözlemlenebilir Pekiştirmeli Öğrenmede Faydalı Bellek Oluşturma

dc.contributor.author Demirbilek, Burak Han
dc.contributor.author Demir, Alper
dc.date.accessioned 2024-05-04T14:17:59Z
dc.date.available 2024-05-04T14:17:59Z
dc.date.issued 2023
dc.description.abstract Pekiştirmeli öğrenme, gerçek hayattaki bir öğrenme ortamını modellemeyi amaçlayan önemli bir makine öğrenme tekniğidir. Konuyla ilgili son araştırmalar, araştırmacılar arasında onu çok popüler hale getirmiş ve birçok gerçek hayat senaryosuna daha uygulanabilir olmasını sağlamıştır. Kısmi gözlemlenebilirlik altında pekiştirmeli öğrenme, çevreden toplanan sınırlı bilgi nedeniyle özellikle zorlu bir alandır. Bu gibi hallerde, etmen, verilen görev için bir hareket tarzı oluşturabilmesi için ortamın durumunu tahmin etmek için deneyimlerden oluşan bir bellek tutmak zorundadır. Bazı çalışmalar, etmenin mevcut andan önceki bir dizi gözlemi ve eylemi bellekte tutmasını sağlayan basit bir pencere tabanlı bellek yaklaşımı kullanır, ancak bu tür yöntemler, bir bilgiyi uzun süre boyunca bellekte tutmayı gerektirdiği problemlere genellenemez. Diğer çalışmalar, gerekli bilgileri yapı içinde tutan karmaşık bir model kullanır, ancak bu tür modeller, probleme çok özel olmak ve analiz için çok kapalı olmaktan dolayı yetersiz kalmaktadırlar. Bu tür problemlerde, bir eyleme karar verecek ilgili bilgi zamansal olarak uzaktır, bu nedenle etmen neyi bellekte tutacağı konusunda seçici olmak zorundadır. Yararlı bir bellek tutma problemini ele alan çalışma azdır ve uygulanabilirlikleri sınırlıdır. Bu sebeple bu alan keşfedilmemiş kalmıştır. Bu çalışmada, belleği değiştiren eylemler yapmasına izin vererek bellek kontrolünü etmene verme fikrini takip ediyoruz. Böylece etmen, bir ortamın dinamiklerine daha uyumlu hale gelir. Ayrıca, bu öğrenme mekanizmasını desteklemek için, etmenin ayırt edici olayları hatırlamasında yol gösterici olan ve ortamdaki durumunu netleştirmesini sağlayan bir içsel motivasyon yapısı oluşturduk. Genel yaklaşımımız, birkaç pekiştirmeli öğrenme yöntemine uygulanmış, uzun süreli bellek gerektiren birkaç kısmi gözlemlenebilir problem üzerinde test edilmiş ve analiz edilmiştir. Deneyler, diğer bellek tabanlı yöntemlere kıyasla öğrenme performansı açısından net bir gelişme göstermektedir. en_US
dc.identifier.doi 1.80E+308
dc.identifier.uri https://search.trdizin.gov.tr/yayin/detay/1223160
dc.identifier.uri https://hdl.handle.net/20.500.14365/5311
dc.language.iso tr en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.title Kısmi Gözlemlenebilir Pekiştirmeli Öğrenmede Faydalı Bellek Oluşturma en_US
dc.type Project en_US
dspace.entity.type Publication
gdc.author.institutional Demir, Alper
gdc.coar.access open access
gdc.coar.type other
gdc.description.department İzmir Ekonomi Üniversitesi en_US
gdc.description.departmenttemp ASELSAN ELEKTRONİK SAN. VE TİC. A.Ş. -- İZMİR EKONOMİ Ü. MÜHENDİSLİK F. BİLGİSAYAR MÜHENDİSLİĞİ B. en_US
gdc.description.departmenttemp ASELSAN ELEKTRONİK SAN. VE TİC. A.Ş. -- İZMİR EKONOMİ Ü. MÜHENDİSLİK F. BİLGİSAYAR MÜHENDİSLİĞİ B. en_US
gdc.description.endpage 112 en_US
gdc.description.publicationcategory Diğer en_US
gdc.description.scopusquality N/A
gdc.description.startpage 0 en_US
gdc.description.wosquality N/A
gdc.identifier.trdizinid 1223160
gdc.index.type TR-Dizin
gdc.opencitations.count 0
gdc.virtual.author Demir, Alper
relation.isAuthorOfPublication c9c431c0-6d14-4dac-87af-29d85e10ef21
relation.isAuthorOfPublication.latestForDiscovery c9c431c0-6d14-4dac-87af-29d85e10ef21
relation.isOrgUnitOfPublication b4714bc5-c5ae-478f-b962-b7204c948b70
relation.isOrgUnitOfPublication 26a7372c-1a5e-42d9-90b6-a3f7d14cad44
relation.isOrgUnitOfPublication e9e77e3e-bc94-40a7-9b24-b807b2cd0319
relation.isOrgUnitOfPublication.latestForDiscovery b4714bc5-c5ae-478f-b962-b7204c948b70

Files