Google’ın DeepMind projesindeki bir grup yapay zeka araştırmacısı, sosyal öğrenme yeteneklerini gösterebilen bir tür yapay zeka sistemi geliştirdi.
Nature Communications dergisinde yayınlanan makalelerinde grup, implante edilmiş bir “uzmanın” eylemlerini kopyalayarak sanal bir dünyada yeni beceriler öğrenebildiğini gösteren bir yapay zeka uygulamasını nasıl geliştirdiklerini anlattılar.
ChatGPT gibi çoğu yapay zeka sistemi, bilgilerini internetteki veri havuzları gibi büyük miktarda veriye maruz kalarak elde eder. Ancak sektördekiler böyle bir yaklaşımın çok verimli olmadığını belirtiyor. Bu nedenle alandaki birçok kişi yapay zeka sistemlerine öğrenmeyi öğretmenin başka yollarını aramaya devam ediyor.
Araştırmacılar tarafından kullanılan en popüler yaklaşımlardan biri, insanların öğrenme sürecini taklit etmeye çalışmaktır. Geleneksel YZ uygulamaları gibi, insanlar da bir ortamda bilinen unsurlara maruz kalarak ve ne yaptıklarını bilen başkalarının örneklerini takip ederek öğrenirler. Ancak yapay zeka uygulamalarının aksine, insanlar çok sayıda örneğe ihtiyaç duymadan bir şeyler öğrenirler. Örneğin bir çocuk, başkalarının sadece birkaç dakika oynamasını izledikten sonra Jacks oyununu oynamayı öğrenebilir; bu da kültürel aktarımın bir örneğidir. Bu yeni çalışmada araştırma ekibi, sanal bir dünya ile sınırlandırılmış yapay zeka kullanarak bu süreci kopyalamaya çalışmıştır.
Ekibin çalışması ilk olarak üzerinde çeşitli engeller ve çok renkli küreler bulunan engebeli bir araziden oluşan sanal bir dünya (GoalCycle3D olarak adlandırıldı) inşa etmeyi içeriyordu. Daha sonra, engellerden kaçınarak ve kürelerin içinden geçerek sanal dünyada seyahat etmesi gereken yapay zeka ajanları eklediler. Ajanlara öğrenme modülleri verildi ancak içinde yaşayacakları dünya hakkında başka hiçbir bilgi verilmedi. Takviyeli öğrenme yoluyla nasıl ilerleyeceklerine dair bilgi edindiler.
Ajanların öğrenmesini sağlamak için onlara ödüller verildi ve benzer sanal dünyalarda tekrar tekrar ilerlemelerine izin verildi. Bunu yaparak, ajanlar sanal dünyada istedikleri bir hedefe doğru yol alabildiler. Araştırmacılar daha sonra sanal dünyaya başka bir özellik daha eklediler; bir yerden başka bir yere engellerle karşılaşmadan gitmenin en iyi yolunu bilen uzman ajanlar. Yeni senaryoda, uzman olmayan ajanlar kısa süre içinde istenen hedefe ulaşmanın en hızlı yolunun bir uzmandan öğrenmek olduğunu öğrendi.
Araştırmacılar, ajanların öğrenmesini izlerken, uzmanla çok daha hızlı öğrendiklerini ve önceki denemelerde uzmandan öğrendiklerini taklit ederek diğer yeni benzer sanal dünyalarda daha iyi gezinebildiklerini keşfetti. Araştırmacılar ayrıca, uzmanın yokluğunda bile bu becerileri (bellek modülleri sayesinde) uygulayabildiklerini, bunun da sosyal öğrenmenin bir örneği olduğunu iddia ediyor.