DeepMindın Yapay Zekâ Araştırmacıları, Oyuncuların Zaafları Üzerine Çalışıyor

Gerçek hayattaki problemlerin çözümüne yönelik olarak geliştirmek istenen algoritmalar söz konusu olduğunda, bilgisayar oyunları gerçek hayata uyarlanıp algoritmaların geliştirilmesinde bilim insanlarına elverişli bir zemin sağlayabilir. Bunun sayesinde, yapay genel zekâ (AGI) için zemin hazırlanmış olabilir. AGI, yalnızca veri girişi gibi sıradan ve tekrarlanan görevleri değil, kendi çevresi hakkında da akıl yürütebilen bir karar verici yapay zekâ sistemine işaret ediyor.

23.02.2022 02:00:38 tarihinde yayınlandı.

Gerçek hayattaki problemlerin çözümüne yönelik olarak geliştirmek istenen algoritmalar söz konusu olduğunda, bilgisayar oyunları gerçek hayata uyarlanıp algoritmaların geliştirilmesinde bilim insanlarına elverişli bir zemin sağlayabilir. Bunun sayesinde, yapay genel zekâ (AGI) için zemin hazırlanmış olabilir. AGI, yalnızca veri girişi gibi sıradan ve tekrarlanan görevleri değil, kendi çevresi hakkında da akıl yürütebilen bir karar verici yapay zekâ sistemine işaret ediyor.

Google'ın ana şirketi Alphabet bünyesindeki yapay zekâ şirketi DeepMind'daki araştırmacılar tarafından yayınlanan yeni bir makaleye göre bazı oyunlardaki oyuncuların hamlelerine yönelik en iyi karşılıkları öğrenen bir sistem oluşturuldu. Satranç ve Go'nun da içinde yer aldığı oyunlarda, bu yapının 'en kötü durumdaki rakiplerde' tutarlı bir şekilde yüksek performans gösterdiği belirtiliyor. 'En kötü durumdaki rakipler', iyi olmayan ancak oyunu kuralına göre oynayıp bitiren oyuncular için kullanılan bir terim.

Oyunculara karşı gösterilen performansın seviyesi, projede 'zafiyet' olarak adlandırılıyor. Bu zafiyeti hesaplamak, oyuncunun yapabileceği hareketlerin toplamı çok büyük olduğundan ötürü hayli yoğun bir işlem gerektiriyor. Örneğin Texas Hold'em isimli oyunun bir versiyonu olan Heads-Up Limit Texas Hold’em oyununda 10 üzeri 14 karar noktası varken Go'da bu sayı 10 üzeri 170'e çıkıyor. Bu işlemlerden kaçınmanın bir yolu, güçlendirilmiş öğrenme adı verilen bir yöntemi kullanmak. Bu yöntemle verilebilecek en iyi karşılık hesaplanabiliyor.

DeepMind araştırmacılarının önerdiği yapı, Yaklaşık En İyi Karşılık Bilgi Durum Monte Carlo Ağaç Araştırması (ABR IS-MCTS) adını almış. Bu yapı, bilgi/durum temelinde en iyi karşılığa yakınsıyor. Yapı içerisindeki aktörler, bir oyunu oynamak için bir algoritmayı takip ederlerken öğreniciyse bir hareket tarzı geliştirmek için çeşitli oyunların sonuçlarından yola çıkıyor. ABR IS-MCTS sezgisel olarak doğru ve istismar edebilir bir karşı strateji yaratabilmeyi öğrenmeyi deniyor. Zaafları arayan sistem, rakibin stratejisine sınırsız bir erişim sağlıyor ve birinin yıllar boyunca rakibinin zaaflarını kullanması için eğitilmesi durumunda ne olacağını simüle ediyor.

Araştırmacıların verilerine göre, 200 oyunculu (4 işlemcili ve 8 GB RAM'li bir bilgisayarda eğitildiler) ve bir öğrenicili (10 işlemcili ve 20 GB RAM'li bir bilgisayarda eğitildi) deneylerde, ABR IS-MCTS her oyunda %50'nin üzerinde bir kazanma oranı yakaladı. Buna ek olarak Hex veya Go dışındaki oyunlarda (Connect Four ve Breakthrough gibi) bu oran %70'in üzerine çıkarken 1 milyon bölüm için eğitildikten sonra tavlada %80 başarı sağladı.

İLGİLİ HABER Googledan Cinsiyetlere Göre Çeviri Yapacak Yapay Zekâ

Bununla birlikte ABR IS-MCTS'nin bazı örneklerde hayli yavaş olduğu kaydediliyor. Örneğin iki oyunculu pokerin basitleştirilmiş bir versiyonu olan Kuhn Poker'de belirli bir tür stratejinin zafiyetini hesaplamak ortalama 150 saniye sürdü. Gelecekteki araştırmalarda, daha karmaşık oyunlar için stratejiler geliştirmesi hedefleniyor.


Kaynak webtekno.com

 

İş Arayanların ya da Kariyer Tutkunlarının Buluştuğu Sosyal Medya Platformu LinkedIn Nedir, Nasıl Kullanılır?

Hemen hemen hepimizin bildiği Facebook, Twitter ve Instagram gibi bir sosyal ağ olan LinkedIn, birçok yönüyle bu saydığımız platformlardan ayrılıyor. LinkedIn diğerlerine göre daha profesyonel amaçlarla kullanılıyor. Yani becerilerinizi, uzmanlık alanlarınızı, eğitim bilgilerinizi ve iş deneyimlerinizi paylaşabileceğiniz bir sosyal platformdur. 

Astronotlar Eve Bezli Dönüyor: Kapsüldeki Bozuk Tuvalet, Mürettebatı Yetişkin Beziyle İdare Etmeye Zorladı

Elon Musk’ın uzay yarışında önemli yer edinen uzay taşımacılığı şirketi SpaceX, son dönemde NASA görevleri için fırlatılan kapsüldeki tuvalet sıkıntısıyla gündeme oturdu. Uluslararası Uzay İstasyonu’ndaki görevlerini tamamlayan ve eve dönüş için hazırlanan astronotlar da bu tuvalet sıkıntısından dolayı yolculuk sırasında ‘yetişkin bezi’ ile idare etmek zorundalar. İstasyon’da geçen altı aylık sürenin oldukça zorlu olduğunu belirten astronotlar, uzay yürüyüşleriyle İstasyon’un güç ünitelerini onarmış ve uzayda çekilen ilk film için Rus film ekibine ev sahipliği yapmışlardı. Ekip şimdi de yerlerini yeni gelecek astronotlara bırakmaya hazırlanıyor.