Yapay zekanın temek amacı bilgisayarların insanlar gibi öğrenmesi olmuştur. Ancak oyunun kurallarını biliyor olmak yapay zeka için hayati önem taşıyor. İnsan zekası ise çıkarımsal olarak gelişiyor, ilerledikçe öğrenerek yoluna devam ediyor. Google’ın yapay zeka araştırmalarına odaklanan şirketi DeepMind, oyunları ortamları olarak kullanan yapay zekalar oluşturmak için çalışıyor. Firma, oyunda kuralları önceden öğrenmeksizin ustalaşabilen yapay zeka çalışması MuZero’yu açıkladı.
İlginizi çekebilir: Intel bu yeni çipiyle bilgisayar yapay zekalarını geliştirecek
İçindekiler
MuZero çevrenin belli kısımlarını modelliyor
DeepMind firmasının AlphaGo gibi önceki yapay zekalarının insan şampiyonlarla karşılaşmaları basında geniş bulmuştu. AlphaGo, yalnızca Go oyununun kurallarını değil insan oyunculardan gelen verileri de bilme özelliğine sahipti.
Daha önceki yapay zekalar, karmaşık stratejilere sahip ancak basit görsellere sahip oyunlarda başarılı olabiliyorlardı. Kurallarının algılanması zor olan ve karmaşık görsellere sahip oyunlarda ise başarısızdılar. MuZero yapay zekası işte bu noktada devreye giriyor. Çoğu yapay zeka araştırmacısı, öğrenme planı için stratejisini genellikle oyun kuralarının ve bilgisinin önceden verilmesine dayandırıyor. Model tabanlı öğrenme, ortamın doğru modelini oluşturarak öğrenir. MuZero ise tüm hareketleri modellemek yerine çevrenin yalnızca önemli kısımlarını modeller. Karar verirken üç faktörü hesaba katması gerekiyor. Bunlar: Bir önceki kararının sonucu, içinde bulunduğu mevcut durum ve bir sonraki aşamada yapılacak en iyi eylem.
MuZero’da önceden planlama kısmında sınırlı sayıda işlem yapılarak sistemin oyunlarda çok verimli ve hızlı hale gelmesi sağlandı. Bu yeni yapay zeka öğrenme yöntemi, kuralların net belli olmadığı karmaşık gerçek dünya ortamlarında kullanılabilecek. MuZero, yapılan açıklamaya göre şimdilik sadece bazı oyunlar üzerinde denenmiş görünüyor. Ancak ileriki aşamalarda robotik gibi basit kuralların olmadığı ileriki aşamalarda da kullanılabilmesi bekleniyor.