Dünyaca ünlü teknoloji devi Alphabet’in bir yan kuruluşu olan DeepMind, Çin masa oyunu Go, Japon strateji oyunu Shogi, satranç ve zorlu Atari video oyunlarını oynayabilen programlar üretiyor. Oyunların mantığını anlaması ve strateji oluşturabilmesi için tasarlanan programlara, oyunları binlerce kez oynatan DeepMind’in şimdiye kadar yetiştirdiği programlar bu oyunları mükemmele yakın bir şekilde oynayacak seviyeye ulaştı. Tüm bu projelerde, bilgisayarlara oyunun kuralları önceden veriliyordu. Ancak DeepMind’in yeni programı MuZero, daha oyunun kurallarını bilmeden birçok yapay zekâ destekli rakibini yenmeyi başardı.
DeepMind’deki programcılar MuZero’yu “Sonraki Hamleyi Arama” adlı bir ilkeye dayanarak tasarladı. Bu ilke doğrultusunda MuZero, bir rakibin nasıl tepki vereceğine bağlı olarak bir dizi potansiyel hamleyi değerlendiriyor. Satranç gibi karmaşık oyunlarda şaşırtıcı sayıda potansiyel hamle bulunsa da MuZero, yaptığı hamlelerden ders alıyor ve başarısız olanlardan kaçınarak en tutarlı ve en olası manevralara öncelik veriyor. Makine öğrenmesinde kullanılan programın veri ile beslenmesine benzer bir yapıya sahip olan MuZero’nun piyasadaki diğer yapay zekâlardan farkı ise daha ilk veri setinden itibaren tüm bu verileri kendi kararı ile oluşturmasından kaynaklanıyor. Başlangıçta oyunla ilgili hiçbir kural veya direktif almayan MuZero, sadece analiz etme yeteneğini kullanarak kendi kendine oyun stratejileri oluşturuyor.
Sadece oyun oynamıyor
DeepMind araştırmacılarına göre MuZero, ilk kez oynadığı Atari oyunu Pac-Man‘de toplamda 6-7 hamle öğrendi ve sadece bunları kullanarak iyi bir skor almayı başardı. DeepMind’ın baş araştırmacısı David Silver, MuZero’nun dünyada ilk defa, oyunun nasıl çalıştığına dair hiçbir fikri olmadan kendi anlayışını inşa edebilen ve bu anlayışını satranç gibi kompleks oyunlarda strateji yaratabilecek kadar ileri götürebilen bir program olduğunun altını çiziyor.
Silver ayrıca MuZero’nun sadece oyun oynamak için kullanılmadığını açıkladı. MuZero, video sıkıştırma ve Youtube’daki videoların işlenmesinde kullanılmaya başlandı. Program şimdiye kadar video sıkıştırma sürecini %5 daha verimli bir hale getirdi.
Yeni doğmuş bir bebek gibi
Silver, MuZero’nun geliştirilmesi ile yapay zekânın sınırlarını zorlayacaklarını düşünüyor.
“Dünyaya geldiğimizde kimse bize bir kural kitabı verip; işte dünya bu kurallara göre işliyor demedi.”
Yeni doğan bir bebeğin dünyayı algılayıp, onunla ilgili fikir yürütüp belirli tespitlere varması gibi MuZero da yeni bir oyunla veya bir programla aynı yeni doğmuş bir bebek gibi tanışıyor. Önce bu oyunun ne olduğunu algılamaya çalışıp onu gözlemliyor ardından çıkardığı sonuçlara göre kendisi hamleler yapmaya başlıyor. Kendi hayatımızda yaptığımız yanlışlar hakkında zaman zaman düşünüp daha doğru kararlar vermeye çalışırız, MuZero’nun yaptığı da aslında tam olarak bu. MuZero’yu gelişmekte olan bir bebekten ayıran ise yaptığı tüm bu hamleleri depolayıp onlar üzerinde sayısız kez analiz yapabiliyor olması.
MuZero’nun potansiyel tehlikeleri
Oyun oynayan bir yapay zekânın kulağa hiç tehlikeli gelmemesi normal ancak gelecekte birçok farklı alanda kullanılması planlanan MuZero ve benzeri kendi kendine öğrenen yapay zekâlar insanların anlayamacağı oyunlar veya programlama dilleri yaratabilir. Makine öğrenmesi sonucu ırkçı kararlar alan veya belirli ön yargılara sahip olan algoritmalar incelendiğinde sorunun bu sistemlerin beslendiği veriler olduğu karşımıza çıkıyordu. Peki en baştan beri kendi verisi ile beslenen bir algoritmada ön yargı ile karşılaşırsak bu sorunu nasıl çözeceğiz? Bu durumda yapay zekâ kendi ürettiği veriyi mi yoksa bizim dışarıdan ona vereceğimiz veriyi mi kullanma kararı alacak?
Kaynak: Tech Xplore