Özerk robotlar hakkındaki araştırmalar her geçen gün daha da kapsamlı hale geliyor, üretilen her robot bir öncekine göre hem hareket kabiliyeti açısından hem de mental açıdan daha üstün özellikler taşıyor. Artık gündelik yaşantımızda görmeye başladığımız robotların hareket kabiliyetlerinin artması hem işlevsellik hem de işimizi kolaylaştırması açısından oldukça önemli bir gelişme. Boston Dynamics tarafından geliştirilen robot köpek Spot‘un polislere yardımcı olması hakkında bir içerik paylaşmıştık. Google araştırmacıları da özerk robotlara daha çevik hareket edebilme gibi hareket kabiliyetini arttıran davranışları öğretebilmek için taklit öğrenme (imitation learning) adı verilen bir yöntem kullanıyor.
Çeşitli yöntemlerle robotlara bir şeyler öğretebiliyoruz fakat gerçek dünyaya tam olarak uyum sağlayabilmeleri için gerekli olan karmaşık ve çevik hareketleri öğretmek bu alanda yaşanan büyük sorunlardan biri. Taklit öğrenme sayesinde robotlar hayvanların hatta insanların sergilediği karmaşık hareketleri kolay bir şekilde kopyalayabiliyor.
Araştırmacılar bir köpeğe bağlı sensörler tarafından kaydedilen bir veri seti kullanarak geleneksel el kodlarıyla yapılan robotik kontrollerle elde edilmesi zor olan birkaç hareketi Laikago isimli bir robota öğretti. Öncelikle gerçek bir köpeğin hareket verilerinden yararlanarak her bir hareketin simülasyonunu oluşturdular. Bu veriler temel hareketleri içeriyordu, yavaş yürüyüş, yana kayma ve 80’lerin hiphop figürü koşan adam’ın (the running man) köpek versiyonu. İlk ikisini gerçek köpeğin hareket verilerinden alırken üçüncüsü köpeğin kendisi tarafından gerçekleştirilmedi, araştırmacılar simüle edilen köpeğe kendileri dans figürü yaptırdılar. Daha sonra simüle edilen robotun köpekle aynı şekilde hareket etmesini sağlamak için robot ve köpek üzerindeki anahtar eklemleri etkinleştirdiler. Hareketleri stabilize etmeyi ve ağırlık dağılımını öğretmek için ise pekiştirmeli öğrenmeden (takviye öğrenme) yararlandılar. Nihayet araştırmacılar kontrol algoritmasını laboratuvardaki fiziksel bir robota taşımayı başardılar, yine de koşan adam gibi bazı hareketler tam olarak başarılı olmadı.
Pekiştirmeli/takviye öğrenme (reinforcement learning): Pekiştirmeli öğrenme, bir yapay zekâyı ödül sistemiyle eğitmeye dayanan algoritmik sistemdir. Makine öğreniminin (machine learning) alt dallarından birisidir.
Bu konudaki makalenin başyazarı Jason Peng hala üstesinden gelinmesi gereken bazı zorluklar olduğunu belirtiyor. Ayrıca hayvanlardan hareket sensörüyle kopyalama yapmak basit bir iş değil. Hem maliyeti oldukça yüksek hem de hayvanın iş birliğini gerektiriyor. Sonuçta bir çita bir köpek kadar arkadaş canlısı değil. Bu nedenle ekip ilerideki çalışmalarında tekniklerini daha işlevsel ve daha erişilebilir hale getirmek için hayvan videoları kullanmayı planlıyor.
Kaynak: MIT Technology Review