Araştırmacılar robotlara çevre ile nasıl etkileşime girebileceklerini öğretmek için videoyla benzer bir yaklaşım denemek istiyor. Berkeley Kaliforniya Üniversitesi’nden Sudeep Dasari ve arkadaşları açıklamalı video verilerinden oluşan RoboNet adında bir veri seti (dataset) oluşturdu. Örneğin veriler, bir bardağı masanın üzerinde hareket ettiren bir robot örneğini içerebilir. Buradaki fikir, herhangi birisinin bir bardakla etkileşime girmemiş olsa bile, herhangi birisinin bu verileri indirebileceği ve bir robotun sinir ağını bir bardak taşımak için kullanabileceği düşüncesi olarak karşımıza çıkıyor.
Princeton Üniversitesi’ndeki araştırmacılar tarafından oluşturulan ImageNet adlı veri tabanı, her bir görüntünün ne gösterdiğini metinlerle açıklayan 14 milyon görüntü içeriyor. ImageNet günümüzde kullanılan bir çok yapay zekâ ağının kesiştiği bir veri tabanı olduğu için önem kazanıyor. Veri tabanı ne kadar büyük olursa yapay sinir ağlarının ilgili görüntüye ve beraberindeki metne bakarak öğrenmesi de bir o kadar iyi oluyor. Aksi takdirde ImageNet ve bunun gibi diğer görsel veri setleri olmadan, en güçlü sinir ağları bile hiçbir şeyi tanıyamıyor.
Bir robot fırça hareketinde ustalaştığında hemen hemen başka bir şeyi hareket ettirmek için aynı öğrenme prosedüründen geçmesi gerekiyor. Her yeni ortam için sıfırdan veri toplama ve yeniden öğrenme gerekiyor. Bununla birlikte robot deneyimini paylaşmak için açık bir veri tabanı olan RoboNet başka birinin deneyiminden de ders alabiliyor.
Ekip veri tabanını oluşturmak için çeşitli ortamlarda yedi farklı tipte robot kullanarak 15 milyon video karesi görevini kaydetti. Robotlar daha önce hiç denemedikleri görevler için bu veri tabanının nasıl kullanılacağını öğrenmeye devam ederken bu yaklaşımla eğitilmiş robotlar, geleneksel olarak daha fazla veri konusunda eğitilmiş olanlardan daha iyi performans gösteriyor.
“Bu çalışma, çok çeşitli ortamlarda ve farklı donanımlarda çalışabilen robotik ajanlar oluşturma yolunda ilk adımı atıyor.”
Elbette her teknolojide olduğu gibi RoboNet’in de dezavantajları bulunuyor. Araştırmacılar kullanılacak verilerin gerçek dünyadaki karmaşıklığını gidermek için öğrenme algoritmalarının nasıl ölçeklendirileceğine hassas bir şekilde karar vermeli. Böylelikle makine vizyonunun nesneleri tanımada insanlar kadar iyi olması sağlanacaktır. RoboNet verileri herkesin kullanması için herkese açık. Diğer araştırma ekipleri RoboNet’i geniş bir robo-öğrenme kaynağı haline getirmek için bu verilere katkıda bulunabilir.
Kaynak: technologyreview