Facebook, Twitter ve özellikle Instagram ile Pinterest’te sürekli #Foodporn görselleriyle karşı karşıya geliyoruz. Güzel ayarlanmış ışık, muhteşem bir açı ve özenle hazırlanmış bir servisle, birden zaman tünelimize düşüveren güzel görünümlü yemeğin ne olduğunu anlayamıyor veya tarifini merak edebiliyoruz. Müzik konusunda da benzer bir sorun yaşıyorduk ve imdadımıza Shazam yetişmişti.
İşte, MIT’de Elektrik Mühendisliği ve Bilgisayar Bilimleri öğrencisi olan Nick Hynes’in dahil olduğu takımın Pic2Recipe isimli uygulaması tam olarak yemekleri tanımlamakla kalmıyor, ayrıca içerisinde neler kullanıldığını ve hangi tarifle yapıldığını da tespit edebiliyor. Ya da daha doğru bir deyişle, tespit edebilecek.
Silicon Valley izleyenlere tanıdık gelecektir; Çinli dostumuzun SeaFood olarak başlayan projesi SeeFood adını almış ve herkes tüm yiyecekleri birbirinden ayıran bir uygulama olduğunu düşünerek demoyu izlemiş ancak küçük bir sürprizle karşılaşmışlardı. Dizinin devamında da gördüğümüz “Yiyecekler için Shazam – Shazam for food” sloganına sahip uygulamanın bir benzeri Pinterest tarafından da geliştirilmişti.
Makine öğrenimi algoritmaları sayesinde yüklediğiniz fotoğraflardaki yemeği tanımaya çalışan ve o yemeğin veya o yemeğe benzettiği yemeklerin tariflerini karşınıza getiren uygulama, Food.com ve Allrecipes başta olmak üzere birçok yemek tarifi platformundan 1 milyondan fazla görsel ve tarif ile beslenmiş.
Makine öğrenimi; ne kadar beslenirse o kadar iyi performans gösteren bir yapıya sahip olduğu için, kullanıcıların yüklediği her yemek görseli, sistemin kalitesine katkıda bulunuyor.
Pinterest’in tanıttığı servis; yüklenen fotoğrafların kategorizasyonu, yemeklerin etiketlenmesi ve tariflerinin kolay bulunmasını sağlarken Hynes’ın projesi sadece yemekleri değil yemekte kullanılan malzemeleri de tanımaya çalışıyor. Yani sadece omlet değil “pul biber atılmış, peynirli omlet” tanımını yapmayı hedefliyor. Hynes, Pic2Recipe uygulamasının yakın zamanda, fotoğrafı yüklenen görselin içerisinde herhangi bir alerjiye veya hastalığa kötü gelen bir maddenin bulunup bulunmadığını tespit etme noktasında ve dolaptaki bulunan malzemelere göre, uygulanan diyeti de dikkat alarak en iyi yemek tarifinin hazırlanması konusunda da ciddi katkılar sağlayabilmesini umuyor.
“Smoothie, çorba ve suşi gibi harmanlanmış ve karıştırılmış gıdalar dahil olmak üzere bazı yiyecek türlerini belirlemekte hala zorluk çekiyor.”
Kurabiye, kek, börek ve limonata fotoğrafı çekerek birkaç deneme yaptım ve sonuçlar çok çok iyi olmasa da benzerlerini bulabildi.
“Fotoğrafın uzaktan veya yakından çekilmiş olması ya da fotoğrafta tek öğe olması, çok öğe olması veya fotoğrafta bir öğenin sadece bir parçasının olması da büyük fark yaratıyor”
Geforce GTX TITAN X GPU ve CuDNN’e ek olarak PyTorch derin öğrenme kütüphanesi kullanılarak geliştirilen uygulama sayesinde geniş bir yemek-tarif veritabanı oluşturulabilir ve bu gelecekte telefonlarımızı gösterdiğimiz anda yemeklerin içerisinde ne kullanıldığını görebilmemiz anlamına gelir.
“İnsanların yemeklerini analiz etmelerini ve beslenme değerlerini belirlemelerini, hatta mevcut bir tarifin daha sağlıklı olmasını veya bazı diyet kısıtlamalarına uymasını sağlayabilir”
Bu uygulama; telefonlar, akıllı gözlük ve akıllı lens ile görüntülenmesinin yanı sıra akıllı buzdolaplarının; dolapta ve buzlukta neler olduğunu anlaması, bozulmak üzere olan ürünleri tespit edebilmesi ve belki de gelecekte gelişecek olan otomatik yemek pişirme gibi sistemler için ciddi bir altyapı demek oluyor.
Geleceğimizi potansiyel bir çığ olarak ele alırsak günümüzde; makine öğrenimi ve derin öğrenme başlığı altında yapılan tüm yeniliklerin kar topunu 2 katı büyüklüğüne getirdiğini düşünebiliriz. Yani bugün, bu konudaki tüm gelişmeler gerçekten ütopik ve distopik kurgularla donatılan gelecek hayallerinin temeli diyebiliriz.
Kaynaklar: TechInside TR – Wired – Yourstory