Yapay zekanın hayatımıza entegre olma şeklini hep ütopik veya distopik senaryolarla dile getiriyoruz ancak aslında yapay zeka şu anki şekli ile bile birçok işimizi kolaylaştırırken hayatımızı daha keyifli ve daha pratik hale getirme konusunda güzel bir gelecek vaat ediyor.
Asırlardır günlük yaşamın, duyguların ve keyfin en büyük yönlendiricilerinden birisi olan müzik bugün milyarlarcasının bulunduğu bir havuza sahip. Hal böyle olunca; duygularımıza ve müzik zevkimize uygun eserler bulmakta zorluk çekebiliyor ve yıllarca aynı şarkılara kendimizi hapsedebiliyoruz. (Özellikle ben bu konuda çok dertliyim.)
İşte bu noktada 2015 yılında karşımıza Spotify’ın “haftalık keşif” (Discover weekly) hizmeti çıktı. Her pazartesi günü 30 şarkılık, tamamen kişiye özel hazırlanmış bir playlist oluşturan Spotify, milyonlarca şarkıya sahip olması ve müzik dinlemeyi çok kolaylaştırması gibi temel hizmetlerini unutturarak sadece bu özelliği ile kendisine fanlar edinmiş oldu. Peki ama bir şarkı platformu nasıl oluyor da kullanıcının sevebileceği şarkıları bulabiliyor? Hem de 157 milyon kullanıcısına aynı anda özel olarak liste oluşturabiliyor? Çok basit: Yapay zeka.
Yapay zeka deyip geçmek olmaz; her yapay zekanın yapması gereken işe göre farklı algoritmalar ve farklı veriler ile beslenmesi gerekir, bu noktada bizim kahramanımız Spotify, bizim canımız yapay zekayı [tooltip tip=”İşbirlikçi filtreleme”]Collaborative Filtering[/tooltip], [tooltip tip=”NLP – Doğal dil işleme”]Natural Language Processing[/tooltip] ve Audio isimli üç algoritma-yöntem ile yetkilendiriyor.
2000’li yılların başında karşımıza çıkan Songza, kullanıcılarına oynatma listeleri oluştururken müzik uzmanlarından yardım alıyordu. İnsan uzmanlar tarafından seçilen bu listeler beğeni toplasa da herkese aynı şarkılar tavsiye edildiği için kişilerin özel zevklerine veya kişisel alışkanlıklarına hitap edemiyordu.. Sonrasında Pandora karşımıza çıktı ve sistemi biraz geliştirerek; kullanıcılar tarafından etiketlenen şarkıları, benzer etiketleri kullanan diğer insanlara öneren bir sistem kurdu. Yani ben bir şarkıyı dinlerken Çanakkale diye etiketlediğimde, başka bir kullanıcının Çanakkale diye etiketlediği bir şarkı bana tavsiye ediliyordu. Yine o sıralarda karşımıza çıkan The Echo Nest, MIT Media Lab tarafından oluşturulan, ses ve söz analizi yapabilen bir algoritma ile çalışıyordu ve bu sayede müzik etiketleme sorumluluğu insanlardan makinelere taşınmış; sistem artık şarkıları kimliklendirip kişilere özel önerilerde bulunmaya başlamıştı. Kısa bir zaman sonra ise Last.fm’in Collaborative Filtering özelliği ile tanışmış olduk ve bu özellik Netflix ile birlikte çok ünlü oldu.
Nedir bu Collaborative Filtering diye soracak olursak basitçe görücü usulü diyebiliriz sanırım. Tam olarak “Bak bunun böyle özellikleri var, senin şöyle özelliklerin var. Bence uyum sağlarsınız” mantığının çok daha bilimsel ve istatistiksel düzleme dayandırılmış bir hali olan İşbirlikçi Filtreleme kullanıcılar ile kullanıcıları ve şarkılar ile şarkıları karşılaştırarak kişiler için en güzel önerilerde bulunmaya çalışıyor.
Temel olarak; P, Q, R, S şarkılarını beğenen Ahmet ve Q, R, S, T şarkılarını beğenen Semih eşleştirildiğinde Ahmet’e P, Semih’e ise T şarkıları tavsiye ediliyor. Ancak tabii ki arka planda çok daha fazla şey yaşanıyor.
Önce kişilerin alışkanlıklarını dikkate alan sistem kullanıcıların örtülü geri bildirimlerini (Implicit feedback), yani bir şarkıyı dinledikten sonra sanatçının sayfasına girmiş mi, şarkıyı playlistine eklemiş mi gibi aktivitileri dikkate alarak kullanıcı vektörlerini oluşturduktan sonra şarkı odaklı bir vektör daha oluşturuyor.
Aşağıdaki matrisi ele aldığımızda her bir satır kullanıcıları (Şu an itibariyle 157 milyon) ifade ederken sütunlar ise şarkıları (Yaklaşık 35 milyon) temsil ediyor. Ve devamında hem bana, benim alışkanlıklarıma en çok benzeyen kullanıcı(lar) tespit ediliyor hem de benim beğendiğim bir şarkıya çok benzeyen şarkı(lar) tespit edilerek ciddi bir eleme yapılmış oluyor. Bu oldukça güzel ve benim gibi fazla müzik takıntısı olmayanlar için yeterinnce başarılı bir algoritma ancak Spotify bununla yetinmiyor ve iki farklı algoritma daha kullanarak çok daha seçici davranıyor.
Natural Language Processing yani Doğal Dil İşleme algoritması ise internetteki tüm verileri tarayarak metadataları, haber-makaleleri, blogları, sosyal paylaşım platformlarını ve daha birçok bilgiyi takip ederek müzik dünyasında ne olmuş, ne bitmiş analiz ederek trendi ölçmeye çalışıyor. Bu noktada da karşımıza iki farklı terim çıkıyor. Kültürel Vektör’de; dünya genelinde müzik kültürü ne durumda, hangi tarz şarkılar beğeniliyor, en çok sevilen sanatçılar gibi daha genel zamana yayılmış verilere bakılırken, Top Terms’te ise “Mustafa Ceceli eleştirilmiş mi, Rihanna yine neler yapmış” gibi daha günlük veya haftalık değişkenler analiz ediliyor.
Bu bahsettiğimiz iki algoritma birleştiğinde; benim sevdiklerimi seven insanların benim bilmediğim şarkılarının tespiti, benim sevdiğim şarkılar ile, bu şarkıları seven ama bana pek de benzemeyen insanların sevdiği şarkıların karşılaştırılması ve dünyada müzik endüstrisindeki magazinsel haberlerin tespiti sayesinde karşımıza muhteşem 30 şarkıdan oluşan bir playlist çıkması gerekiyor.
Ancak ilk iki algoritmanın yapamadığı bir şey var. Yeni şarkıları analiz edebilmek. Şarkıları zaman imzası, anahtar, mod, tempo ve ses yüksekliğine (time signature, key, mode, tempo, and loudness) göre değerlendiren Audio isimli algoritma, Convolutional Neural Network adı verilen ve yüz tanıma sistemlerinde sıkça kullanılan bir derin öğrenme metodu kullanarak önceki algoritmalara aktif olarak yardımcı oluyor olsa da aslında çok daha kutsal bir görev üstleniyor. Keşif.
İlk iki lokomotif verileri tarayarak ve alışkanlıklara-geri bildirimlere dayanarak çalıştığı için ünlü olmayan kişilerin yeni çıkardığı şarkılarda çaresiz kalabiliyor. Bu noktada devreye giren bu joker, şarkıları yukarıdaki özelliklere göre değerlendirerek ünlü şarkılara benzetebiliyor ve böylece Spotify’da yeni olan ve birkaç kez dinlenmiş olan şarkıların da insanlar tarafından duyulma ihtimali doğuyor. Bu sayede sanatçının hakkı korunmuş ve bir şans verilmiş de olabiliyor diyebiliriz.
Aslında bu tarz algoritmalar veya bu tarz özellikler internette kullandığımız birçok hizmette karşımıza çıkıyor. Twitter’da takip etmememize rağmen karşımzıa gelen Tweetler, Instagram’da keşfet kısmında karşımıza çıkanlar, Facebook’ta bize gösterilen paylaşımlar ve daha nicesi bu tarz bir hizmet sunan ancak şu ana kadar Spotify kadar başarı yakalayamamış –benim gördüğüm kadarıyla- bazı örnekleri. Ben kullanmadığım için emin olamıyorum ancak Imdb.com ve Beyazperde.com tarzı Sinema/TV platformlarında da bu özellikler aktif kullanılıyor olsa gerek. Yakın gelecekte yapay zekanın bizi ele geçirdiği distopik veya evde, sokakta, iş yerinde sürekli robotlarla yaşadığımız, duygusal veya cinsel ilişkiye girdiğimiz ütopik bir kültüre evrilemeyecek olsak da yapay zekanın hayatımıza ciddi katkıları var ve bu güzel bir ivmeyle birlikte devam ediyor. Yapay zekanın tamamen aldığı veriler ile gelişimini sürdürüyor olması ve internetteki veri sayısının her geçen yıl artıyor olması; akıllı cihazların (akıllı ayakkabı, şemsiye, araba, kapı, buzdolabı vs) da kullanımının yaygınlaşması ile birlikte yapay zekanın teknolojiyi görünmez kılacağı söyleniyor. Bilgisayarımızın başına oturduğumuz an veya akıllı lensimizi taktığımız an biz hiç seçim yapmadan bir filmi izlemeye başlayabilir, hayatımızda bir daha hiç arama kısmına müzik ismi yazma ihtiyacı duymayabiliriz.
Bu içeriği, kendisini Spotify Fangirl olarak isimlendiren Sophia Ciocca’nın Google üzerinden yaptığı araştırmalarla 3 haftada hazırladığı blogu baz alarak oluşturdum. Kendisine teşekkür etmekle birlikte her ne kadar artık belirli içeriklerde premium üyelik istiyor olsa da Medium’da zaman geçirmenizi tavsiye ederim.