Bir yapay zekâ şirketi olan OpenAI aklınıza gelebilecek her tarzda şarkı üretebilen bir sinir ağı yayınladı. Şirket JukeBox‘ı çeşitli türlerin ve sanatçı stillerinin kullanılabildiği bir ham ses olarak tanımlıyor.

Müzik yüzyıllar boyunca bizimle beraber gelişerek ve uygarlıkların kültürlerine karışarak insanoğlunun ayrılmaz bir parçası haline geldi. Sokakta veya evde, eğlenirken veya hüzünlüyken, mekan veya durum fark etmeksizin duygularımızı ifade etmenin en rahatlatıcı yolu oldu. Üstelik bizimle beraber var olmadı, zaten doğada var olan müziği kuşların ötüşünde, rüzgarın uğultusunda bulmak pek zor olmasa gerek. Her müzik ayrı bir ruhu, spesifik bir durumu temsil eder, bilgisayarla müzik yapmaya çalışmanın en zor kısmı bu yaratıcılığı ve özgünlüğü yakalamak. Tek bir müzik aletinin (mesela piyano) vereceği tınıyı taklit edebiliyoruz. Bir şarkıcının sesini taklit etmek de çok zor bir iş değil artık. Fakat melodi, kompozisyon, tını, vokal sesi bunların hepsini bir araya getirerek ortaya bir ürün çıkarmak tek bir sistem için oldukça zorlu bir görev.
OpenAI’nın yeni sinirsel ağı JukeBox ‘müzik üretmek’ için deepfake oluştururken kullanılan makine öğrenmesi teknolojisiyle aynı mantığı kullanıyor. JukeBox tasarımlarını bir veri akışından öğrenmesi için bilgisayarı eğiten yapay sinir ağları kullanarak üretiyor. Araştırmacılar yapay sinir ağını eğitirken düzinelerce sanatçının 1.2 milyon şarkı sözünden, film müziklerinden ve melodilerinden yararlandılar. JukeBox pop, caz, country, heavy metal, hip-hop gibi tarzlarda Frank Sinatra, Tupac, Katy Perry, Eagles, Beyoncé gibi sanatçıların şarkılarından esinlenerek bir sinir ağından beklenmeyecek kadar iyi işler ortaya koydu. Ortaya koyulan müziğin türüne de dikkat çekmek gerek, örneğin bir klasik müziğe ait bir parça üretmek pop müziğe ait bir parça üretmeye göre çok daha basit. Bunun sebebi de klasik müziğin matematiksel temele oturtulmasının çok daha kolay olması, bu sayede sinir ağları kolayca eğitilebiliyorlar.
Şirket geçen sene yine yapay zekâyla müzik yapma başlığı altında MuseNet adında bir algoritma duyurmuştu. Derin öğrenme yoluyla elde ettiği ritim ve melodileri kullanarak benzer tarzda müzikler ortaya koyan MuseNet ve JukeBox’ın en belirgin farkı ise JukeBox’ın kendi şarkı sözlerini üretebiliyor olması. Tüm bu özgünlüğe işaret eden yeniliklerin yanında hala sistemin doğaçlama yapması imkansız. Bu nedenle de ortaya çıkan parçaların bize tanıdık geliyor olması çok normal, çünkü zaten dinlediğimiz müziklere ait verileri kullanarak oluşturuluyorlar. 1 dakikalık bir müziğin meydana getirilmesi ise tam olarak 9 saat sürüyor. Saydığımız nedenlerden dolayı şu an için JukeBox müzik endüstrisi ve sanatçılar için bir tehdit olarak görülmeyebilir fakat müzik dünyası için rahatlatıcı olan bu durum teknolojisi dünyası için ise oldukça ilham verici. Çünkü bir kez daha yapay sinir ağlarının insanları taklit etmekte ne kadar iyi olduğunu ve gerçekle yapay arasındaki farkı ayırt etmenin gün geçtikçe zorlaştığını görmüş oluyoruz.
Bir yandan da telif haklarının ihlali nedeniyle sorunlar yaşaması muhtemel olan JukeBox’ın bizim için önemli bir yanı da açık kaynaklı bir algoritma olması. Algoritmaya ait kodlara ve başarılı olarak görülen kayıtlara ise şirketin oluşturduğu internet sitesinden ulaşabilirsiniz.
Kaynak: Techzine