Covid-19 salgınıyla beraber girdiğimiz sosyal izolasyon sürecinde iletişime ne kadar çok ihtiyacımız olduğunun bir kez daha farkına vardık. Ayaküstü yaptığımız günlük sohbetlerden, sınıflarımızda dinlediğimiz derslere, şirketlerde katıldığımız toplantılara kadar her birimiz yüz yüze iletişimdeydik. Şimdiyse uzaktan da olsa iletişimde kalmaya çalıştığımız bu süreçte kitle iletişim araçlarına sıkı sıkıya tutunduk.

Zaman zaman kısa tuttuğumuz telefon konuşmalarımızın yerini uzunca konuştuğumuz görüntülü konuşmalar aldı. Kampüsler, fakülteler arasında koşuşturup yetişmeye çalıştığımız derslerimizin yerini odamızdan çıkmadan katıldığımız online dersler aldı.

Daha önce hiç duymadığımız ya da denemediğimiz teknolojilerle kaldığımız yerden devam etmeye çalışsak da bazen beklenmedik olumsuzluklar yaşayabiliyoruz. Dijital bir platformda ders dinlediğiniz ya da önemli bir toplantının ortasında olduğunuz sırada çevrenizden veya görüşmenin diğer taraflarının bulunduğu çevreden gelen bir ses ansızın görüşmelerinizi bölebilir. Her ne kadar uygun ortamı sağlamaya çalışsak da beklenmedik gelişmeler yaşanabilir.

Discord uygulaması bu kontrol edilemeyebilir durumlar için Krisp.ai ile yaptığı ortaklık kapsamında arka plandaki gürültüleri bastırmayı sağlayacak bir özellik geliştirdiklerini açıkladı. Henüz Beta aşamasında olsa da böyle bir süreçte artan kullanıcı sayısının beklentilerini karşılayabilmek adına herhangi bir teknolojik gelişme konusunda kullanıcılarını bekletmek istemediklerini söylüyorlar.

Sosyal İzolasyon Sürecinde İletişime Yön Veren Yapay Zekâ Girişimleri
Ocak-Nisan ayları arasında bazı ülkelere göre günlük Discord kullanım oranı artış grafiği

Bu yeni özelliğin kapı kapanması, klavye sesi, cips paketinin hışırtısı gibi her türlü sesi tespit edip ortadan kaldırabileceği ileri sürülüyor. Özelliği görüşmeleriniz sırasında açabileceğiniz gibi uygulama ayarlarınızdan ses ve video kısmına girip ileri seviye başlığı altında bulunan gürültü bastırma özelliğini etkinleştirerek de açabiliyorsunuz.

Sosyal İzolasyon Sürecinde İletişime Yön Veren Yapay Zekâ Girişimleri
Discord uygulaması üzerinde ses bastırma özelliğini değiştirebileceğimiz sekme

Yapay zekânın ürünü olan bu özellik evlerimizde gerçekleştireceğimiz görüşmelerimiz için uygun bir ortam sağlamamıza yardımcı olabilecek nitelikte bir gelişme. Dijital dönüşümlere ayak uydurmaya çalıştığımız bu süreçte yapay zekâ ve makine öğrenmesi modelleri pek çok alanda hayatımızı kolaylaştırmaya devam ediyor. Bunun bir diğer örneği de Google tarafından gerçekleştiriliyor.

Görüşmelerimiz esnasında internet sorunlarından kaynaklanabilecek ufak tefek kesintileri konuşma parçacıklarıyla tamamlayıp kişinin konuşma şeklini taklit edebilen bir yapay zekâ tasarlandı. Google ekibi tarafından geliştirilen bu yapay zekâ tasarımı Google’ın görüntülü arama uygulaması olan Duoda kullanılmaya başlandı.

Konuşmalar yazılı bir metinden gerçekçi sesler üretebilen DeepMind tarafından geliştirilen bir sinir ağı üzerine kurulmuş durumda. WaveNetEQ olarak bilinen bu sinir ağı insanların konuşma biçimlerinde bulunan ortak kalıplara dayanan kısa konuşmalarını tamamlayabilecek seviyeye ulaşana kadar 48 farklı dili konuşan 100 insan sesini içeren bir veri kümesi içinde eğitildi.

Herhangi bir bulut üzerinde değil de direkt olarak cihaz üzerinde çalıştığı için yapay zekâ konuşma sırasında konuşmacının ses özelliklerini öğrenip hem konuşma stiline hem de konusuna uygun olarak eşleşen konuşma kalıplarını bulabiliyor. Bu sayede de konuşmada herhangi bir kesinti olduğu zaman yapay zekâ ürettiği sesle hızla durumu telafi edebiliyor. Şimdilik bir kelimenin bütününden ziyade yalnızca heceler üretilebiliyor.

Sosyal İzolasyon Sürecinde İletişime Yön Veren Yapay Zekâ Girişimleri
Ses verilerinin internet aracılığıyla alıcıya iletilmesi sürecinde kayıp kısımlar ve yanlış sırada gelen verilerin gösterimi

 

120 MS’de yaşanan kayıp: EQ örneği:

120 MS’de yaşanan kaybın yapay zekâ tarafından düzeltildiği versiyon. WaveNetEQ örneği:

Sürecin nasıl işlediğini merak ediyorsanız detayları ve Google tarafından paylaşılan online örnekleri inceleyebilirsiniz.

İçinde bulunduğumuz süreçte iletişimi kolaylaştırabilecek her gelişmeyi heyecanla beklediğimiz tam da bu noktada yapay zekanın ürünü olan yenilikler sosyal hayatımızda yerini daha çabuk bulabiliyor çünkü yapılan girişimlerin herkesin erişebileceği düzeyde olmasına çok daha fazla dikkat ediliyor.

Kaynak: MIT Technology Review, The Verge

Share:

administrator

Boğaziçi Üniversitesi Yabancı Diller Eğitimi 4. Sınıf öğrencisi olan İrem; eğitim teknolojileri ve psikolojisi, sosyal psikoloji, dil öğreniminde teknolojinin etkisi gibi alanlarda öğrenime ve paylaşıma olan ilgisiyle beraber geleceğin nerede olduğunu araştırıyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir