Sağlam dinamiklere sahip yapay zekâ girişimleri sunuldukları gibi bırakılmak yerine pek çok yenilikle iyileştirilmeye devam ediliyor. Amaca yönelik ve çözüm odaklı olan bu girişimler bu sayede ihtiyaçlara daha hızlı cevap verebiliyor. Tasarım ve üretim sürecini geride bırakıp kullanıcılarıyla buluştukları andan itibaren iyileştirme döngüsüne dahil oluyorlar.
Amazon tarafından geliştirilen yapay zekâ ürünü sesli asistan Alexa da bu gelişim döngüsü içinde bulunan girişimlerden biri. Sesli etkileşimlerde bulunarak kontrol edilebilen yapay zekâ destekli bu girişim, programlanabilir becerilere sahip olduğundan haber verilerini aktarmak ya da çalma listelerimizi ayarlamak gibi günlük hayatımızdaki birçok rutine adapte edilebiliyor.
Kasım 2019’da bu yapay zekâ asistanına yeni konuşma becerileri eklendiği duyurulmuştu. Alexa, yaratılan makine öğrenmesi modeli sayesinde artık gerçek zamanlı sesli haber verilerini analiz ederek konuşma stillerini öğrenebiliyordu. Bu sayede haberleri insan sesine daha yakın ve daha doğal bir formda aktarabilir hale getirilmişti. Buna ek olarak hayal kırıklığı ya da heyecan gibi duygular da ses özelliklerine eklenmişti.
Şimdiyse Amazon tarafından yapılan son açıklamayla beraber daha da doğal ve sezgisel bir ses deneyimi için geliştirilen 3 yeni özellik duyuruldu.
In this new blog post @muttonia explains how to implement location services in a #skill adapting the real-world geo-aware application #filaindiana to #Alexa: 👉 https://t.co/mwf4xcx8SC pic.twitter.com/kpJ6LWerDO
— Alexa Developers (@alexadevs) April 22, 2020
Bu üç özellikten ilki olan derin öğrenme (deep learning) destekli metin okuma modeli uzun konuşma formları için geliştirilen stili kapsıyor. Bu yeni özellikle birlikte Alexa tarafından seslendirilen veriler gerçeğe yakın konuşma duraklamalarıyla doğallaştırıldı. Ancak bu özellik şimdilik yalnızca Amerika Birleşik Devletleri kullanıcılarıyla paylaşılmış durumda. Normal konuşma formu ve öyküleyici konuşma formu örneklerini inceleyerek karşılaştırma yapabilirsiniz.
Alexa’nın normal (mevcut) konuşma stili
Alexa’nın yeni, öyküleyici konuşma stili
İkinci özellikse 29 dilde gerçekçi konuşma stilleri sunan Amazon Polly’nin ses özelliklerinin genişletilmesi oldu. Bu iyileştirmeyle sinir ağı tabanlı metin seslendirme hizmeti sunan Amazon Polly’den Matthew ve Joanna için de haber ve konuşma stilleri eklemesinin yanı sıra İspanyolca ses özelliklerini taşıyan Lupe’nin de haber aktarma formları eklenmesiyle geliştirildiği duyuruldu.
Son olarak konuşma becerisi özelliklerine 6 yeni dilde Amazon Polly sesleri eklenebildiği açıklandı. 6 yeni dildeki konuşma formu örneklerini de dinleyebilirsiniz.
- İspanyolca (ABD)
- İspanyolca (Meksika)
- Fransızca (Kanada)
- Portekizce (Brezilya)
- İspanyolca (İspanya)
- İtalyanca (İtalya)
Pandemi günlerinde içinde bulunduğumuz sosyal izolasyon sürecinde dijitalleşmeye ve bu alanda yapılan yeniliklere merakımızın artmasıyla beraber, gerçekleştiren yapay zekâ iyileştirmeleri bu girişimlerin sosyal hayatımızdaki etki alanını artırabilir gibi gözüküyor.
Kaynak: Amazon Alexa