Open AI’ın 2021 yılının Ocak ayında erişime açtığı DALL·E projesi daha güçlü anlama ve daha yüksek çözünürlük özellikleriyle DALL·E 2’ye evrildi. DALL·E 2, kelimelerle tasvir edilenleri istenilen sanat türünde resme dökebilen bir yapay zekâ. 

Resimler ile metinlerin ilişkisini bilen DALL·E 2, difüzyon isimli bir yöntem kullanıyor. Resim, difüzyon ile rastgele piksellerle renkleniyor ve pikseller renk değiştirerek kısa süre içinde tasvir edilen resme dönüşüyor. DALL·E 2’nin yapay zekâsı NLP (Natural Language Processing) yani Doğal Dil İşleme isimli yöntemle metinleri algıladıktan sonra veri tabanındaki resimler arasında bağlantı kurma becerisine sahip olduğu için resim çizebiliyor. 

DALL·E 2: Var Olmayan Bir Resmi Oluşturmak

DALL·E 2, Andy Warhol’un çizim tarzında ata binen astronot tanımını görselleştirmiş.
DALL·E 2, denizin altında 1990’lerdeki teknolojiyle yapay zekâ araştırması yapan ayıcıklar tanımını görselleştirmiş.
DALL·E 2 yünden örülmüş canavar görünümlü çorba tanımını görselleştirmiş.

DALL·E 2: In Painting (İçeriyi Boyama)

DALL·E 2 in painting (içeriyi boyama) özelliğiyle yüklenilen resmi; gölgeleri, yansımaları ve dokuları göz önünde bulundurarak değiştirebiliyor.

Evin orijinal hâli:

Evin orijinal hâli DALL·E 2’ye verilmiş.

Evin farklı yerlerine flamingo eklenmiş hâlleri:

DALL·E 2 yere flamingo eklemiş.
DALL·E 2 havuza flamingo eklemiş.

DALL·E 2: İlham Alma

DALL·E 2 kendisine verilen bir resmin orijinalinden esinlenerek farklı versiyonlarını oluşturabiliyor.

Orijinal resim:

Orijinal İnci Küpeli Kız resmi DALL·E 2’ye verilmiş.

Resmin Değiştirilmiş Hâlleri:

DALL·E 2 İnci Küpeli Kız resmini yorumlamış.

DALL·E 2 İnci Küpeli Kız resmini yorumlamış.

Teknik Açıdan DALL·E 2

Bu yapay zekânın çalışmasında birçok farklı sistem görev alıyor. Örneğin derin öğrenme ile kendisine verilen resimlerin içeriğine dair fikirler edinip onları veri tabanında gruplara ayırıyor. Diyelim ki tramplenden atlayan bir ayı görmek istiyorsunuz. Bu cümleyi DALL·E 2’nin sistemine girdiğinizde ayı veri kümesi ile tramplen veri kümesini yapay nöral ağında birleştiren DALL·E 2 size istediğiniz resmi verebiliyor. Dolayısıyla sistem resim çizebilmenin yanı sıra iki farklı veri kümesinin birbirleriyle etkileşimini inceleyebilme özelliğine de sahip oluyor.

DALL·E 2’nin Çıktıları

  1. İnsanların daha önceden çizerek anlatamayacakları şeyleri görselleştirmek konusunda yardımcı olur. 
  2. Yapay zekânın insanları gerçekten anladığını mı yoksa kendisine verileni taklit mi ettiğini gösterir. 
  3. Yapay zekânın dünyayı anlama şekliyle ilgili bilgi verdiği için güvenli ve verimli teknolojiyi sağlar. 

DALL·E 2’nin Hata Payı

Her yapay zekâda olduğu gibi DALL·E 2’de yanlış veriyle beslenirse yanlış çıktılar gösterebilir. Örneğin kedilerin adına köpek denerek beslenen bir veri kümesi oluşursa kedi resmi istendiğinde köpek çizimi verecektir. Her veri işlemede karşılaşılabilecek bu problem DALL·E 2’de de yaşanabilir. 

Aynı şekilde, henüz öğrenmediği bir kelime veya kelime öbeği tasvir edilirse yapay zekâ tanımın ne anlama geldiğini düşünüyorsa, veri kümesindeki hangi kelimelerle daha çok eşleştiriyorsa onun resmini yansıtacaktır. 

Vedalaşırken

Son zamanlardaki en heyecan verici gelişmelerden olan DALL·E 2’nin insanların yaratıcı potansiyelini vurgulaması öngörülüyor. Bunula birlikte insan ve yapay zekâ birlikteliği için önemli bir adım olduğu düşünülüyor. DALL·E 1’den bir yıl sonra bile bu kadar gelişmeyi başaran sistem, yeni gelişmelerin anahtarını tutuyor.

Kaynak: Open AI DALL·E 2

Share:

Robert Kolej’de 9. sınıf öğrencisi olan Melis tiyatro ve hikaye anlatıcılığıyla ilgileniyor. İnsan haklarının ve şiddetsiz iletişimin gücüne inanan Melis sosyal girişimcilik, tasarım odaklı düşünme ve sürdürülebilir kalkınma hedefleri üzerine çalışmayı seviyor. Geleceğin nerede olduğunu araştırıyor.