Deepfake teknolojisi her geçen gün gerçekçiliğini artırarak endişelerin odağı olurken, bir yandan da sahte görüntülerin tespit edilebilmesi için çaba sarf ediliyor.
Deepfake Tespit Yarışması
Facebook, Microsoft ve Amazon Web Hizmetleri’nin düzenlediği Deepfake Tespit Yarışması, dünya çapında iş hayatı ve akademiden veri bilimcilerin katılımına açılan bir yarışma.
Yapay zekâ tarafından oluşturulan Deepfake, yani sahte görüntülerin yine yapay zekâ tarafından tespit edilmesini sağlayacak algoritmaların geliştirilmesini teşvik etmek adına, Facebook 100 bin farklı deepfake örneği içeren bir veri setini ücretsiz olarak erişime açmıştı. Kaggle adlı platform üzerinden yürütülen bu yarışma, geçtiğimiz senenin Ekim ayında başladı ve bu Mart ayında sona erdi. 2114 katılımcının 35 bine yakın model ile katılım gösterdiği yarışmanın kazananı, Mapbox isimli bir şirkette makine öğrenmesi üzerine çalışan bir mühendis olan Selim Seferbekov oldu. Geliştirdiği model, 10 bin farklı görsel klibinden oluşan bir test setinde denendiğinde %65 doğruluk oranı elde edildi.
Yarışmada doğruluk oranı eğitim veri setinde %80’lere çıkan modeller, 10 bin yeni klipten oluşan test veri setlerinde aynı doğruluk yüzdelerini koruyamadı.
Bu durum önemli bir makine öğrenmesi terimi olan Aşırı Öğrenme (Overfitting) ile açıklanabilir. En basit haliyle, sınavda çalışmadığınız yerden gelen soru olarak özetleyebiliriz. Okulda öğretmenlerimizin sınavlara hazırlanırken, örnek soruları ezberlemenin sınavda yeni sorularla karşılaşıldığında başarı getirmeyebileceğini anlattığı günlere dönelim. Elimizdeki ders notları ve örnek sorular, tüm konuların %80’ini kapsıyorsa, elimizdekini mükemmel bir şekilde ezberlemek ve yalnızca bu bilgilere dayanan bir birikim edinmek, sınavda yepyeni bakış açıları gerektiren %20’lik bir kısımla karşılaştığımızda yanlış cevapları kaçınılmaz kılacaktır.
Bu yarışma özelinde, işleri daha da zorlaştırmak ve gerçek hayat örneklerini olabildiğince modellere dahil edebilmek için eğitim ve test veri setlerinde, deepfake tanıma sistemlerinin zorlanacağı kliplere yer verilmiş. Bunlar temelde makyaj videoları, kişilerin yüzleri üzerinde beliren metinler ve şekiller içeren klipler, çözünürlüğü ve yatay/dikey ekran durumu akışta değişen klipler ve hızı yavaşlatılmış videolar şeklinde özetlenebilir.
Model geliştirmede, ilk sıradaki yarışmacılar yeni bir Evrişimli Sinir Ağı (CNN – Convolutional Neural Networks) türü olan EfficientNets‘i kullandı. Geçtiğimiz yıl Google araştırmacıları tarafından geliştirilen bu yeni yöntem, CNN’den farklı olarak insan müdahalesini minimuma indirerek daha genellenebilen çalışmalar ortaya konulmasını ve daha yüksek doğruluk oranları elde edilmesini sağlıyor. Daha detaylı okuma yapmak isterseniz, sizi buraya alalım.
Yarışmanın sonucu nedir?
Facebook, bu yarışma sürecinde geliştirilen modelleri platformlarında uygulamaya geçirmeyeceğini duyurdu. Bu noktaya kadar okuduklarınızdan heyecanlandıysanız, bu haber biraz hayal kırıklığı yaratabilir. Ancak Facebook, otomatik bir Deepfake tanıma sisteminin devreye alınması için %65 gibi bir doğruluk oranının çok düşük olduğunu vurguluyor.
Yarışmanın kazananı Seferbekov, en kaliteli deepfake kliplerinde bile görsel geçişlerinde titremeler oluştuğunu ve böylece insan gözünün doğal olmayan hareketleri kolaylıkla yakalayabildiğini vurguluyor. İnsanların hızlı ve kolayca tespit edebildiği bu hareketlerin otomatik olarak yakalanabilmesi için, eğitim veri setlerinin hacminin ciddi şekilde artırılması ve içeriğin çeşitlendirilmesi gerektiğini ekliyor. Okul örneğimize dönersek, sınavda çıkabilecek her soruya cevap verebilmek için, öncesinde var olan her farklı soru tipiyle karşılaşmış olmak gerekli.
Bizi neler bekliyor?
Deepfake ile üretilen sahte görüntülerin, siyasi çekişmelerde rakiplerin birbirini karalamak için kullanılabilir olması, sosyal medyada kontrolsüz yayılabilecek bilgi kirliliği ile kitlelerin doğru haberlere ulaşımının engellenmesi gibi endişeler artıyor.
Oldukça rahatsız edici bir başka konu ise, rastgele insanların yüzünün Deepfake ile pornografik içeriklerde izinsiz kullanılması.
Şu an için Deepfake görüntüler büyük ölçüde insan gözüyle ayırt edilebiliyor, ancak bu durum yakın gelecekte değişecek gibi gözüküyor. Bu noktada, yukarıda bahsettiğimiz otomatik tanıma sistemlerinin devreye girmesini bekleeceğiz. Facebook’un önerdiği üzere, yalnızca sayısal görüntü işleme teknikleri ile değil, ayrıca paylaşıldığı mecra, içerdiği metnin bağlamı ve gösterilen kaynağın güvenirliği gibi değişkenlerin kullanılması ile de süreç iyileştirilebilir.
Kaynak: MIT Tech Review