Özellikle hastalıkları tespit etmek için derin öğrenme sistemlerini kullanmak tıptaki en önemli uygulamalardan biri oldu. Lancet Digital Health’teki araştırmacılar Ocak 2012 ile Haziran 2019 arasındaki tüm çalışmaların ilk sistematik incelemesini ve meta-analizini gerçekleştirerek, derin öğrenme modellerinin hastalıkları tıbbi görüntüleme yoluyla tespit etme becerisini, sağlık profesyonellerinin sonuçlarıyla karşılaştırdı.
Bu konuyla ilgili yaklaşık 20.500 makale bulunuyor ancak bu makalelerin sadece %1’inden azı bilimsel olarak güvenilir sonuçlar teşkil ediyor. Bununla birlikte, araştırmacılar en güvenilir 14 çalışmanın verilerini bir araya getirdiğinde, sağlık uzmanları için %86’ya kıyasla, derin öğrenme sistemlerinin vakaların %87’sinde hastalığı doğru tespit ettiğini gördü.
Çalışmanın sonuçları AI için genel olarak olumlu fakat çalışmanın tasarımı oldukça önemli. Sonuçlar kolayca çarpıtılabilir ya da çarpıtılan veriler sisteme kolayca tanıtılabilir. Bu düşünceler AI araçları için abartılı iyi performans iddialarına yol açabiliyor. Araştırmacılar bu tarz karşılaştırmalı çalışmalarda karşılaştırmanın hâlâ tamamen gerçekçi olmadığını vurguluyor.
Araştırmada belki de tüm bunlardan daha önemli olan hasta sonuçları ölçülmedi. AI algoritmalarının, hasta sonuçlarını nasıl değiştireceğine dair kanıtların rastgele kontrollü çalışmalarda alternatif tanı testleriyle kıyaslaması gerekiyor. Herhangi bir AI algoritması tarafından verilen tanı kararlarının tedavi, hastaneden taburcu olma süresi ve hatta hayatta kalma oranları gibi hastalar için önemli olan sonuçlara erişme denemeleri pek mümkün değil. Derin öğrenme tıbbi tanıda büyük bir potansiyele sahip olsa da elde edilen verileri test etmek için standartlaştırılmış ve titiz yaklaşımların olması gerekiyor.
Kaynak: singularityhub