Günümüzde bilgi akışını sağlayan en değerli kaynakların başında dijital veriler geliyor. Veri bilimi son yıllarda büyük bir sıçrama yaşayarak öylesine gelişip yaygınlaştı ki büyük şirketlerin tamamına yakını ilgilendikleri sektörde daha etkin adımlar atabilmek için kararlarını dijital verilerin ışığında almaya özen gösteriyor. Özellikle sosyal medya aracılığıyla uzaktan çalışan şirketler, reklam ve önerilerini dijital verilerden yararlanarak gerçekleştiriyor.

Peki, şirketler dijital verilerden nasıl yararlanıyor; dijital veriler onlar için “en iyiye” nasıl karar veriyor?

Algoritmalar Nasıl Çalışıyor?

Şirketlerin öncelikli hedefinin sosyal medya kullanıcılarının gördüğü her bir içeriğin maksimum potansiyeline ulaşması için optimize edilmesi olduğu söylenebilir. Her kullanıcının aynı içeriği görmesi şirketleri hedeften uzaklaştırıp verim kaybetmelerine sebep olabilir. Bunun yerine her kullanıcının kişisel tercihlerine bir diğer deyişle kişisel verilerine hitap edecek reklam ve önerilerle karşılaşması çok daha akıllıca bir strateji olarak görülüyor. Şirketlerin sosyal medyada dijital verilerden yararlanarak içerik üretmesi de tam olarak bu prensibe dayanıyor.

En çok reklam alan sosyal medya mecralarından biri olan Instagram’da her birimizin veri bilimine; dolayısıyla şirketlerin reklam stratejisine büyük katkı sağladığı söylenebilir. Bizler bir fotoğraf beğenirken, bir story (hikaye) izlerken; ya da son gönderilere hızlıca göz atarken Instagram ve birçok sosyal medya uygulamasının arka planında güçlü algoritmalar çalışıyor. Bu algoritmalar kullanıcıya uygun içeriği sunabilmek için farklı girdiler alıyor.

Algoritmalar; kullanıcının yaşı, genellikle etkileşimde bulunduğu içerikler ve hatta kullanıcının sosyal medyada ne sıklıkla aktif olduğu gibi özellikleri içerebiliyor. Algoritmik sistem, bu bilgileri kategorize ederek büyük veri kümelerine yeni girdiler olarak işliyor. Bu yöntemle platformun kullanıcı tabanında kalıplaştırılan çeşitli modellere dayanarak, çeşitli kullanıcı alt kümeleri hakkında tahminler yapılabiliyor.

Mesela araba severler, basketbol severler vb. alt kümeler için farklı sponsorlu içerikler üretilebiliyor. Bu sayede bir gruba yeni model arabalarla ilgili gönderiler sunulurken, diğer gruba NBA finalindeki güncel gelişmelerle ilgili içerikler gösterilebiliyor. Bu uygulamanın ardında analiz yöntemleri olarak nitelendirdiğimiz kavramlar geliyor.

Doğrusal ve Lojistik Analiz Yöntemleri

Bir kullanıcının herhangi bir içerikle ilgilenip ilgilenmeyeceğini belirlenmesi ise bir sınıflandırma problemi olarak adlandırılabilir ve bu sınıflandırma problemi iki ya da daha çok değişken arasındaki ilişkiyi ölçmeye dayanan regresyon analizi olarak düşünülebilir. Özetleyecek olursak sistem; bağımlı bir değişken ile bir veya birden çok bağımsız değişken arasındaki ilişkiyi bulmayı hedefliyor.

Bu bahsettiklerimizi somutlaştırmak gerekirse Instagram’da bir video oyunu tanıtımı beğendiğimizde sistem bizi bağımsız değişken olarak tanımlarken beğenilerimiz ya da yaş, aktiflik süresi gibi kişisel verilerimiz bağımlı değişkenler olarak tanımlıyor. Algoritmik veri sistemi tam olarak bu noktada bağımlı ve bağımsız değişken arasındaki ilişkiyi çözümleyip yeni alternatifler öneriyor.

Lojistik Regresyon Neden Daha İyi Bir Seçenek?

Tahmin yürütme sürecinde sanıldığı kadar verimli sonuçlar vermediği ortaya çıkana kadar son yıllara kadar doğrusal regresyon daha popüler bir tercihti. Ancak doğrusal regresyonun bulmaya çalıştığı olasılık, matematiğin doğası gereği 0 ve 1 arasında bir değer alıyor. Bir olayın gerçekleşeceğinden tüm dünya emin olsa bile o olayın gerçekleşme olasılığı %100’den %170’e çıkamaz ya da negatif değerlere inemez. Fakat doğrusal regresyonlar olasılığın sınırları dışında bir değeri tahmin etmekte kullanılıyor.

Ek olarak, doğrusal regresyonlar verilere “en uygun” çizgiyi belirlediğinden, sınıflandırmayla ilgili nihai karar, verilerdeki küçük değişikliklerle büyük sapmalar yaşayabilir. Uzun süre tekstil sektöründen içeriklerle ilgilenen bir kişinin, son dönemde telefon kabı aramasının ardından sık sık telefon kabıyla ilgili reklamlar görüyor olmasını bununla ilişkilendirebiliriz.

Lojistik regresyonlar ise daha fazla kategorik değişkenin olduğu regresyonlardır; olasılığı tahmin eder ve sınıflandırmayı belirlenen karar kuralına göre atar. Doğrusal regresyondan en belirgin farkı ve avantajı, olasılık sınırları içinde hesaplama yapıyor olmasıdır. Örneğin bir dondurma buzluktan çıkarılıp erimeye bırakıldığında, her şey sıvılaşana kadar erir ve erime hızı zamanla sıfırlanır. Lojistik regresyon erime hızının sıfırlandığı noktadan sonrasını hesaplamazken, doğrusal regresyon bu noktadan sonrası için negatif bir erime hızı tahmin edebilir.

Doğrusal ve Lojistik Regresyonun süreçleri değerlendirme prensipleri

Bu durum önerilecek içeriğin kişisel verilerle daha bağlantılı olması anlamına geliyor. Örneğin, sosyal medyada güneş gözlüğü arayan birine öncelikli olarak güneş gözlüğü önerileri yapılırken göz sağlığıyla ilgili ürünlere ikinci ya da üçüncü aşamada yer veriliyor. Bu sebeple son yıllarda popülaritesi artan ve yaygınlaşan lojistik regresyonlar doğrusal regresyonlardan daha mantıklı bir tercih olabilir.

“Aktivitelerinize bağlı olarak bunu seveceğinizi düşünüyoruz.” Peki ya neden?

Veri bilimi her geçen gün gelişen bir sektör; kullanılan yöntemlerin çeşitleniyor olması da “en iyiye” ulaşmanın giderek zorlaşmasından ve veri analistlerinin sınırları zorlamaktan keyif almasından kaynaklanıyor.

Bundan sonra Instagram’da karşınıza çıkan tanıtım ürünü içeriklerine bakarken, kendinizi bir anda Instagram algoritmalarının onu görmenizin ilgi çekici olacağına karar vermesinin ardındaki değişkenleri düşünürken bulabilirsiniz. Karşınıza çıkan reklamların tesadüf olmadığını, bireysel tercihlerinize göre kategorize edildiğiniz bir sınıfa sunuluyor olmasını bilmek şaşırtıcı olabilir.

Reklam ve önerilerin bile bireyselleştiği, kişisel verileriniz ışığında “özel olarak” sunulduğu bir çağda yaşıyoruz. Karşımıza çıkan her reklam ve ürün ve tanıtımında, “Acaba neyi beğendim?” ya da “Acaba ne izlemiştim?” sorusunu düşünmek ilginç bir sorgulama olacağa benziyor.

Bir diğer yandan uygulamaların algoritmalara tanıdığı geniş kapsamlı izinler siber güvenlik endişelerini ya da gizlilik ihlali gibi tartışmaları beraberinde getiriyor. Bu tartışmaların sonu gelmiş ya da içimize su serpecek bir açıklama yapılmış değil.

Algoritmalar tarafından sosyal medyada yakından takip ediliyoruz, hareketlerimiz analiz ediliyor, sınıflandırılıyor ve kişisel verilerimiz ticari şirketlere içerik önerisi olarak sunuluyor. Kişisel verilerimizin hiç tanımadığımız insanların eline geçmesi içerik önerilerinin ötesinde çok farklı sorunlara yol açabilir ve birçoğumuz bu durumlarla karşılaştığında nasıl adımlar atmamız gerektiğinin farkında olmayabiliriz.

Tüm bunları bilerek sosyal medyada eskisi kadar özgür hissedebilir miyiz soruna yanıt vermek bir hayli güç olsa da dijital dünyada tesadüfe yer olmadığı aşikâr.

Yazar: İpek Torunoğlu

Editör: İrem Karaduman

Kaynak: Medium-Towards Data Science

Share:

administrator

Bilkent Üniversitesi İşletme Fakültesi 3. sınıf öğrencisi olan İpek, organizasyonların çalışma yapılarını inceleyen projeler içinde yer almayı seviyor. Ayrıca yeni tarifler denemekten ve bunları paylaşmaktan büyük keyif alıyor. Paylaşmak demişken, Gelecek Burada'da hem kendisi öğreniyor hem de öğrendiklerini ve düşündüklerini çoğaltmak için yazıyor

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir