Netflix ve Diğerleri Geometri Yardımıyla Sevdiğiniz Filmleri Nasıl Tahmin Eder?

Farklı kategorilerde filmleri seven üç kişiyi ele alalım. A kişisi, Marvel yapımlarını beğeniyle takip eden bir sinemasever. Favori filmleri: Hulk, Thor ve Kara Panter… B kişisi daha çok animasyon filmleri seviyor: Inside Out (Ters Yüz), The Incredibles (İnanılmaz Aile)… C kişisinin ise tercihleri genelde gerilim filmlerinden yana: Get Out (Kapan), The Shining (Cinnet)…

Peki hangisinin film zevki sizinkine yakın? A? B? C? Ya da diğer ikisine ne kadar uzaksınız?

Burada “Ne kadar uzak?” sorusu garip gelebilir. Her şeyden önce bu ifade mesafe ile ilgili.

İş filmlere gelince, mesafe ne demektir? Nasıl ölçülür?

Bu garip, bir o kadar saçma görünen soruyu Netflix gibi şirketler sorar ve cevap ararlar. Bu şirketler, izleme verilerinizi takip ederek komedi, romantik, belgesel, gerilim veya başka bir film türüne karşı olan ilginizi ölçer ve kendi veritabanlarındaki izleyici kitlesindeki yerinizi belirlerler.

Ardından bu soyut alanda size komşu olan kimseleri belirleyerek sizlere izlemeniz için önerilerde bulunurlar. Bu tür tahmine dayalı motorlar söz konusu olduğunda, karmaşık veri setlerini anlama, sınıflandırma ve analiz etmede kimin kime en yakın olduğunu bilmek önemlidir. Bunun için lisede öğrendiğimiz basit geometri bilgileri devreye giriyor.

Şimdi düzlemde A ve B kişilerini düşünelim:

Şimdi A’ya mı yoksa B’ye mi daha yakın olduğumuzu anlamak adına A ve B noktaları arasındaki doğru parçasını çizip A ve B merkezli yayları kullanarak AB doğru parçasının orta dikmesini çizelim.

Orta dikmeler ile ilgili en önemli teoreme göre, orta dikme üzerinde alınan herhangi bir nokta A ve B noktalarına eşit uzaklıktadır. Orta dikme üzerinde alınan Q noktası düşünelim. QAB üçgeninde Q noktasından indirilen dikme AB kenarını iki eşit parçaya ayırdığı için QAB ikizkenar üçgendir. Dolayısıyla |QA|=|QB| dir. Yani Q kişisi A ve B ye eşit uzaklıktadır.

Şimdi de orta dikme üzerinde olmayan bir Y noktası düşünelim.

Y noktasının A ve B ye eşit uzaklıkta olmadığı aşikar… Hatta dahasını da söyleyebiliriz: Y noktası B ye daha yakın. Geometrik olarak bunu göstermek için YA ve YB doğru parçalarını çizelim.

YA doğru parçası ile orta dikmenin kesiştiği nokta I olsun.

I noktası orta dikme üzerinde olduğu için az evvel sözünü ettiğimiz teorem gereğince |IA|=|IB| dir. O halde,

|YA|=|AI|+|IY|=|IB|+|IY|

Üçgen eşitsizliğine göre; bir üçgende bir kenarın uzunluğu, diğer iki kenarın toplam uzunluğundan küçüktür. Yani IYB üçgeninde,

|YB|< |IB|+|IY|

O halde |YB|<|YA| dır.

Genel olarak; orta dikmenin sağındaki noktalara B ye, solundaki noktalar da A ya yakın diyebiliriz.

Bu yöntem 2 den fazla nokta için de geçerlidir. Örneğin C kişisini ekleyelim.

AB doğru parçasının orta dikmesini çizelim.

C noktası orta dikmenin solunda olduğu için A ya daha yakın. Şimdi de AC nin orta dikmesini çizelim.

B noktası A ya göre C ye daha yakın.

BC nin orta dikmesini çizince işler ilginç bir hal alıyor.

Dikkat edersek, üç tane orta dikme aynı noktada kesişiyorlar. Bu noktaya O noktası dersek, |OA|=|OB|=|OC| diyebiliriz. Biraz da bu üç orta dikmenin ortaya çıkardığı bölgeleri inceleyelim.

Kırmızı bölgedeki noktaları düşünürsek, AB orta dikmesinin sağında oldukları için B ye daha yakınlar. Öte yandan, BC orta dikmesinin üstünde oldukları için C ye daha yakınlar. O halde bu bölgedeki noktalara en yakın olanı C noktası!

Benzer şeyleri aşağıdaki diyagram için de söyleyebiliriz.

Sarı bölgedeki noktalar A ya, mavi bölgedekiler B ye ve kırmızı bölgedekiler C ye yakın.

P noktasında konumlandırıldığınızı düşünün. En yakın komşunuz A kişisi olduğu için onun sevdiği filmlerin size önerilmesi isabetli bir hamle olacaktır.

Bu geometrik yaklaşım daha fazla boyutta veya daha fazla nokta için de söz konusudur. Değişen tek şey, orta dikmenin kendisidir. Çünkü boyutları artırırsak orta dikme artık bir doğru değil, bir düzlem olacaktır.

Veriler arttıkça haliyle hesaplamalar da zorlaşır. Daha fazla boyuta sahip olmak, her veri noktası için daha fazla koordinat anlamına gelir. Bu daha karmaşık mesafe hesaplamaları anlamına gelir. Örneğin 3 nokta için 3 tane orta dikme çizilirken, 100 nokta için yaklaşık 5000 tane orta dikme çizmek gerekiyor.

Dolayısıyla milyonlarca noktadan oluşan bir veri setini bu şekilde el yordamıyla analiz etmek neredeyse imkansızdır. Bunun için matematikçiler ve bilgisayar bilimciler bu konu ile ilgili algoritmalar geliştirdiler.

Şevket ÜNCÜ

Matematiksel

Kaynak: https://www.quantamagazine.org/how-geometry-data-and-neighbors-predict-your-favorite-movies-20190522/

Matematiksel

Hazırlayan: Şevket Üncü

Avatar
uncusevket@gmail.com

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

This site uses Akismet to reduce spam. Learn how your comment data is processed.