Matematik Ne İşe Yarar?

Yaşamın İçinde Bir Gizem: Zipf Yasası ve Sıra Sıklık Kuralı

Hangi dilde olursa olsun herhangi bir metinde geçen sözcükler, kullanılma sıklığına göre sıralandığında oluşan listede her zaman geçerli bir kural vardır. Sıralama listesindeki sözcüklerin sıra numarası ile o sözcüğün sıklık sayısı sabit bir sayıdır. Bu durum ilk olarak dilbilimci George Kingsley Zipf tarafından fark edildiği için de günümüzde Zipf yasası olarak bilinmektedir.

George Zipf (1902-1950

Zipf yasası tahmin ettiğiniz gibi bir dil analizinden ortaya çıktı. George Zipf 1932 yılında yazdığı “Selected Studies of the Principle of Relative Frequency in Language” başlıklı makalesinde bu yasayı ortaya koydu. Hangi dilde olursa olsun, belli bir metindeki kelimelerin kullanım sıklığında bir desenin varlığından söz etti. Gözlemlerine göre, her kelimenin sıklığı, sıklık tablosundaki sıralamasıyla ters orantılıydı.

Bu yasaya göre herhangi bir yazılı metinde geçen sözcükler azalan sıklığa göre (yani en çok kullanılandan en az kullanılana doğru) sıralanırsa, N sırasında yer alan sözcük, o metinde 1/N defa tekrarlanmış oluyordu.

Zipf Yasası İle İlgili Bir Örnek

Diyelim ki sadece 10 sözcükten oluşan bir dil var. Bu dille kaleme alınmış metinde en sık kullanılan sözcük 100 defa kullanılmış. Bu durumda en sık kullanılan kelimeden en az kullanılan kelimeye göre yapılan bir sıralama listesi aşağıdaki gibi olacaktır.

1. sözcük => 100/1 = 100
2. sözcük => 100/2 = 50
3. sözcük => 100/3 = 33,3
4. sözcük => 100/4 = 25
5. sözcük => 100/5 = 20
6. sözcük => 100/6 = 16,6
7. sözcük => 100/7 = 14,3
8. sözcük => 100/8 = 12,5
9. sözcük => 100/9 = 11,1
10. sözcük => 100/10= 10

Bu ilginç olguya adını veren Profesör Zipf, James Joyce’un Ulysses adlı romanını incelediğinde yasanın geçerli olduğunu keşfetmişti. Sıralama listesindeki birinci sözcüğün 8.000 kez, onuncu sözcüğün 800 kez, yüzüncü sözcüğün 80 kez ve bininci sözcüğün sadece 8 kez kullanıldığını fark etmişti.

Görselde James Joyce’un “Ulyses” adlı İngilizce romanının ana metinindeki sözcüklerin sıklılıklarının sıralanması yer alıyor.

Daha sonra bu kuralı kontrol etmek için çalışmalar kuralın sadece kitaplarda değil, hemen hemen tüm dillerde geçerli olduğunu kanıtlayacaktı. Örnek vermek gerekirse İngilizcede “the” kelimesi yazılı her şeyin yaklaşık %6’sını oluşturur. Daha sonra da %3′ sıklıkla “of” kelimesi gelir. Bu ilk kelimenin yarısı kadardır. Bir sonraki “and” kelimesi de “the” kelimesinin yaklaşık 1/3’ü kadardır. Sonraki “a ” ise yaklaşık 1/4’ü kadardır ve bu biçimde devam etmektedir. Zipf yasası sadece İngilizce de geçerli değildi. Tüm diller ve hatta daha anlamını tam olarak çözemediğimiz antik diller bile bu yasaya uyuyordu.

Zipf Yasası, Sıra-sıklık Kuralı Olarak Da Bilinir

Zipf yasasının şehirlerin nüfusu ile uyumlu olmasının nedeni de aslında tam olarak bilinmiyor. Ancak araştırmacılar bu yasanın ekonomi ile ilişkili olduğunu öne sürüyor. Çünkü yalnızca bir ülkedeki şehirler gibi ekonomik olarak birbirine bağlı şehirleri karşılaştırırsanız yasa işe yarıyor.

Sıra-sıklık kuralı adı ile de bildiğimiz bu kural, sadece dil ile ilgili yerlerde karşımıza çıkmaz. Bu da işi daha da kafa karıştırıcı bir hale sokar. Mesela 2004’te yapılan bir araştırmada, dünyadaki şehirleri nüfusa göre sıralandı. Bunun sonucunda da sıralamanın, yaklaşık olarak Zipf Yasası’na uyduğu ortaya çıktı. Bir ülkedeki en kalabalık şehrin nüfusu, yaklaşık olarak ikinci sıradaki şehrin nüfusunun iki katı kadar çıkıyordu.

İnternet siteleri aldıkları trafiğe göre, depremler büyüklüklerine göre, Ay’daki kraterler yarıçaplarına göre, şirketler gelirlerine göre, makaleler aldıkları atıfa göre sıralandıkları zaman da bu yasaya uyum gösteriyordu. Kısaca birbirine bağlı olarak sıralanabilen her şey bir biçimde Zipf Yasası’na uyuyordu. Ortak soru, peki ama neden oldu.

Neden Alakasız Şeyler Zipf Yasası ile Uyum Gösteriyor?

Nasıl oluyor da birbiri ile alakasız karmaşık yapılar bu kadar basit bir matematiksel yasaya uymaktadır? Kısa cevap tam olarak bilmiyoruz. 2017’de yapılan bir çalışmada Zipf yasasının bir metindeki cümlelerin yapısı (sözdizimi) ve kelimelerin anlamı (anlambilim) arasındaki etkileşimle açıklanabileceğini gösterdi. Sözdizim ve anlambilimin bunun için birbirine ‘ihtiyaç duyduğu’ ortaya çıktı. Ancak dilbilimciler bu konuda daha onay vermediler.

Bunca birbiri ile alakasız konunun ve karmaşık yapının kabaca da olsa bir yasaya uygun olmasının altında yatan nedene dair pek çok teori geliştirilmiştir. En popüler teoriler arasında istatistik bilimcilerinin teorileri ve insan zihninin yapısına atıf yapılarak üretilen teoriler olsa da üzerinde bilimsel uzlaşının sağlanmış olduğu bir teori henüz geliştirilmemiştir.

Yazının devamında ayrıca göz atmak isterseniz: Algılarımıza Bile Yön Veren Büyük Sayılar Yasası Nedir?


Kaynaklar ve İleri okumalar:


Size Bir Mesajımız Var!

Matematiksel, 2015 yılından beri yayında olan ve Türkiye’de matematiğe karşı duyulan önyargıyı azaltmak ve ilgiyi arttırmak amacıyla kurulmuş bir platformdur. Sitemizde, öncelikli olarak matematik ile ilgili yazılar yer almaktadır. Ancak bilimin bütünsel yapısı itibari ile diğer bilim dalları ile ilgili konular da ilerleyen yıllarda sitemize dahil edilmiştir. Bu sitenin tek kazancı sizlere göstermek zorunda kaldığımız reklamlardır. Yüksek okunurluk düzeyine sahip bir web sitesi barındırmak ne yazık ki günümüzde oldukça masraflıdır. Bu konuda bizi anlayacağınızı umuyoruz. Ayrıca yazımızı paylaşarak veya Patreon üzerinden ufak bir bağış yaparak da büyümemize destek olabilirsiniz. Matematik ile kalalım, bilim ile kalalım.

Matematiksel

Sibel Çağlar

Merhabalar. Matematik öğretmeni olarak başladığım hayatıma 2016 yılında kurduğum matematiksel.org web sitesinde içerikler üreterek devam ediyorum. Matematiğin aydınlık yüzünü paylaşıyorum. Amacım matematiğin hayattan kopuk olmadığını kanıtlamaktı. Devamında ekip arkadaşlarımın da dahil olması ile kocaman bir aile olduk. Amacımıza da kısmen ulaştık. Yolumuz daha uzun ama kesinlikle çok keyifli.

Bir Yorum

  1. Yazılımda yaşıyoruz:) Benford yasası ile bu yasa kanıtı:)

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu