Hangi dilde olursa olsun herhangi bir metinde geçen sözcükler, kullanılma sıklığına göre sıralandığında oluşan listede her zaman geçerli bir kural vardır. Sıralama listesindeki sözcüklerin sıra numarası ile o sözcüğün sıklık sayısı sabit bir sayıdır. Bu durum ilk olarak dilbilimci George Kingsley Zipf tarafından fark edildiği için de günümüzde Zipf yasası olarak bilinmektedir.
Zipf yasası tahmin ettiğiniz gibi bir dil analizinden ortaya çıktı. George Zipf 1932 yılında yazdığı “Selected Studies of the Principle of Relative Frequency in Language” başlıklı makalesinde bu yasayı ortaya koydu. Hangi dilde olursa olsun, belli bir metindeki kelimelerin kullanım sıklığında bir desenin varlığından söz etti. Gözlemlerine göre, her kelimenin sıklığı, sıklık tablosundaki sıralamasıyla ters orantılıydı.
Bu yasaya göre herhangi bir yazılı metinde geçen sözcükler azalan sıklığa göre (yani en çok kullanılandan en az kullanılana doğru) sıralanırsa, N sırasında yer alan sözcük, o metinde 1/N defa tekrarlanmış oluyordu.
Zipf Yasası İle İlgili Bir Örnek
Diyelim ki sadece 10 sözcükten oluşan bir dil var. Bu dille kaleme alınmış metinde en sık kullanılan sözcük 100 defa kullanılmış. Bu durumda en sık kullanılan kelimeden en az kullanılan kelimeye göre yapılan bir sıralama listesi aşağıdaki gibi olacaktır.
1. sözcük => 100/1 = 100
2. sözcük => 100/2 = 50
3. sözcük => 100/3 = 33,3
4. sözcük => 100/4 = 25
5. sözcük => 100/5 = 20
6. sözcük => 100/6 = 16,6
7. sözcük => 100/7 = 14,3
8. sözcük => 100/8 = 12,5
9. sözcük => 100/9 = 11,1
10. sözcük => 100/10= 10
Bu ilginç olguya adını veren Profesör Zipf, James Joyce’un Ulysses adlı romanını incelediğinde yasanın geçerli olduğunu keşfetmişti. Sıralama listesindeki birinci sözcüğün 8.000 kez, onuncu sözcüğün 800 kez, yüzüncü sözcüğün 80 kez ve bininci sözcüğün sadece 8 kez kullanıldığını fark etmişti.
Daha sonra bu kuralı kontrol etmek için çalışmalar kuralın sadece kitaplarda değil, hemen hemen tüm dillerde geçerli olduğunu kanıtlayacaktı. Örnek vermek gerekirse İngilizcede “the” kelimesi yazılı her şeyin yaklaşık %6’sını oluşturur. Daha sonra da %3′ sıklıkla “of” kelimesi gelir. Bu ilk kelimenin yarısı kadardır. Bir sonraki “and” kelimesi de “the” kelimesinin yaklaşık 1/3’ü kadardır. Sonraki “a ” ise yaklaşık 1/4’ü kadardır ve bu biçimde devam etmektedir. Zipf yasası sadece İngilizce de geçerli değildi. Tüm diller ve hatta daha anlamını tam olarak çözemediğimiz antik diller bile bu yasaya uyuyordu.
Zipf Yasası, Sıra-sıklık Kuralı Olarak Da Bilinir
Sıra-sıklık kuralı adı ile de bildiğimiz bu kural, sadece dil ile ilgili yerlerde karşımıza çıkmaz. Bu da işi daha da kafa karıştırıcı bir hale sokar. Mesela 2004’te yapılan bir araştırmada, dünyadaki şehirleri nüfusa göre sıralandı. Bunun sonucunda da sıralamanın, yaklaşık olarak Zipf Yasası’na uyduğu ortaya çıktı. Bir ülkedeki en kalabalık şehrin nüfusu, yaklaşık olarak ikinci sıradaki şehrin nüfusunun iki katı kadar çıkıyordu.
İnternet siteleri aldıkları trafiğe göre, depremler büyüklüklerine göre, Ay’daki kraterler yarıçaplarına göre, şirketler gelirlerine göre, makaleler aldıkları atıfa göre sıralandıkları zaman da bu yasaya uyum gösteriyordu. Kısaca birbirine bağlı olarak sıralanabilen her şey bir biçimde Zipf Yasası’na uyuyordu. Ortak soru, peki ama neden oldu.
Neden Alakasız Şeyler Zipf Yasası ile Uyum Gösteriyor?
Nasıl oluyor da birbiri ile alakasız karmaşık yapılar bu kadar basit bir matematiksel yasaya uymaktadır? Kısa cevap tam olarak bilmiyoruz. 2017’de yapılan bir çalışmada Zipf yasasının bir metindeki cümlelerin yapısı (sözdizimi) ve kelimelerin anlamı (anlambilim) arasındaki etkileşimle açıklanabileceğini gösterdi. Sözdizim ve anlambilimin bunun için birbirine ‘ihtiyaç duyduğu’ ortaya çıktı. Ancak dilbilimciler bu konuda daha onay vermediler.
Bunca birbiri ile alakasız konunun ve karmaşık yapının kabaca da olsa bir yasaya uygun olmasının altında yatan nedene dair pek çok teori geliştirilmiştir. En popüler teoriler arasında istatistik bilimcilerinin teorileri ve insan zihninin yapısına atıf yapılarak üretilen teoriler olsa da üzerinde bilimsel uzlaşının sağlanmış olduğu bir teori henüz geliştirilmemiştir.
Yazının devamında ayrıca göz atmak isterseniz: Algılarımıza Bile Yön Veren Büyük Sayılar Yasası Nedir?
Kaynaklar ve İleri okumalar:
- The mystery of Zipf; Yayınlanma tarihi: 21 Ağustos 2008; Bağlantı: https://plus.maths.org/content/mystery-zipf
- Zipf’s law; Bağlantı: https://en.wikipedia.org/wiki/Zipf%27s_law
- A mysterious law that predicts the size of the world’s biggest cities. Yayınlanma traihi: 12 Eylül 2013; Bağlantı: https://gizmodo.com/
- Unzipping Zipf’s Law: Solution to a century-old linguistic problem. Yayınlanma tarihi: 10 Ağustos 2017; Bağlantı: https://phys.org/
Size Bir Mesajımız Var!
Matematiksel, 2015 yılından beri yayında olan ve Türkiye’de matematiğe karşı duyulan önyargıyı azaltmak ve ilgiyi arttırmak amacıyla kurulmuş bir platformdur. Sitemizde, öncelikli olarak matematik ile ilgili yazılar yer almaktadır. Ancak bilimin bütünsel yapısı itibari ile diğer bilim dalları ile ilgili konular da ilerleyen yıllarda sitemize dahil edilmiştir. Bu sitenin tek kazancı sizlere göstermek zorunda kaldığımız reklamlardır. Yüksek okunurluk düzeyine sahip bir web sitesi barındırmak ne yazık ki günümüzde oldukça masraflıdır. Bu konuda bizi anlayacağınızı umuyoruz. Ayrıca yazımızı paylaşarak veya Patreon üzerinden ufak bir bağış yaparak da büyümemize destek olabilirsiniz. Matematik ile kalalım, bilim ile kalalım.
Matematiksel
Yazılımda yaşıyoruz:) Benford yasası ile bu yasa kanıtı:)