MATEMATİK HER YERDE

Sayılarla Uğraştığımız Her Alanda Karşımıza Çıkan Bir Örüntü: Benford Yasası

Bizi ve dünyayı birbirine bağlayan, dünyayı bambaşka görmemizi sağlayan bazı matematiksel bağlantılar vardır. Bunlardan bir tanesi de Benford yasası…

Sayısal veriler içeren bir listeye bakar ve belirli bir rakamın her girdinin ilk hanesi olarak ne sıklıkla görüldüğünü sayarsanız sizi ilginç bir sonuç bekliyor. Normal koşullarda böyle bir sayma işlemi yapmadan her rakamın görülme ihtimalinin diğerleri ile aynı olduğunu düşünebilirsiniz. Ne var ki çoğu veri türü için bu düşüncenin yanlış olduğunu biliyoruz.

Benford Yasası Nedir?

Aslında bu ilginç dağılım ilk olarak 1881 yılında Amerikalı bir gökbilimci olan Simon Newcomb tarafından fark edildi. Newcomb araştırmaları için logaritmik tablolar içeren bir kitabı incelerken, baş hanesi 1 olan sayıların sayfalarının, 9 olan sayıların sayfalarından daha fazla yıpranmış olduğu gözlemledi. Bazı nedenlerden dolayı, insanlar sürekli olarak belirli sayıları diğerlerinden daha sık arıyor gibiydi.

Yaklaşık 50 yıl bu gözlemle ilgili pek bir çalışma yapılmadı. Daha sonra General Electric’de bir mühendis olan Frank Benford, atom ağırlıkları, nüfus sayımları, maliyet verileri gibi ele aldığı her veri kümesinde aynı sonuçla karşılaştı.

Benford’un çalışmasının sonuçları

Benford araştırmasında, 20.000’den fazla gözlemden oluşan bir veri kümesinde 1’den 9’a kadar olan doğal sayıların gerçekleşme yüzdesini analiz etti. Sonucunda ilk rakamın belirli bir değeri alma olasılığının 1’den 9’a doğru rakam arttıkça azaldığını ortaya koydu.

Benford bulduğu formüle Anormal Sayılar Kanunu adını verdi ancak bugünlerde adı sadece Benford Yasası olarak biliniyor.

Matematiksel olarak ifade etmek gerekirse, d’nin ilk basamağının gözlemleme olasılığı log10 (1 + 1 / d) biçiminde oluyordu. Bu, ilk basamakta 1 görülme olasılığını % 30 civarında yapar ve 9’un görülme ise kabaca % 4,6 kadardır. Diğer basamaklar aşağıdaki görseldeki gibi bir dağılım gösterirler.

Benford yasasına göre kuramsal sıklıklar

Konu üzerinde yapılan çalışmalar arttıkça Benford yasasının elektrik faturaları, sokak adresleri, hisse senedi fiyatları, nüfus, ölüm oranları, nehir uzunlukları, galaksilerin uzaklıkları gibi çok çeşitli veri kümelerinin hepsinde geçerli olduğu gösterilmiştir. Fenomen 1995 yılında, Theodore P. Hill tarafından tekrar incelendi. Benford Yasasını izleyen veri serilerindeki sayıların aslında “ikinci nesil” dağıtımlar olduğu, yani diğer dağıtımların kombinasyonları olduğu ortaya konuldu.

Pratikte Uygulamalar

Benford yasasının pratik kullanımlarından biri dolandırıcılık ve hata tespitidir. Büyük bir veri kümesindeki rakamların bu kalıba uygunluğunu araştırmak, herhangi bir işlem verisindeki dolandırıcılığı, hataları ve uydurmayı tespit etmek için denetim tekniği olarak kullanılır.

Bu matematiksel ilişki kendine gerçekten ilginç kullanım alanları bulabiliyor. Örneğin yasa, 2001 yılında Yunanistan’ın ekonomik verilerini incelemek için kullanıldı ve ülkenin Avrupa Birliği’ne katılmak için sayıları manipüle etmiş olabileceği anlaşıldı.

Günümüzde bu yasa sahte haber ve görüntüleri tespit etmek için de kendine bir kullanım alanı bulmuş durumda. Dijital fotoğraflar da temelde sayılardan oluşur ve bu görüntüleri kurcalarsanız bu sayılar Benford yasasına uygunluklarını yitirir.

Yakın zamanda yapılan çalışmalarda da, Benford yasası sayesinde COVID-19 vakalarının ve ölümlerinin doğru biçimde raporlanıp raporlanmadığı kontrol ediliyor. Çalışmanın sonuçlarına göre de ABD, Japonya, Endonezya ve çoğu Avrupa ülkesinin kümülatif enfeksiyon ve ölüm kayıtlarının yasalara iyi bir şekilde uyduğu bilgisine erişildi. Ancak bu her ülke için geçerli değildi. Analiz edilen birkaç ülkeden alınan rakamlar anormallikleri ortaya koyuyordu.

Kaynak: http://jupiter.ethz.ch/~ajackson/benford.pdf

Günümüzden 150 yıl önce bir adamın bir kütüphane kitabında fark ettiği basit bir gözlem günümüzde tüm evrenimize uygulanabilir durumda. Yaşamlarımızdaki kaosta, tesadüflerde ve zorlukta kimsenin tam olarak nedenini bilmediği matematiksel bir düzen var gibi gözüküyor.

Vergi sahtekarlıkları, oy verileri, twitter tweetleri, coğrafi yer şekilleri, gezegenlerin dizilişi hepimiz, her şey bir biçimde bu basit eğriye uyuyoruz gibi gözüküyor.

Yakın zamanda Netflix’te yayınlanan Connected adlı belgesel serisinin Rakamlar isimli bölümü de bu yasayı keyifli bir biçimde ilginç örnekler üzerinden ele alıyor. İmkanı olanların izlemesini öneririz.

Okuma Önerisi:


Kaynaklar: National COVID numbers — Benford’s law looks for errors; https://www.nature.com/articles/d41586-020-01565-5

How a simple observation from the 1800s about patterns in big data sets can fight fraud; https://theconversation.com/how-a-simple-observation-from-the-1800s-about-patterns-in-big-data-sets-can-fight-fraud-42683

National COVID numbers — Benford’s law looks for errors; https://www.nature.com/articles/d41586-020-01565-5

Hubble’s Law Implies Benford’s Law for Distances to Galaxies; https://arxiv.org/abs/1412.1536

Matematiksel

Sibel Çağlar

Kadıköy Anadolu Lisesi, Marmara Üniversitesi, ardından uzun süre özel sektörde matematik öğretmenliği, eğitim koordinatörlüğü diye uzar gider özgeçmişim… Önemli olan katedilen değil, biriktirdiklerimiz ve aktarabildiklerimizdir bizden sonra gelenlere... Eğitim sisteminin içinde bulunduğu çıkmazı yıllarca iliklerimde hissettikten sonra, peki ama ne yapabilirim düşüncesiyle bu web sitesini kurmaya karar verdim. Amacım bilime ilgiyi arttırmak, bilimin özellikle matematiğin zihin açıcı yönünü açığa koymaktı. Yolumuz daha uzun ve zorlu ancak en azından deniyoruz.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu