Olasılık ve İstatistik

Algılarımıza Bile Yön Veren Büyük Sayılar Kanunu

Her bilim dalının kendine özgü kanunları, teoremleri, ilkeleri vardır. İstatistik bilimi, disiplinler arası uygulamalı bir dal. Gücü de zaten buradan geliyor. Bir yandan Kolmogorov’un (1903 – 1987) çığır açan olasılık aksiyomları ile istatistik, matematik bilimine ait gibidir. Ayrıca olabilirlik, tutarlılık, tamlık, yeterlilik ve değişmezlik gibi kendi ilkelerine sahiptir. Bir yandan da hipotez testleri ışığında çıkarımsal istatistik ile diğer uygulamalı bilimlere yön verir. İşte istatistik biliminin eşsiz güzelliğini gözler önüne seren ise büyük sayılar kanunudur. Yazıya geçmeden önce sıklıkla karşımıza çıkan kanun ve teorem kavramları arasındaki farka değinmek isterim. Okuma Önerisi: Çok Yönlü Bir Bilim İnsanı: Andrei Nikolaevich Kolmogorov

Kanun ve Teorem Arasındaki Fark Nedir?

Sözlük anlamlarına göre kanun, doğada gerçekleşen olayların oluş nedenlerini açığa çıkaran, gelecekte meydana gelecek olayları önceden tahmin etme şansı veren bağıntılardır. Newton Kanunu gibi yasalar, zaten ispatlanmış önermelerdir. Teorem ise doğruluğunun kanıtlanılmasına ihtiyaç duyar. Mesela merkezi limit teoremi gibi teoremler yanlışlanamadığı ölçüde güncelliğini korur. Uygulamalı ve doğal bilimler kanunlar ve teoremler aracılığıyla ilerler.

Büyük Sayılar Kanununun Kısaca Tarihçesi

Aslında konuya ilk eğilen 16. yüzyılda yaşamış İtalyan matematikçi Gerolama Cardano (1501 – 1576) olmuş. Fakat bu yasa, Jacob Bernoulli (1655 – 1705) tarafından 1713 yılında yayınlanan “Ars Conjectandi” adlı eserinde kanıtlanmıştır. Pafnuty Chebyshev (Rus Matematikçi, 1821 – 1894) ise bu yasayı geliştirmeye devam etmiş ve bir rasgele değişkenin dağılımının bilinmediği durumlarda alabileceği değerler için alt veya üst sınırı bulmaya yarayan Chebyshev Eşitsizliğini göstermiştir.

Jacob Bernoulli

Andrey Markov (1856 – 1922), Chebyshev Eşitsizliğini bağımlı rasgele değişkenler üzerine genelleştirmiştir. Ardından Émile Borel (1871 – 1956), Bernoulli teoremini geliştirerek güçlü büyük sayılar kanununu ispatlamıştır. Andrei Kolmogorov ise bağımsız değişkenler için gerek ve yeter koşulları içeren aksiyomlarını sunmuştur. Böylece büyük sayılar kanununun gerçekleşmesini sağlayacak ilkeleri açığa çıkarmıştır. Konuyu anlaşılır kılmak için öncelikle Chebyshev Eşitsizliğini vermekte yarar var. Okuma Önerisi: İstatistik Biliminde Kullanılan Bazı Temel Kavramlar

Chebyshev Eşitsizliği

X, varyansı 0 ≤ Var(X) < ∞ olan bir rasgele değişken olsun. Herhangi bir ɛ > 0 sayısı için eşitsizlik, aşağıdaki gibi gösterilir:

Bir rasgele değişkenin varyansı Var(X), yayılımının ölçüsüdür. Bu eşitsizlik, X’in ortalamadan çok uzak değerlerinin (aşırı gözlemler) olasılıklarını da ilişkilendirmiş olur. Eşitsizliği basitçe aktardıktan sonra kanunlarla ilgili olduğu için yakınsama çeşitlerine de değinmemiz gerekir. Eşitsizliğin, yakınsamaların ve kanunların ispatı yazı dışında bırakılmıştır.

Yakınsama Çeşitleri

Olasılık kuramında 4 türlü yakınsama çeşidi vardır. Fakat konuyla ilişkili olan olasılık olarak yakınsama ve hemen hemen her yerde yakınsama özelliklerine değinilecektir.

  • Olasılıkta Yakınsama: Zayıf büyük sayılar kanununa ve tutarlılık özelliğine götürür. Her ɛ > 0 sayısı aşağıdaki özellikleri sağlar:

Bu durumda Xn rasgele değişkeni olasılık olarak X’e yakınsar. Formülde yer alan rasgele değişkeni X ve olasılığı P temsil eder.

  • Hemen Hemen Her Yerde Yakınsama (a.s. = almostsurely): Güçlü büyük sayılar kanuna götürür. n sonsuza giderken Xn, X’e hemen hemen her yerde yakınsıyorsa aşağıdaki gibi gösterilir:

Burada önemli olan nokta, eğer Xn rasgele değişkeni X’e hemen hemen her yerde yakınsıyorsa, Xn aynı zamanda olasılık olarak da X’e yakınsar. Yani güçlü büyük sayılar kanunu, zayıf büyük sayılar kanunu da içerir.

Zayıf Büyük Sayılar Kanunu

Chebyshev Eşitsizliğinden sonra zayıf büyük sayılar kanununu şöyle açıklarız: X1, X2, … Xn, … bağımsız ve aynı μ ortalamalı ve σ2 varyanslı rasgele değişkenler ise bu rasgele değişkenlerin ortalaması, olasılık olarak kitle ortalaması μ’ye yakınsar. p olasılık ifadesini belirtmek üzere olarak gösterilir. Sözel olarak anlatılan bu ifadeyi matematiksel olarak şöyle gösteririz:

bulunur ve Chebyshev Eşitsizliğine göre aşağıdaki gibi olur.

ya da

Neden merkezi limit teoremi bir teoremdir de zayıf büyük sayılar kanunu bir yasadır?

Merkezi limit teoremi ile zayıf büyük sayılar kanunu birbirine çok yakın tanımlanır. Şöyle ki her ikisi de dağılımın ortalamasının eğilimini anlatır. Ancak merkezi limit teoremi ortalamaların şekli konusunda fikir sunar. Zayıf büyük sayılar kanunu ise gözlem sayısı büyüdükçe ortalamanın alacağı yaklaşık değeri kestirir.

Normal Dağılım Eğrisi

Yani merkezi limit teoremi, örneklem büyüklüğü sonsuza eğilimli olduğunda örneklem ortalamalarının normal dağılıma yakınsadığını söyler. Normal dağılım eğrisinden de görüleceği gibi dağılımın şekli hakkında fikir sunar. Zayıf büyük sayılar kanunuysa merkezi limit teoreminin göstermiş olduğu çan eğrisi şeklinin maksimum noktasının ne olacağını ifade eder. Merkezi limit teoreminin ayrıntılı açıklamasına ilgili yazımızdan ulaşabilirsiniz.

Güçlü Büyük Sayılar Kanunu

X1, X2, … Xn, bağımsız ve aynı sonlu μ ortalamalı ve σ2 varyanslı rasgele değişkenler ise bu rasgele değişkenlerin ortalaması hemen hemen her yerde (hhhy) kitle ortalaması μ’ye yakınsar. hhhy ifadesiyle olarak gösterilir. Matematiksel olaraksa gösterimi şöyledir:

Peki, Bu İki Kanun Arasındaki Fark Nedir?

Zayıf büyük sayılar kanununda örneklem ortalaması olasılık sınırları içinde (olasılık 0’dan küçük ve 1’den büyük olamaz) ama bilinmeyen bir olasılıkla ilgili dağılımın ortalamasına yakınsar. Güçlü büyük sayılar kanununda ise örneklem ortalaması, bilinen olasılık değeriyle dağılımın ortalamasına yakınsar. Bu kanunların yaşamımızda nasıl önem teşkil ettiğini kısaca değinmeye çalışayım. Büyük sayılar kanunun algılarımız üzerinde etkisi olmakta ve hatta günlük hayatımızla iç içe olup düşünce yapımıza bile yön vermektedir.

Kanunların Algılarımız Üzerine Etkileri

Bu kanunlar sayesinde geleceğe yönelik yapılan kestirimlerde, gerçeği yansıtan değerlere ulaşma şansımız artacaktır. Çünkü olasılık teorisi, bir dizi tesadüfi olayın gerçekleşme şansını, uzun bir gözlem neticesinde görülebileceğini öngörür. Bu yüzdendir ki büyük sayılar yasası, deneme sayısı arttıkça tahmin başarısının artacağını belirtir. Hayatımızın belli riskler altında sürdüğünü düşünürsek bu kanunların ne kadar işlevsel olduğunu da anlarız.

Çağımızın önemli alanlarından biri olan veri madenciliği çalışmaları da bu kanunlarla yol almaktadır. Büyük veriler (big data), sağlıktan ekonomiye, sosyal iletişim araçlarından pazarlama yöntemlerine kadar yaşantımıza yön verir. Bu yön verişin hem olumlu hem de olumsuz etkileri olmaktadır. Kısaca olumsuz etkilere değineceğim. Büyük sayıda veri kullanımının (big data) olumlu etkilerini ise başka bir yazının konusu olarak bırakıyorum.

Bireysel Etkiden Toplumsal Etkiye Uzanış

Mesela sosyal medyada sıklıkla karşımıza çıkan kişilik testleri büyük yüzdelere varan başarı oranlarına sahiptir. Belli soruların cevaplarını bizden ister ve cevapları verip testin sonucuna baktığımızda vay be ne kadar da iyi bildi diye düşünürüz. Testlerin başarısı aslında çoklu sayıda veri kullanımının getirdiği başarıdan kaynaklanır.

Bir başka örneği internet alışverişlerimizden verebiliriz. Son aldığımız ürünlere baktığımızda -diğer insanların alışverişlerde edinmiş oldukları benzer ürünlerin bilgisiyle- alınabilecek diğer ürünlerle karşılaşırız. Bir öneri listesi önümüze düşer. Bu da bizi ihtiyacımız olsun olmasın yeni ürünler almaya yönlendirir.

Yine sıklıkla başımıza gelen bir örnek daha var. Uygulamalar üzerinden dinlediğimiz müzik, izlediğimiz dizi veya programların akışında öneriler sekmesiyle izlenme sayıları sürekli karşımıza çıkar. Bu durumun etkisel olarak en basit hali -zaman yönetimi problemi günümüzün artan şikayetlerinden biri- belki de izleyerek zaman kaybetmek istemeyeceğimiz yeni videoları izlememize yol açmasıdır. Hayatımızın içinden verebileceğimiz örnekleri pek çok farklı alanda çoğaltmamız mümkündür. Örneklerin temelinde ise hakkımızda toplanan bilgilerin oluşturduğu bilgi havuzuyla algılarımıza nasıl yön verildiği yatmaktadır.

Bunlar basit ama önemli bir bireysel etkidir. Çünkü algılarımızı ve değer yargılarımızı değiştirmeye yönelik çalışmaları içerir. Aynı stratejinin kullanımının topluma etkisi ise her alanda muazzam ölçüde artmakta ve geleceğimize yön vermektedir. Üstelik son zamanlarda artan sosyal medya ve internet protokollerinin kullanımındaki güvenlik ihlalleri konusu bu kadar gündemdeyken durumun ciddiyeti daha iyi anlaşılır.

İstatistik bilimi anlatılmaz ölçüde güzelliklerini, çıkar gruplarının elinde bize karşı olumlu ya da olumsuz yapıda göstermektedir. Bu yüzden ünlü oyuncu Sidney Poitier’ın da dediği gibi dilerim herkes yaptığı çalışmaları, pozitif değerlerinin bir yansıması olarak kullanmayı seçer.

Kaynakça:

Olgun Duran

Ömür boyu öğrencilik felsefesini benimsemiş amatör tiyatro oyuncusu ve TEGV gönüllüsü; kitaplarından, doğaya hayranlığından, yeni yerleri görmekten, gittiği yerlerin kültürünü keşfetmekten ve bunların uğruna çabalamaktan vazgeç(e)meyen kişi...