Temel Matematik

Temel İstatistik Kavramları: Bilmeniz Gereken Bazı Olasılık Dağılımları

Olasılık dağılımları, önceden emin olamayacağınız birden fazla sonucu olan süreçleri tanımlamamıza yarar. Bir örnek, bir zarın atılmasıdır. Bildiğiniz gibi 6 olası sonuç vardır. Zar adil olduğu sürece, bunların hepsinin gerçekleşme olasılığı eşittir. Yani 1 atma olasılığınız ile 6 atma olasılığınız birbiri ile aynıdır. Bu durumda – örneğin 6’yı atacağınız kadar 1’i de atma olasılığınız vardır. Bu, herhangi bir sayıyı atmak için 100/6 yaklaşık 16.6 şansınız olduğu anlamına gelir. Bu da 0.166 olasılığa karşılık gelir. Bunu bir histogram kullanarak görselleştirseniz aşağıdaki gibi olacaktır. Gördüğünüz gibi her sonucun eşit olasılığa sahip olduğu olaylarda tek tip bir dağılım söz konusudur.

Bir zar atıldığında karşımıza çıkan dağılım grafiğimiz

İki zar atarsanız ve gösterdikleri sayıları toplarsanız, 11 olası sonucunuz olur (2’den 12’ye kadar olan sayılar). Ancak hepsinin olasılığı eşit değildir. Birçok farklı kombinasyon size nihai sonucu 7 (1 ve 6, 2 ve 5, vb.) verebileceğinden, 7 ile sonuçlanma olasılığınız 2 ile sonuçlanmaktan çok daha olasıdır.

İki zarın atılması ve sonuçların toplanmasıyla ilişkili dağılımı görselleştiren bir histogram.

Bu iki örnekte, ilgilendiğimiz rastgele değişken yalnızca tamsayı değerleri alır. Peki, hayatta her olayın mümkün olan sonuçlarını matematiksel olarak incelemek gerekseydi, olası sonuçların tam sayı olacağını iddia edebilir miydik? Elbette hayır! İşte bir olayın mümkün sonuçlarının oluşturduğu kümenin elemanı, sürekli bir aralıkta değer alıyorsa bu rasgele değişkene “sürekli rasgele değişken” adı verilmekte. Sürekli rasgele değişkenlerin de oluşturduğu dağılımlar “sürekli olasılık dağılımları” olarak adlandırılır. Bu dağılımların istatistik biliminde önemi oldukça büyüktür. Örneğin, bir grup insan arasından seçtiğiniz herhangi bir kişinin belli bir boyda olma olasılığını bilmek istiyorsanız, değişkeniniz süreklidir.

Diyelim ki sokakta tanıştığınız rastgele bir kadının tam olarak 170 cm boyunda olma olasılığı nedir? Soruyu cevaplamak imkansız gibi gelecektir. Ancak neyse ki matematik size yardımcı olacaktır. Çünkü matematik size, insanların boylarının, normal dağılım denen, çan şeklindeki bir eğriyle temsil edilen bir olasılık dağılımını izlediğini söyler.

Normal Dağılım (Gauss-Laplace Dağılımı) Nedir?

Normal dağılımda her bir ortalama (μ) ve standart sapma (σ) değerine karşılık farklı bir eğri söz konusudur. Ortalama ve standart sapma, normal dağılımın iki tanımlayıcısıdır. Gözlemlerin %50’si ortalamanın solunda (yani ortalamadan küçük); %50’si ortalamanın sağında (yani ortalamadan büyük) olarak yer alır. Normal dağılımın eğrisi altında kalan alanın değeri 1’dir. Gözlemlerin; %68,26’sı μ ± 1σ; %95,44’ü μ ± 2σ;, %99,74’ü μ ± 3σ; arasında yer alır.

Olasılık dağılımları arasında başköşeye koyulması gereken dağılıma hoş geldik. Bu dağılımdan ilk olarak Fransız Matematikçi Abraham de Moivre 1756 yılında söz etmiştir. 1774’te Laplace (Fransız Matematikçi ve Gökbilimci, 1749 – 1827) bu hesabın üzerine çalışmış; fakat son şekli 19. yüzyılın ilk yarısında Alman Matematikçi ve İstatistikçi Carl Friedrich Gauss tarafından verilmiştir.

Normal dağılımın kullanım alanı oldukça geniştir. Hayat kurtaran bu dağılımın şekli çan biçiminde olur. Çan eğrisi şekli bize dağılımın simetrik bir yapıda olduğunu da göstermektedir. Şimdi yukarıdaki sorumuza geri dönelim. Eğrinin üst kısmı, 164.7 cm olan ortalama boyu temsil eder. Rastgele bir kadının 165cm ile 175cm arasında olma olasılığı, çan eğrisinin altında ve 165cm ile 175cm arasındaki aralığı arasındadır. Belirli bir aralıkta yer alan rastgele değişkenimizin olasılığı, o aralıktaki eğrinin altındaki alan ile temsil edilir. Olasılıkları bu şekilde temsil eden bir eğriye (ya da daha doğrusu onu tanımlayan matematiksel formüle) olasılık yoğunluk fonksiyonu denir.

Ortalama 1.647 ve standart sapma 7.07 ile normal dağılım. Bu eğri, Kuzey Amerika, Avrupa, Doğu Asya ve Avustralya’daki yirmi ülkeyi kapsayan geniş bir araştırmaya dayanan kadınların boylarının dağılımını temsil ediyor.

Şimdi bunu çözdük, işte büyük bir soru: sadece birkaç zar atmaktan daha karmaşık bir süreç verildiğinde, ilişkili olasılık dağılımını nasıl bileceksiniz? Neyse ki, bunun için çeşitli dağılım aileleri vardır. Yazıda sadece çok bilinen bir kaç tanesine yer vereceğiz.

Bernoulli Dağılımı

İsviçreli Matematikçi ve Fizikçi Daniel Bernoulli (1700 – 1782) tarafından bulunmuştur. Bu dağılım, rasgele değişkenin sadece 0 ve 1 değerlerini alabildiği kesikli olasılık dağılımıdır. En klasik örneği, bozuk bir paranın atıldığında yazı veya tura gelme olayıdır. Genellersek -eğer bir olayın 2 cevabı varsa Bernoulli dağılımını oluşturur. Dağılımda genellikle 0 başarısızlığı ve 1 başarı durumunu kategorize eder. Aslında bu dağılım oldukça basittir; ama dağılımın önemi diğer dağılımların temelini oluşturmasıdır.

Binom Dağılımı

N kez bir deney yaptığınızı (örneğin bir zar attığınızı) ve her seferinde sonucun başarı veya başarısızlık olabileceğini hayal edin. 0’dan N’ye kadar k herhangi bir tam sayı olsun. Bu durumda tam olarak k başarı elde etme olasılığınız nedir? Her biri başarı veya başarısızlıkla sonuçlanabilecek N tane deney yapıyorsunuz. Sonrasında da N tane deney arasında tam olarak k tane başarılı olma olasılığını soruyorsunuz. İşte bu sorunun cevabı binom dağılımı ile verilmektedir. Binom dağılımının şekli, ortalamanın değerine ve deneylerin sayısına bağlıdır. Bir örnek aşağıdaki gibidir.

Bu dağılım ilk kez Jacob Bernoulli tarafından öne sürülmüştür. Bernoulli dağılımının n-tane rasgele değişkene genişlemiş halidir. Bir tedavinin işe yarayıp yaramadığı, bir piyango biletinin kazanıp kazanmadığı gibi iki seçenekli herhangi bir olay Binom dağılımına örnek olur. Gerçek hayatta psikolojiden sosyolojiye, mühendislikten tıp alanına kadar oldukça geniş bir kullanıma sahiptir.

Negatif Binom Dağılımı

Binom dağılımı n-tane denemede x-tane başarı elde etme olasılığıyla ilgilidir. Negatif Binom dağılımı ise k-ıncı başarıyı elde etme sayısıyla ilgilenilir. Örneğin, bir paranın 5 kez yazı gelene kadar atılmasında 5. kez yazının geldiği deneme sayısı, Negatif Binom dağılımıyla bulunur. Başka bir örnek vermek gerekirse; bir basketbol oyuncusunun üçlük sayı atma olasılığı 0,7 olsun. Aynı basketbolcunun beşinci atışında ikinci üçlüğünü atma olasılığı Negatif Binom dağılımıyla hesaplanacaktır. Bir kişinin alışveriş yapmadan önce gezdiği internet sitelerinin sayısından müşteri temsilcisine iletilen şikâyet ya da önerilerin sayısı gibi farklı alanlarda bu dağılımın kullanıldığını görebilirsiniz.

Poisson Dağılımı

İstatistikte kullanılan kelimeler bazen kulağa ürkütücü gelebiliyor. Bunlardan bir tanesi de Poisson dağılımı. Poisson dağılımı belirli bir zaman veya uzay aralığında rastgele meydana gelen bir olayın meydana gelme sayısını modellemek için kullanılır. 1837’de Fransız matematikçi Siméon Poisson tarafından tanıtılan ve Abraham de Moivre’nin çalışmasına dayanan bu dağılım yardımıyla çok çeşitli olasılıkları tahmin etmek mümkündür. Bu dağılım başarı olasılığı p’nin küçük olması durumunda Binom dağılımının matematiksel anlamda basitleştirilmesidir. Belirli bir zaman aralığında ve belli bir alanda nadir görünen olayların olasılık dağılımlarında sıklıkla kullanılır.

Bir bölgede görülen tifo hastalığının sayısı, gün içerisinde eczaneye tansiyon ölçtürmeye giden kişi sayısı, bir kavşakta oluşan kaza sayısı, bir müşteri hizmetleri servisine her saat başı gelen telefon sayısı, bir duraktan saat başı geçen otobüs seferlerinin sayısı gibi Poisson dağılımına örnek olarak sunulabilir. Dağılım, belirli bir sabit zaman aralığında gerçekleşen olayları baz alsa da kullanım alanı bakımından belirli bir uzaklık, alan veya hacim içeren olayların dağılımını belirlemede de kullanılır.

Olasılık Dağılımlarının Sınıflandırılması

Olasılık dağılımlarının birçok farklı sınıflandırması vardır. Bazıları normal dağılım, ki kare dağılımı, binom dağılımı ve Poisson dağılımını içerir. Farklı olasılık dağılımları farklı amaçlara hizmet eder ve farklı veri üretim süreçlerini temsil eder. yazımızda bu noktaya kadar karşınıza en sık çıkma ihtimali olan dağılımlardan bahsettik. Ancak daha bahsetmediğimiz onlarca dağılım olduğunu anımsatalım. Onları da bir başka yazımızın konusu yapalım.



Kaynaklar ve ileri Okumalar:

Matematiksel

Olgun Duran

Ömür boyu öğrencilik felsefesini benimsemiş amatör tiyatro oyuncusu ve TEGV gönüllüsü; kitaplarından, doğaya hayranlığından, yeni yerleri görmekten, gittiği yerlerin kültürünü keşfetmekten ve bunların uğruna çabalamaktan vazgeç(e)meyen kişi...  
Başa dön tuşu