OLASILIK / İSTATİSTİK

Bazı Kesikli Olasılık Dağılımları

Bir önceki yazımda olasılık dağılımlarının daha iyi anlaşılabilmesi için bazı temel istatistik kavramlarına değinmiştim. Aşağıdaki yazıyı okumaya geçmeden önce bu yazıya da göz atmanızı rica edeceğim.

İstatistik Biliminde Kullanılan Bazı Temel Kavramlar

Bernoulli Dağılımı

Bu dağılım, diğer kesikli olasılık dağılımlarının da yapı taşını oluşturur. İsviçreli Matematikçi ve Fizikçi Daniel Bernoulli (1700 – 1782) tarafından bulunmuştur. Daniel’ın babası, kalkülüsü ilk geliştirenlerden matematikçi ve Euler’ın hocası olan Johann Bernoulli (1667 – 1748) olup amcası ise olasılık teorisini ilk geliştiren Jakob Bernoulli (1655 – 1705)’dir.

Bu dağılım, rasgele değişkenin sadece 0 ve 1 değerlerini alabildiği kesikli olasılık dağılımıdır. En klasik örneği, bozuk bir paranın atıldığında yazı veya tura gelme olayıdır.

Genellersek -eğer bir olayın 2 cevabı varsa: gerçekleşti/gerçekleşmedi, başarılı/başarısız, evet/hayır, etkili/etkili değil, doğru/yanlış, olumlu/olumsuz gibi- bu kesikli rasgele değişkeninin aldığı değerlerin dağılımı, Bernoulli dağılımını oluşturur.

Dağılımda genellikle 0 başarısızlığı ve 1 başarı durumunu kategorize eder. Şöyle örneklendireyim:

100 kişilik bir sınıfta yapılan sınavda dersi geçenlerin yüzdesi 40, kalanların yüzdesi 60 ise;

p = 0,40; q = 0,60

olup bu olay bir Bernoulli dağılımına sahiptir.

Aslında bu dağılım oldukça basittir; ama dağılımın önemi Binom dağılımından Hipergeometrik dağılıma kadar diğer kesikli dağılımların temelini oluşturmasıdır.

Bir kesikli rasgele değişkeninin Bernoulli dağılımından geldiği aşağıdaki varsayımları sağlamasıyla karar verilir:

  • Denemeler, aynı koşullar altında tekrarlanabilir olmalıdır.
  • Olayların yalnız 2 sonucu olmalıdır.
  • Başarı olasılığı (p), denemeden denemeye değişmemelidir.
  • Her bir deneme birbirinden bağımsız olmalıdır.

Bu varsayımlar sağlanmıyorsa, olasılık dağılımından Bernoulli dağılımı olarak söz etmek doğru olmaz. Dağılımın olasılık fonksiyonu ise aşağıdaki gibi yazılır.

f(x) = pxq1-x; x = 0,1

Beklenen Değeri ve Varyansı

Bu dağılımda beklenen değer yani ortalama, direk p olasılığına (başarı) eşit olup varyans ise başarı ve başarısızlık olasılıklarının çarpımına eşittir. Aşağıda formülleri yer alır.

E(x) = p; Var(x) = pq

Binom Dağılımı

Bir Bernoulli denemesinin n defa gerçekleşmesi durumunda – denemeler bağımsız ve her başarı sayısının olasılığı p olmak üzere- elde edilen X rasgele değişkeni, Binom rasgele değişkeni olarak adlandırılır. Yani n-tane bağımsız Bernoulli denemelerinin sayısı bizi Binom dağılımına götürür. Dolayısıyla Binom dağılımından bahsedebilmek için Bernoulli dağılımının varsayımlarını kontrol etmek gerekmekte.

Bu dağılım ilk kez Jacob Bernoulli tarafından öne sürülmüştür ve Bernoulli dağılımının n-tane rasgele değişkene genelleştirilmiş halidir. 1866 yılında ünlü Botanikçi Gregor Mendel (1822 – 1884) tarafından oluşturulan ve Mendel yasalarının yayınında yer alan örneklerde sunulan yanlılığı kanıtlamak için İngiliz İstatistikçi Sir Ronald Aylmer Fisher (1890 – 1962) tarafından Binom dağılımı kullanılmıştır.

Olasılık fonksiyonu ise;

 olarak yazılır.

Beklenen Değeri ve Varyansı

n-tane bağımsız Bernoulli denemelerinden oluştuğu için beklenen değeri ve varyansının formülü aşağıdaki gibidir.

E(x) = np; Var(x) = npq

Bir tedavi etkinliğinin işe yarayıp yaramadığı, bir piyango biletinin kazanıp kazanmadığı, bir depodan seçilen 20 tane ürünün 5 tanesinin hatalı olması, bir antibiyotiğin tedaviye yanıt verip vermemesi gibi iki seçenekli herhangi bir olay Binom dağılımın örnek olarak sunulabilir. Gerçek hayatta psikolojiden sosyolojiye, mühendislikten tıp alanına kadar oldukça geniş bir kullanıma sahiptir.

Negatif Binom Dağılımı

Bernoulli dağılımının bütün varsayımları bu dağılım için de geçerli olup Binom dağılımından farkı ilgilenilen başarı sayısında yatmakta. Şöyle ki, Binom dağılımı n-tane denemede x-tane başarı elde etme olasılığıyla ilgilenirken Negatif Binom dağılımında k-ıncı başarıyı elde etme sayısıyla ilgilenilir.

Bir örnekle açıklayayım. Bir paranın 5 kez yazı gelene kadar atılmasında 5. kez yazının geldiği deneme sayısı, Negatif Binom dağılımıyla bulunur. Başka bir örnek vermek gerekirse; bir basketbol oyuncusunun üçlük sayı atma olasılığı 0,7 olsun. Aynı basketbolcunun beşinci atışında ikinci üçlüğünü atma olasılığı Negatif Binom dağılımıyla bulunur.

Olasılık fonksiyonu ise;

olarak elde edilir.

Beklenen Değeri ve Varyansı

Deneme sayıları ile ilgilendiğinden beklenen değeri ve varyansının formülü şöyle yazılır:

E(x) = r/p

Var(x) = rq/(p2)

Bir kişinin alışveriş yapmadan önce gezdiği internet sitelerinin sayısından müşteri temsilcisine iletilen şikâyet ya da önerilerin sayısı gibi farklı alanlarda bu dağılımın kullanıldığını görebilirsiniz.

Dikkat edilmesi gereken husus, Negatif Binom dağılımı k-ıncı başarı gelene kadar yapılan deneme sayılarının olasılığı ile ilgilenirken; Binom dağılımı n denemede gözlenen x-tane başarının olasılığıyla ilgilenir. Kısaca her iki dağılımda Bernoulli dağılımı varsayımlarının temel alırken; Binom dağılımında deneme sayıları (n) sabittir; Negatif Binom dağılımında ise başarı sayıları (r) sabit olmaktadır.

Poisson Dağılımı

İlginç bir dağılımla karşı karşıyayız. Poisson dağılımı, Fransız Matematikçi ve Fizikçi Siméon Denis Poisson (1781 – 1840) tarafından bulunmuştur. Bu dağılım başarı olasılığı p’nin küçük olması durumunda Binom dağılımının matematiksel anlamda basitleştirilmesidir.

Belirli bir zaman aralığında ve belli bir alanda nadir görünen olayların olasılık dağılımlarında sıklıkla kullanılır. Bir bölgede görülen tifo hastalığının sayısı, gün içerisinde eczaneye tansiyon ölçtürmeye giden kişi sayısı, bir kavşakta oluşan kaza sayısı, bir müşteri hizmetleri servisine her saat başı gelen telefon sayısı, bir duraktan saat başı geçen otobüs seferlerinin sayısı gibi Poisson dağılımına örnek olarak sunulabilir.

Dağılım, belirli bir sabit zaman aralığında gerçekleşen olayları baz alsa da kullanım alanı bakımından belirli bir uzaklık, alan veya hacim içeren olayların dağılımını belirlemede de kullanılır. Bu dağılım “λ” parametresine göre şekillenmekte. Olasılık fonksiyonu aşağıdaki gibidir:

f(x) fonksiyonunda; e = 2,71828…, x: bir olayın ortaya çıkma sayısı, x!: x değişkenin faktöriyeli, λ ise -pozitif reel sayılar kümesinin elemanıdır- sabit bir aralıkta ortaya çıkması beklenen değerdir.

Beklenen Değeri ve Varyansı

İlginç bir dağılım olduğunu söylemiştim. Çünkü bu dağılımın beklenen değeri ve varyansı λ parametresine eşittir. Yani E(x) = Var(x) = λ olur. Yani λ = np’dir.

p küçük olunca binom dağılımının basitleştirilmiş hali olduğunu yukarıda belirtmiştim. Şöyle ki eğer np ≤ 5 olursa Binom dağılımı, Poisson dağılımına yakınsar. Dolayısıyla Binom dağılımındaki beklenen değer olan µ = np aslında Poisson dağılımındaki λ parametresine eşittir.

Bu dağılım, DNA’daki mutasyonların sayısından atomların parçalanmasına kadar bilimsel anlamda yaygın kullanıma sahiptir.

Geometrik Dağılım

Yine Bernoulli dağılımının varsayımlarının geçerli olduğu bu dağılım, Negatif binom dağılımının özel bir durumudur. Yani Negatif Binom dağılımında k = 1 alınınca Geometrik dağılım elde edilir. Geometrik dağılımda X rasgele değişkeni ilk başarıyı elde edinceye kadar yapılan deneme sayılarını ifade eder.

Bu dağılımın kullanımını örneklendirmek gerekirse; tifüs hastalığının tedavi edilmemesi durumunda ölüm olasılığı 0,40 olsun. Hastalık sebebiyle ölen kişiler bulunmak istenmektedir. Ölen kişiler arasında seçilen 15. kişinin tifüs rahatsızlığından ölen ilk kişi çıkma olasılığı geometrik dağılım yardımıyla bulunur.

Olasılık fonksiyonu;

f(x) = p(q)x-1; x = 1,2,3, …

olarak yazılır.

Beklenen Değeri ve Varyansı

E(x) = 1/p ve Var(x) = q/p2

olup bu dağılım iktisat ve mühendislik dallarından tıp alanına kadar kullanıma sahiptir.

Hipergeometrik Dağılım

Bu dağılım, sonlu sayıda elemana sahip bir anakitle hakkında bilgi edinirken kullanılmakta. Aslında dağılım Binom dağılımına benzemektedir. Binom dağılımından farklı olarak denemeler birbirinden bağımsız olduğu için başarı olasılığı “p” denemeden denemeye değişecektir. Oysaki Binom dağılımında p sabit kalmaktaydı. Dağılım, İsviçreli Matematikçi ve Fizikçi Leonard Euler (1707 – 1783) tarafından bulunmuştur.

Dağılımın varsayımları şöyledir:

  • n-tane deneme benzer koşullarda gerçekleşir ve birbirinden bağımsızdır.
  • Her denemenin olası 2 sonucu vardır: evet/hayır, geçti/geçmedi, başarılı/başarısız gibi.
  • Sonlu sayıda anakitleden örnekler yerine geri konmaz.
  • Örnekler yerine konmadığından p, denemeden denemeye değişiklik gösterir.

Dağılımın daha iyi anlaşılması için bir örnek vermem gerekirse; istatistik dersi alan 100 öğrencinin 60 tanesi daha önce Analiz dersi de almış olsun. İadesiz olarak seçilen 10 öğrenciden 4 tanesinin analiz dersini alma olasılığı hipergeometrik dağılım aracılığıyla bulunur.

Olasılık fonksiyonu; N: sonlu kitle sayısı, n: örnek hacmi; B: Anakitledeki başarı sayısı ve x: Örneklem başarı sayısı olmak üzere;

olarak yazılır.

Beklenen Değeri ve Varyansı

olup bu dağılım, şans oyunlarından nüfus dağılımına kadar pek çok alanda karşımıza çıkmakta.

Multinomial Dağılım

Binom dağılımının genelleştirilmiş halidir. Rasgele değişkeni ikiden fazla olası sonuç barındırdığından Bernoulli rasgele değişkeninden farklıdır. Eğer bir denemenin 2’den fazla muhtemel sonucu varsa Binom denemesi, Multinomial denemeye dönüşür.

Örneklendirelim: bir çift zar atıldığında gelen sayıların toplamının 2 kez 9 gelmesi ya da gelen sayılardan birinin çift sayı olma olasılığı Multinomial dağılım ile hesaplanır.

Başka bir örnek vermek gerekirse bir öğrenci topluluğundan bir proje grubu oluşturulsun. Topluluktan 6 kişi İktisat, 4 kişi İstatistik, 5 kişi Matematik ve 7 kişi Mühendislik bölümünde okuyan öğrenciler olduğuna göre proje grubunda 3 İktisat, 2 İstatistik, 4 Mühendis ve 2 Matematik bölümü öğencisi bulunma olasılığı Multinomial dağılım ile bulunur.

Olasılık fonksiyonu;

olarak yazılır.

Yine klasik bir örnekle devam edelim. Bir depoda yer alan mallardan %5’i ağır kusurlu, %10’u kusurlu, %5’ü hafif kusurlu ve %80’i kusursuz ise son bir saat içinde seçilen 6 üründen birinin ağır kusurlu, ikisinin kusurlu, birinin hafif kusurlu ve ikisinin kusursuz olma olasılığı bulunmak istensin.

Seçilen ürün geri yerine konduğundan, her seçilen ürünün seçim şansı eşit olduğundan ve her denemenin birbirinden farklı 4 (k) tane sonucu olduğundan istenen olasılık Multinomial olasılık fonksiyonu yardımıyla hesaplanır.

Beklenen Değeri ve Varyansı

E(xi) = npi ve Var(xi) = npi(1-pi)

Binom dağılımın genelleştirilmiş hali olduğundan ikiden fazla mümkün olası sonuçlu denemelerin kullanıldığı pek çok alanda karşımıza bu dağılım çıkar.

Kesikli Düzgün (Uniform) Dağılım

Bu dağılımın rasgele değişkeni tanımlı olduğu tüm noktalarda aynı (eşit) olasılık değerini alır. Dolayısıyla olasılık fonksiyonunun aldığı değer de sabit olur. Olasılık fonksiyonu;

f(x) = 1/k; x = 1,2,3, …,n

olarak ifade edilir.

Beklenen Değeri ve Varyansı

E(xi) = (n+1)/2 ve Var(xi) = (n2-1)/2

Hilesiz bir zar atma deneyinde X rasgele değişkeni ortaya çıkabilecek tüm olasılıkları göstersin. Örnek uzayımız S = {1,2,3,4,5,6} olup her bir değerin gelme olasılığı birbirine eşittir ve bu değer 1/6’dır. Dolayısıyla bu örnek bize kesikli düzgün dağılımı gösterir.

Yukarıda olabildiğince belli başlı kesikli olasılık dağılımlarını anlatmaya çalıştım. Rasgele değişkenler yardımıyla elde ettiğimiz olasılık dağılımları ile veri kümemizi en iyi anlatan ölçüleri bulmaya çalışırız. Bu yüzden veri kümemizi anlayabilmek için temel istatistik kavramları ve olasılık dağılımları hakkında bilgi sahibi olmamız gerekmektedir.

Kaynakça

Bu yazı, Değerli Hocam Fikri Akdeniz’in “Olasılık ve İstatistik” kitabından ve ders notlarından derlenmiştir.

https://www.britannica.com/science (Erişim Tarihi: 09.10.2020)

https://encyclopediaofmath.org/  (Erişim Tarihi: 11.10.2020)

https://mathworld.wolfram.com/ (Erişim Tarihi: 11.10.2020)

Matematiksel

Olgun Duran

Ömür boyu öğrencilik felsefesini benimsemiş amatör tiyatro oyuncusu, TEGV'de gönüllü aktivist; kitaplarından, doğaya hayranlığından, yeni yerleri görmekten, gittiği yerlerin kültürünü keşfetmekten ve bunların uğruna çabalamaktan vazgeç(e)meyen kişi...  

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu