Matematik

İstatistikte 5 Ya da 6 Sigma Ne Anlama Geliyor?

Sigma, Yunan alfabesinin 18. harfidir ve “s” sesini temsil eder. Büyük sigma (∑) matematikte toplam işareti olarak kullanılır. Küçük sigma (σ) ise istatistikte standart sapmayı gösterir. Standart sapma, verilerin ortalama etrafında ne kadar yayıldığını ifade eder. Peki 5 sigma ya da 6 sigma ne anlama gelir?

İstatistikte 5 Ya da 6 Sigma Ne Anlama Geliyor?

Bilimde mutlak kesinlikler yoktur. Şüpheci olmak her zaman gerekir. Ancak bu durumda, bilim insanları bir sonucun gerçekten önemli olup olmadığını nasıl anlar? Bunun yolu sezgilerden değil, doğrudan veriden geçer.

Güvenilir bir araştırmacı, elde ettiği sonucu “mantıklı geliyor” diye değil, istatistiksel ölçütlere göre değerlendirir. Bir bulgu, ancak istatistiksel olarak anlamlıysa ciddiye alınır. Bunun için de herkesin kabul ettiği ortak bir ölçü gerekir.

Bu noktada devreye standart sapma girer. Küçük Yunan harfi sigma (σ) ile gösterilen standart sapma, verilerin ortalama etrafında ne kadar yayıldığını anlatır. Başka bir deyişle, bir veri kümesinin ne kadar “dağınık” olduğunu gösterir.

Standart Sapma Nedir?

İstatistikte 5 Ya da 6 Sigma Ne Anlama Geliyor?
Normal dağılım için ortalamanın 1-sigma, 2-sigma ve 3-sigma arasında yer alan bir değerin olasılıkları. Standart sapma ile verilerin ne kadarının ortalamaya yakın olduğunu buluruz. Eğer standart sapma küçükse veriler ortalamaya yakın yerlerde dağılmışlardır.

Standart sapması yüksek bir veri kümesinde değerler ortalamadan geniş bir alana yayılır; yani değişkenlik fazladır. Standart sapması düşük bir veri kümesinde ise değerler ortalamaya yakın biçimde toplanır. Bilim insanları, bir sonucun ortalamadan kaç standart sapma uzaklıkta olduğuna bakarak, bunun sıradan bir dalgalanma mı yoksa gerçekten dikkat çekici bir sonuç mu olduğuna karar verir.

Normal dağılımda bir standart sapma, yani bir sigma, ortalamanın çevresindeki verilerin yaklaşık yüzde 68’ini kapsar. İki sigma, verilerin yaklaşık yüzde 95’ini; üç sigma ise yaklaşık yüzde 99,7’sini içerir.

Sigma sayısı arttıkça, gözlenen sonucun rastlantı sonucu ortaya çıkma olasılığı hızla azalır. Bu nedenle yüksek sigma değerleri, bir sonucun tesadüf olma ihtimalinin çok düşük olduğunu gösterir.

P Değeri Nedir?

Bilim insanları, bir iddianın doğru olma ihtimalini değerlendirmek için p-değerini kullanır. A ve B gibi iki şeyin karşılaştırıldığı bir çalışmada, önce iki olasılık tanımlanır. Birincisi, “A ile B arasında hiçbir ilişki yoktur” ifadesidir; buna sıfır hipotezi denir. İkincisi ise, “A ile B arasında bir ilişki vardır” ifadesidir ve buna araştırma hipotezi denir.

Hesaplamaya her zaman sıfır hipotezinin doğru olduğu varsayımıyla başlanır. Yani araştırmacılar, baştan A ile B arasında ilişki olmadığını kabul eder. Daha sonra şu soru sorulur: Eğer gerçekten A ile B arasında ilişki yoksa, elimizdeki veriler kadar dikkat çekici bir sonuç tesadüfen ortaya çıkabilir mi? İşte bu olasılık p-değeridir.

P-değeri ne kadar küçükse, elde edilen sonucun yalnızca şansla açıklanması o kadar zordur. Örneğin p = 0,01, böyle bir sonucun ilişki yokken yalnızca yüzde 1 olasılıkla ortaya çıkabileceği anlamına gelir. Bu nedenle bilimde belirli sınırlar kullanılır. Çoğu alanda p = 0,05 ya da p = 0,01’in altına düşüldüğünde, “bu sonuç tesadüf değildir” denir ve sıfır hipotezi reddedilir.

Kullanılan ölçütler alanlara göre değişir. Psikoloji ve diğer sosyal bilimlerde istatistiksel anlamlılık genellikle p-değeriyle ifade edilir. Matematik ve fizikte ise sonuçların güvenilirliğini göstermek için daha çok sigma düzeyleri kullanılır. Bu fark, disiplinlerin hata riskine ve kanıt standardına bakışındaki ayrımdan kaynaklanır.

İstatistikte 6 Sigma Nedir?

Bazı bilim alanlarında iki sigma yeterli kabul edilmez; hatta üç ya da dört sigma bile ikna edici sayılmaz. Parçacık fiziği bunun en iyi örneklerinden biridir. Bu alanda araştırmacılar, her biri yüksek enerjili proton çarpışmasına karşılık gelen milyonlarca, hatta milyarlarca ölçümle çalışır. Bu kadar büyük veri kümelerinde rastlantısal dalgalanmalar kaçınılmazdır. Bu nedenle çok daha yüksek bir güven eşiği gerekir.

2012 yılında CERN araştırmacıları Higgs bozonunun keşfini duyurduğunda, açıklamalarda sıkça 5 sigma ifadesi yer aldı. Beş sigma, yaklaşık 3×10⁻⁷’lik bir p-değerine karşılık gelir; yani yaklaşık 3,5 milyonda 1 olasılığa denk gelir.

5 sigma, Higgs bozonunun var olma ihtimali 3,5 milyonda 1 demek değildir. Anlamı şudur: Eğer Higgs bozonu hiç yoksa, CERN’de toplanan verilerin gözlenen kadar sıra dışı bir sonuç üretme ihtimali yalnızca 3,5 milyonda 1’dir. Yani sonuç, rastlantıyla açıklanamayacak kadar güçlüdür.

Buna rağmen, kimi zaman 5 sigma bile “tam emin olmak” için yeterli olmayabilir. Hatta yaklaşık yarım milyarda 1 rastlantı ihtimaline karşılık gelen 6 sigma düzeyi bile yanıltıcı sonuçlar verir. Bunun çarpıcı bir örneği 2011 yılında yine CERN’de yürütülen OPERA deneyidir.

Bu deneyde, neredeyse kütlesiz nötrinoların ışıktan hızlı hareket ettiği öne sürüldü. Sonuç 6 sigma güven düzeyine sahipti ve bu nedenle büyük yankı uyandırdı. Ancak iddia, ışık hızının evrensel bir sınır olduğunu söyleyen Einstein’ın görelilik kuramıyla doğrudan çelişiyordu.

Sonuç Olarak;

Daha sonra yapılan dört bağımsız deney, aynı sonucu doğrulamadı. OPERA ekibi, deney düzeneğindeki fiber optik zamanlama sisteminde yer alan hatalı bir bileşenin ilk ölçümü etkilediğini kabul etti. Bu örnek, istatistiksel güven düzeyi ne kadar yüksek olursa olsun, bilim insanlarının deneysel ayrıntıları dikkatle incelemesi ve sonuçları bağımsız çalışmalarla sınaması gerektiğini açıkça gösterir.


Kaynaklar ve ileri okumalar:

  • What does 5-sigma mean in science?. yayınlanma tarihi: 6 Ocak 2021; Bağlantı: https://www.zmescience.com/
  • Kadry, Seifedine. (2013). Six Sigma Methodology for the Environment Sustainable Development. 10.1007/978-94-007-5995-4_4.

Matematiksel

Bunlar da ilgini çekebilir

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir