MATEMATİK TARİHİ

İstatistik: Belirsizlikten Belirliliğe Doğru Yol Gösteren Bir Bilim Dalı

Yaşadığımız çağın merkezini veriler oluşturur. İstatistik; uygulamalı istatistik, veri bilimi, veri analizi ve iş analizi gibi çeşitli alt anlamlarla anılmaktadır. Peki nedir istatistik? Yazımda bunun cevabını vermeye çalışacağım.

Hayatta korkunç olan şeyler de kulis arkasında bir yerlerde geçiyor. Herkes sessiz, rahat. Protesto eden yalnız dilsiz istatistik: Şu kadar insan çıldırdı, şu kadar içildi, şu kadar çocuk gıdasızlıktan öldü..” Köylüler, Anton ÇEHOV

İstatistik Nedir?

İstatistik, başta tanımı olmak üzere ne olduğu konusunda pek çok kişide kafa karışıklığı yaratan bir sözcüktür. İstatistik kelimesinin kökeni Latince “status” veya İtalyanca “statista” kelimesidir; bu kelimelerin anlamı ise “siyasi devlet” ya da “hükümet”tir.

Hatta Shakespeare Hamlet‘de (1602) “statist” kelimesine devletçi anlamında yer verir. Çünkü yöneticiler ve krallar, askeri potansiyellerini, servetlerini, vergilendirmelerini ve hükümetin diğer yönlerini değerlendirmek için devletlerinin toprak, tarım, ticaret, nüfusları hakkında bilgiye ihtiyaç duymalarıyla istatistiğin ilk kayıtlarını tutarlar.  

TDK’ye göre istatistiğin iki tanımı mevcuttur. Bunlardan ilki “bir sonuç çıkarmak için verileri yöntemli bir biçimde toplayıp sayı olarak belirtme işi, sayımlama”; ikincisi ise “ilkelerini olasılık kuramlarından alarak eldeki verileri grafik ve sayı biçiminde değerlendirmeye dayandıran matematiğin uygulamalı dalı, sayım bilimidir”.

Tanımlardan da görüldüğü gibi istatistiğin ne olduğunu anlamak için öncelikle veri kelimesinin anlamını açıklığa kavuşturmakta fayda var.

1682, 1758, 1835, 1910, 1986, 2061, 2136, 2211, 2286

Yukarıdaki sayılar sadece rakamlardan oluşan bir dizidir ama veri olarak değerlendirilebilinir mi? Yani gördüğümüz her sayı ya da rakama veri diyebilir miyiz? Bir değere veri denebilmesi için o değerin belli bir bilgi vermesi gerekir.

Aslına bakarsanız bu sayı dizisi Edmond Halley (İngiliz gökbilimci ve matematikçi, 1656 – 1742) tarafından 1682 yılında gözlemlenen  ve yaptığı hesaplamalarla 76 yılda bir yeniden dünyadan geçeceğini söylediği Halley kuyruklu yıldızının gözlem ya da gözlemleneceği düşünülen tarihleri; dolayısıyla bizim için artık sıradan rakamlar değil bir veriyi oluşturur. Kısaca veri için bir ya da birden fazla bilgiyi temsil eder diyebiliriz.

Bir parçası olduğumuz evreni anlamak ya da öğrenmek istediğimiz şeyler hakkında bilgi almak için veri toplarız. Topladığımız bu verileri anlamlandırma işini ise bilim dalı olarak istatistik yapar.

Soru sorma ve soruya uygun verileri toplayıp analiz etme süreci neredeyse tüm disiplinlerin temel bileşenini oluşturur.

İstatistikçi en genel haliyle, belirli bir soruya özgü gerekli olan veri türünü, bu verinin toplanma biçimini ve soruya verilecek en uygun cevabı bulmak amacıyla yapılması gereken analizleri belirler.

“Olasılık teorisi sözde ‘şansa’ bağlı olguları inceler; yani zarlar, yazı tura gibi. İstatistikte ise ‘gerçek’ olaylar hesaplanır, doğum oranları, ölüm oranları gibi. Diğer bir değişle olasılık teorisi denklemler oluşturmak içindir, bunlar da istatistikleri elde etmekte kullanılır.” Olasılıksız, Adam FAWER

İstatistik analizlerinin genel şeması

  • Soruları Belirlemek: Böylelikle ilgi alanına uygun doğru sorular sorarak analizin ilk aşaması gerçekleştirilir. Varsayımların (hipotezler) sınanabilmesi için sorulara doğru bir şekilde karar vermek önemlidir.
  • Verileri Toplamak: Varsayımların yanıtlanabilmesi için en uygun istatistiksel yöntemlerle gerekli verileri toplama işidir.
  • Düzenleme ve Özetleme: Toplanan verileri analize uygun hale getirip betimsel istatistik yöntemleriyle (grafikler, sınıflama tabloları, sıklık dağılımları, ortalama, medyan, çeyreklikler vs. hesaplama) düzenlemedir.
  • Sonuç Çıkarma: Diğer maddelerin yardımıyla analizi gerçekleştirip yorumlama ve raporlama işlemidir.

Bu dört maddenin bileşimi sonucunda sorular cevapsız kalabilir ve yeniden soru üretip aynı döngüyü gerçekleştirmek gerekebilir. Görüldüğü gibi hem betimsel hem de çıkarımsal istatistik uygulamalı istatistiğin alanına girer.

Dolayısıyla istatistik teorik ve uygulamalı istatistik diye ikiye ayırılır. Teorik istatistik matematik bilim dalını temel alarak istatistiğin teorisinin gelişimini ve uygulamalı istatistiğe yeni yöntemler sunma işini üstlenir. İstatistiksel yöntemler geliştirirken ve yöntemlerin altında yatan teoriyi incelerken istatistikçiler çeşitli matematiksel hesaplama araçlarını kullanırlar. Uygulamalı istatistik ise hem betimsel hem çıkarımsal istatistikler yardımıyla analizleri gerçekleştirip sonuçlayan ve raporlayan alandır.

İstatistik, verilerin toplanması, analizi, yorumlanması ve sunumu ile ilgili bir matematik bilimidir. Fiziksel ve sosyal bilimlerden beşeri bilimlere kadar çok çeşitli akademik disiplinlerde hatta neredeyse tüm bilimsel alanlarda uygulanabilen disiplinlerarası bir bilim dalıdır. İstatistikler ayrıca karar verme süreçlerinde bilinçli kararlar alabilmek için de kullanılır.

Okuma önerisi: Ekonomi Bilimi İçin Neden Matematik Gereklidir?

Kör olmak yerine ölmeleri istatistik bakımdan büyük bir değişiklik getirmez. İyi de kör olmak ölmek değil ki? Evet ama ölmek kör olmak demek.” Körlük, José SARAMAGO

İstatistik Biliminde Etik Kavramı

İstatistik -diğer bilim dallarında olduğu gibi- etiğin özellikle ön planda tutulması gereken bir alandır. Verileri manipüle etmek veya gizlemek, sayıların gerçekte ne sunduğunu değil, sadece araştırmacının ne istediğini yansıtmak ve böylece ünlü “Yalanlar, kuyruklu yalanlar ve istatistikler” ifadesini doğurmak nispeten basittir.

Ancak, bu durumun gerçekleşmediği zaman istatistiksel bir analizin sonuçlarına inanmamak için hiçbir neden yoktur.

İstatistik çalışmalarında etik kolay gerçekleşmez ve zaman zaman oldukça karmaşık olabilir. Doğru türde bir istatistiksel analiz yapılmadığında etik olmayan sonuçlar görülür. Veri toplamadan veri yorumlamaya kadar etik olmayan davranışlar her noktada ortaya çıkabilir.

Veri toplama, nesnel gerçekliklerden ziyade amaca uyan yanlış sorular ortaya konularak doğası gereği önyargılı hale getirilebilir. Örneğin bir anket, istatistiksel olarak anlamlı olmadığı için gerçek kamuoyunu yansıtmayabilir.

Düzenlenen anketin gerçeği analiz etmek yerine, araştırmacının bakış açısını kanıtlamak istediği her zaman bu durum oluşur.

Diğer etik olmayan davranışlar, bilim insanlarının teorilerini veya bakış açılarını doğrulamak için raporlarına ve analizlerine, verilerin aykırı (uç ya da sapan) değerlerini dahil etmemesiyle ortaya çıkar.

Bilim insanları, verileri gizleyerek veya yalnızca belirli bir teoriyi güçlendiren veri noktalarını rapora ekleyerek etik dışı davranış sergilerler.

Baylar, anladığım kadarıyla siz insan çıkarlarına ait listeyi bazı istatistik bilgilerinden, iktisat formüllerinden çıkarmışsınız.” Yeraltından Notlar, DOSTOYEVSKİ

İstatistiklerde etik, veri sunumu sırasında da çok önemlidir. Sayılar yalan söylemez, ancak yorumları yanıltıcı olabilir.

Örneğin, birçok müşterinin kapsamlı bir araştırmasından sonra, bir şirket yalnızca şirketi iyi yansıtan sayıları ve rakamları yayınlamaya ve kullanıma sunmaya karar verebilir; şirketin aksayan yönlerini gösteren diğer rakamlara gereken önemi vermez.

Tıpta yeni bir tedavi yöntemi geliştiren bir araştırma grubunun tedavinin iyi yönleri açısından yüksek gelen sonuçları sunup aksayan yönleri açısından sonuçları yorumlamaması da etik dışı davranışlara ve yanıltıcı sonuçlara sebep olur.

Bu durum, tedavinin uygulanıp uygulanmaması konusunda karar verecek diğer araştırmacılara oldukça kötü bir örnek teşkil eder.

Bir araştırmacı, objektif olmak ve herhangi bir ayrıntıyı gizlemeden veya kişisel kazanç için bir şeyi fazla vurgulamadan deneyden elde edilen tam sonucu sunmak zorundadır. İstatistikte etik, nesnel ve gerçeği yansıtacak şekilde araştırmaya doğru yön vermek için önemlidir.

Toplum, istatistiksel yöntemlerle desteklenen bilimsel yargılara bağlı olduğu için, eğitim, meslek veya iş unvanı ne olursa olsun, tüm istatistik uygulayıcıları profesyonel, yetkin ve etik bir şekilde çalışma ve her türlü mesleki ve bilimsel çıkarını geri plana atma yükümlülüğüne sahip olmak zorundadır.

İsveçli matematikçi ve yazar Charles Wheelan’ın da dediği gibi “istatistikleri kullanarak yalan söylemek kolaydır ama onlar olmaksızın gerçeği söylemek zordur.”

Matematiksel

Paylaşmak Güzeldir

Olgun Duran

Ömür boyu öğrencilik felsefesini benimsemiş amatör tiyatro oyuncusu, TEGV'de gönüllü aktivist; kitaplarından, doğaya hayranlığından, yeni yerleri görmekten, gittiği yerlerin kültürünü keşfetmekten ve bunların uğruna çabalamaktan vazgeç(e)meyen kişi...  

2 Yorum

  1. bana, içinde bolca çözülmüş örnekleri olan, anlaşılır şekilde yazılmış; ‘mühendisler için istatistik’ kitap adları önerirseniz sevinirim.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu
Kapalı