İnsanlar, Çubuk Grafiklerdeki Verileri Nasıl Yanlış Yorumluyor?

Çubuk grafiklerin bu kadar yaygın olmasının bir nedeni var; çoğu veri kümesini görselleştirme yeteneğine sahiptirler ve beynimiz onları sever. Gözlerimiz, uzunlukları hızlı bir şekilde karşılaştırabilir ve mesafeleri değerlendirebilir. Böylece hem basit hem de oldukça etkili olan çubuk grafiklerini (dikey çubuklara sahip) okuyabiliriz. Onları haber makalelerinde, iş raporlarında, sunumlarda, ders kitaplarında, anket sonuçlarında, bilgi grafiklerinde kısaca her yerde görebiliriz.

Dolayısıyla çubuk grafikler, verileri temsil etmede kullanılan popüler araçlardandır. Basit olduğunu söyledim; acaba gerçekten nasıl okunacağı konusunda doğru bilgiye sahip miyiz? Wellesley College’ın Journal of Vision dergisinde yayınlanan bir araştırma, ortalamaya dayalı çubuk grafiklerin sıklıkla yanlış yorumlandığını buldu. Çalışma, tamamen aynı grafiğe bakan kişilerin, temsil ettiği gerçekleri tamamen farklı anlayışlarla algıladığını gösteriyor.

Çubuk Grafikleri Bir Çoğumuz Yanlış Anlıyoruz

Makalenin ilk yazarı ve Wellesley College’da araştırma görevlisi olan Sarah H. Kerns’e göre bu çalışma, çubuk grafiklerin pek çok kişinin varsaydığı gibi net iletişim araçlarından biri olmadığını ortaya çıkardı. Kerns, “Ortalamaya dayalı çubuk grafikleri, ortalamanın değerine bağlı olduğundan yaygın bir şekilde çubuk uç sınırı hatasını ortaya çıkarır. Bu da grafiklerin kategorik olarak yanlış yorumlanmasına sebep olur.” diyerek konunun önemine dikkat çekiyor.

Aslında bu hatanın sebebi şudur. Veri dağılımı, ortalama grafiğiyle sayı grafiği arasında kategorik olarak farklılık gösterir. Ortalama bir çubuk grafikte çubuk ucu, verilerin dağılımı hakkında ön fikir sunan ve dengeli merkez noktası olan ortalamadır. Ortalamanın değeri de uç değerlerden (ortalamadan aşırı büyük ya da küçük gözlemlerden) oldukça etkilendiğinden çubuk uç sınır hatasına yol açar.

Ortak yazar Doç. Dr. Jeremy Wilmer , “Ortalama değerleri gösteren çubuk grafikler siyasette, bilimde, eğitimde ve tıpta olmak üzere her yerde bulunur. İklim değişikliği, halk sağlığı ve ekonomi dâhil olmak üzere çok çeşitli konularda veri iletmek için kullanılır” diyor ve ekliyor. “Bunun gibi alanlarda netlik eksikliği, kamu söylemi üzerinde geniş kapsamlı olumsuz etkilere sahip olabilir.”

Veri dağılımı, ortalama ve sayı grafikleri arasında kategorik olarak farklılık gösterir. (a) Ortalama çubuk grafikler ve (c) sayım çubuk grafikleri. Temel görünümde farklılık göstermezler; ancak kategorik olarak farklı veri dağılımlarını gösterirler. (b) Ortalama bir çubuk grafikte çubuk ucu, verilerin dağıldığı dengeli merkez noktası veya ortalamadır. Buna Bar-Tip Ortalama dağılımı diyoruz. (d, e) Bir sayım çubuğu grafiğinde çubuk ucu, çubuk içinde toplanan verileri içeren bir sınır görevi görür. Buna Bar-Tip Limit (BTL) dağılımı diyoruz.

Görsel olarak birbirinin aynı olan bu iki çubuk grafiği, şekilde gösterildiği gibi farklılık gösterir. Bir sayım çubuk grafiği toplamı gösterdiğinden çubuk ucu, tamamen çubuk içinde yer alan tek gözlem düzeyindeki verilerin sınırıdır (Şekil (d) ve (e)). Ortalama bir çubuk grafik, aksine, merkezi bir eğilimi gösterir. Tek gözlem düzeyindeki veriler bu çubuk ucuna dağılacaktır. (Şekil (b)).

Görsel Okumada Yeni Bir Keşif

Çubuk grafikler hakkındaki keşif, yeni bir ölçüm tekniği ile mümkün oldu. Bu teknik, bir kişinin kâğıda çizdiği grafiği yorumlamasına dayanıyordu. Araştırma ekibi, yüzlerce kişiden oluşan bir gruba çubuk grafiğin altında yatan verilerin nerede olacağına inandıklarını grafikler üzerinde noktalar çizerek göstermelerini istedi. Sonuç olarak çarpıcı bir desen ortaya çıktı.

Yaklaşık beş grafik okuyucudan biri, ortalamaları gösteren çubuk grafiklerini kategorik olarak yanlış yorumladı. Wilmer, “Bu okuyucular, ortalamanın altındaki veri noktalarının neredeyse tamamını çizdi. Ortalama, verilerin dengeli merkez noktasıdır. Verilerin büyük kısmının ortalamanın altında olması imkânsızdır. İzleyici, çubuğun ucunu verinin dış sınırı olarak yanlış yorumladığı için, bu hataya ‘çubuk ucu sınırı hatası’ adı verildi. İlginç olan bulgulardan biri, yapılan hatanın değişik milletler arasında yaş, cinsiyet, eğitim seviyesinden bağımsız eşit derecede yaygın olarak gözlemlenmesiydi.

Bir Uygulama

Kendiniz bir uygulama denemek isterseniz, lütfen yanınıza bir kâğıt ve bir de kalem alın. Aşağıdaki maddeleri sırayla takip edin:

1. Yukarıdaki grafiğe göz atın. Bu görsel, Science Friday personeli tarafından derecelendirilen dört hayvanın ortalama zekâ puanını gösterir. Her çubuğun bir ortalamayı temsil ettiğini unutmayın.

2. Bu grafiği bir kâğıda çizin veya kendi kopyanızı yazdırın.

3. En soldaki çubukta, o çubukta gösterilen değeri elde etmek için, ortalaması alınacak olası gözlem noktalarını gösteren 20 nokta çizin.

4. Ardından, Golden Mole çubuğu için de aynısını yapın. Çubuk grafik çiziminiz neye benziyor? Daha çok aşağıda verilen ilk resimdeki A gibi mi yoksa ikinci resimdeki B gibi mi?

Resim A: Pink Fairy Armadillo çubuğuna çizilmiş 20 nokta ve Golden Mole çubuğuna çizilmiş 20 nokta. Noktaların her birinin çubuğun üstünde ve altında dağılması gerektiğini unutmayın.
Resim B: Pink Fairy Armadillo çubuğuna çizilmiş 20 nokta ve Golden Mole çubuğuna çizilmiş 20 nokta. Noktaların her çubuğun içindeki alanla sınırlı olduğunu görüyorsunuz.

Kerns ve Wilmer çalışmaya katılanlar tarafından yapılan çubuk grafik eskizlerinin iki gruba ayrıldığını buldular. Bir grup, ortalamanın doğru bir yorumunu resmettiler (yukarıdaki şekil A). Sonucunda çubuğun üstünde veya altında veri noktaları gösterdiler. Şekil B’de çubuk uç sınır hatasını yapan diğer grubun çizimlerine aitti. Unutmayın ki bir ortalama değer grafiği, ortalamadan aşağıda ve yukarıda yer alan değerleri içermek zorundadır.

Tarihsel Süreçli Bir Hata

Bu hatanın ciddiyeti göz önüne alındığında, onlarca yıllık grafik yorumlama araştırması bunu nasıl gözden kaçırmış olabilir? Kerns’e göre bunun sebebi önceki araştırmaların; tahminler, olasılıklar hakkında genellikle soyut, dolaylı sorular sormasıdır. Kerns, “Bir kişinin bu tür sorulara verdiği cevaplardan düşüncelerini okumak zordur. Bu, buzlu camdan bakmak gibidir. Kişi orada ne olduğuna dair belirsiz bir fikir edinir. Ancak tanımdan yoksundur. Bizim ölçüm yaklaşımımız ise daha somut, daha doğrudan, daha detaylıdır. Sonucunda çizimler, grafik yorumlayıcısının düşüncesine açık bir pencere sağlıyor.” diyerek somutlaştırmanın önemine vurgu yapmıştır.

Bu çalışmadan alınacak önemli bir ders var. Bu da grafik tasarımındaki basitleştirmenin açıklama yapmaktan daha fazla kafa karışıklığına yol açabileceğini görmemizdir. Sonucunda tek gözlem değerlerini, ortalama gibi bir özet istatistikle değiştirmenin tüm amacı, görsel gösterimi basitleştirmek ve okumayı kolaylaştırmaktır. Ancak bu basitleştirme, grafiğin gerçekte gösterdiği ortalama hakkında da kişiyi yanıltmaktadır.

Ekip, ayrıca bulgularına dayalı olarak veri görselleştirme uygulamalarında bazı değişiklikler önerdi. İlk olarak, bir çubuğun yalnızca sayı gibi tek bir değeri iletmek için kullanılmasını öneriyorlar. “Bu durumda hiçbir veri gizlenmez. Aksine, araştırmamız, birden fazla sayının ortalamasını göstermek için kullanılan bir çubuğun ciddi kafa karışıklığı riski taşıdığını gösteriyor.” diyor Kerns.

İkinci tavsiyelerine göre somut, ayrıntılı bilgileri (örneğin, tek tek gözlem noktalarını ele alarak) görsel olarak daha basit ama kavramsal olarak daha soyut bilgilerle (örneğin, ortalama bir değer) değiştirmeden önce iki kez düşünmektir. Wilmer, “Çalışmamız, veri iletişimindeki soyutlamanın ciddi yanlış anlaşılma riskleri taşıdığına dair bir örnek olay sağlıyor” dedi.

Ekibin eğitim odaklı önerileri ise, veri okuryazarlığını öğretmek için veri eskiz görevlerinin kullanımını içerir. Ayrıca öğrencilere gerçek verilerle çalışmasını önerdiler. Kerns, “Veriler temelde somut. Bunun hakkında özet olarak okumanın bir değeri var. Ancak bu her zaman bisiklet sürmeyi öğrenmek için biraz kitap okumak gibi olacaktır. Uygulamalı deneyimin yerini hiçbir şey tutamaz.” demiştir.

Sonuç olarak,

Bilginin hızla yayıldığı ve yanlış anlamaların kamuoyu ve kamu politikası üzerinde derin bir etkisi olabileceği günümüzdeki gibi siyasi ve bilimsel bir ortamda, net veri iletişimi ve sağlam veri okuryazarlığı giderek daha önemli hale geliyor. Kerns, “Marketlerden doktor ofisine veya oy sandığına kadar, veriler karar alma mekanizmamızı etkiliyor. Çalışmamızın, verilerin anlaşılmasını geliştirmeye ve kurumlar ile bireyler tarafından bilinçli karar verme yolunu kolaylaştırmaya yardımcı olacağını umuyoruz.” diye belirterek konunun önemini anlatmıştır.



Kaynakça:

Matematiksel

Olgun Duran

Ömür boyu öğrencilik felsefesini benimsemiş amatör tiyatro oyuncusu ve TEGV gönüllüsü; kitaplarından, doğaya hayranlığından, yeni yerleri görmekten, gittiği yerlerin kültürünü keşfetmekten ve bunların uğruna çabalamaktan vazgeç(e)meyen kişi...  

Bu Yazılarımıza da Bakmanızı Öneririz