Matematik Ne İşe Yarar?

Veri Bilimi, Big Data ve Ardındaki Matematik

Bilgi çağında yaşıyoruz. Bu esnada yaptığımız şeylerin çoğu da büyük miktarda veriye erişimimiz ile alakalı. Bu bilgi tufanını tanımlayan kelime Büyük Veri yani Big Data’dır. Mevcut Büyük Verinin önde gelen kaynağı ise internettir. Bir tahmine göre, her yıl internete çoğu grafiksel içerikli yaklaşık 1021 bayt bilgi eklenmektedir. Bu verilerin önemli bir kaynağı da, sürekli yeni içerik ile beslediğimiz sosyal medyadan gelmektedir. Sonuçta, her alışveriş yaptığımızda, bankamızı çevrimiçi olarak kullandığımızda, elektrikli bir cihazı açtığımızda, cep telefonu kullandığımızda veya bir e-posta yazdığımızda, prensipte analiz edilebilecek bilgileri içeren veriler oluşturuyoruz. Bunun sonucunda da veri bilimi, günümüzün en popüler araştırma ve uygulama alanlarının başında geliyor.

Büyük Veri aslında en az 100 yıldır matematiksel araştırmaların konusu olmuştur. Klasik bir örnek, güvenilir hava tahminleri üretmek için bu veriyi kullanan meteorolojidir. Benzer şekilde iklim modelleri, jeofizik ve astronomi de büyük veriden yararlanır. Bununla birlikte, bu problemlerdeki veri kümeleri iyi yapılandırılmış ve anlaşılmıştır. Bunun nedeni, bilim insanlarının genel olarak iyi anladığı fiziksel süreçlerden gelmeleridir. Büyük Veriyi anlamanın ve onunla uğraşmanın gerçek zorlukları insan temelli faaliyetlerde karşımıza çıkar. Bu tip veriler nicel olmaktan çok niteldir, homojen değildir ve fiziksel verilerin olmadığı bir şekilde, şeylerin kendisinden ziyade şeyler arasındaki ilişkilerle ilgilidir.

Big Data Yani Büyük Veri Hangi Sorulara Cevap Verir?

Aslında, bu kadar önemli olan verinin kendisi değil, içinde yer alan bilgilerdir. Matematik bilimlerinden temel teknikleri kullanarak, verilerden anlamlı sonuçlar elde etmek mümkündür. “Veriyi nasıl görselleştirir, onu üreten sistemler üzerinde nasıl deneyler yaparız ve nihayetinde bu sistemleri nasıl kontrol edebiliriz?” soruların arkasındaki matematiksel ve bilimsel zorluklar, önemli oldukları kadar çeşitlidir. Ancak temeli matematiksel algoritmalara dayanır. Bu sayede verilerden elde edilecek bilginin sınırlamalarını anlayabiliriz. Bu bilginin sonraki birkaç saniye, dakika, saat içinde bulunup bulunmadığını görebiliriz. Verilerden çıkardığımız sonuçlar hakkında ne kadar kesin veya belirsiz olmamız gerektiğini anlamak için matematik ve istatistikleri kullanabiliriz. Matematik ve istatistik, veri devriminin merkezinde yer alır.

Veri bilimi oyununda ön sıralarda yer almak için bilinmesi gerekenler

  • Fonksiyonlar, Değişkenler, Denklemler ve Grafikler: Matematiğin bu alanı bir doğru denkleminden binom teoremine ve bu ikisi arasındaki diğer tüm temel konuları kapsar. Bir milyon veriden oluşan bir veri tabanında yapılan bir aramanın daha hızlı nasıl yapılabileceğini anlamak isterseniz, “ikili arama” denen bir kavramla karşılaşırsınız. Bu aramanın dinamiğini anlamak için, logaritmayı ve indirgeme bağıntılarını anlamanız gerekir. Veya bir zaman serisini analiz etmek istiyorsanız “periyodik fonksiyonlar” ve “üstel azalma” gibi kavramlarla karşılaşırsınız.
  • İstatistik: Temel istatistik ve olasılık kavramları ile ilgili sağlam bir anlayışa sahip olmanın önemi azımsanmamalıdır. Bu alandaki birçok uygulamacı klasik makine öğrenmesini istatistiksel öğrenmeden ayrı düşünmez. Olasılık dağılım fonksiyonları rastgele sayı üretimi, doğrusal regresyon ve diğerleri. Bir veri bilimcisi neredeyse her gün bu kavramlara ihtiyaç duyar.
  • Lineer cebir: Makine öğrenmesi algoritmalarının öngörü oluşturmak için veri akışı üzerinde nasıl çalıştığını anlamak için kullanılan önemli bir matematik dalıdır. Facebook’taki arkadaş önerilerinden, Spotify’daki şarkı önerilerine, çektiğiniz selfieyi Salvador Dali tarzı bir portreye aktarmaya kadar her şey gücünü matrislerden ve matris cebirinden alır. Tüm sinir ağı algoritmaları, ağ yapılarını ve öğrenme işlemlerini temsil etmek ve işlemek için lineer cebirsel teknikler kullanır.
  • Matematiksel Analiz: Şimdiye kadar ister sevmiş, ister nefret etmiş olun eğer veri bilimi ve makine öğrenmesinde akranlarınızdan bir adım öne çıkmak istiyorsanız matematiksel analizden kurtuluşunuz yok. 
  • Ayrık Matematik: Matematiğin bu alt dalı, veri biliminde sık tartışılmaz fakat tüm modern veri bilimi hesaplama sistemlerinin yardımıyla yapılır. Ayrık matematik bu tür sistemlerin kalbinde yer alır. 
  • Optimizasyon ve Yöneylem Araştırması:  Optimizasyon ve yöneylem araştırması konuları en çok teorik bilgisayar bilimi, kontrol teorisi veya yöneylem araştırması gibi uzmanlık gerektiren alanlarla ilgilidir. Ancak bu tekniklerin temel olarak anlaşılması makine öğrenmesinde de verimli olabilir. Neredeyse her makine öğrenmesi algoritması, çeşitli kısıtlamaları tabi olan bir tür tahmin hatasını en aza indirmeyi amaçlar. Bu ise bir optimizasyon problemidir.

Veri Biliminin Arka Planında Ağ Teorisinin Gücü

Ağ teorisi, düğüm adı verilen ve kenar adı verilen şeylerle birbirine bağlanan nesneleri tanımlar. Burada düğümler dediğimiz şey bilgisayarlar veya web siteleri olabilir. Kenarlar ile de bilgisayarlar veya web siteleri arasındaki bağlantılar anlaşılmalıdır. Düğümler ayrıca insanlar ve arkadaşlarının Facebook veya Twitter’daki bağlantıları gibi şeyler de olur. Ağ teorisi, ağların doğasını açıklar, veri kümelerindeki bireysel noktalar arasındaki bağlantıları aramamıza izin verir. Bu sayede bir ağ etrafındaki bilginin hareketini tanımlayabiliriz.

Ağ teorisi, Büyük Veri ile ilgili birçok soruyu ele alır. Çok büyük ağlarla uğraşırken, kümeleri (birbirleriyle yüksek düzeyde bağlantılı düğüm grupları) belirlemek veya verileri ortak özellikleri paylaşan gruplara bölmek her zaman kolay değildir. Bu tür bilgiler, veri madenciliği ve örüntü tanımada hayati öneme sahiptir. Özellikle müşterilerinin davranışları ve tercihleriyle ilgilenen perakende sektörüyle de ilgilidir. Aynı zamanda sosyal ağlardaki arkadaşlık gruplarını belirlemek ve hatta oylama kalıplarını bulmak için de kullanılır.

Bu tür bir analiz aynı zamanda birçok uygulamada karşılaşılan çok önemli bir başka soruna da çözüm sağlar. Bu uzay ve zamanda farklı ayrıntı düzeylerine sahip veri tabanlarını birbirine bağlamaktır. Bir örnek, verilerin bir kısmının Dünya’nın yörüngesindeki uydulardan geldiği hava durumu tahminidir. Diğer veriler, her gün sadece birkaç ölçüm yapabilen izole yer istasyonlarından gelir. İki veri kümesi de faydalıdır ve sorunsuz bir şekilde birbirine bağlanmaları gerekir.

Bir ağın bütün olarak ne kadar bağlantılı olduğu sorusu da aynı derecede önemlidir. Bireysel düğümler ağ boyunca diğer birçok düğüme mi bağlı, yoksa bağlantılar seyrek mi? Ağdaki en kısa yol nedir? Bu sorular, internette verimli yönlendirme, lojistik verilerin yorumlanması, ağızdan ağıza iletişimin ve hatta pazarlamanın hızını anlamak için gereklidir. Ağ teorisi, büyük ağlarda etkili düğümleri aramak için de gereklidir. Yüksek düzeyde bağlantılı düğümlerbir ağın sağlamlığı için son derece önemlidir.

Matematik Veri Biliminde Başka Ne İşe Yarar?

Ağ teorisi, Büyük Veriyi incelemek için kullanılan çeşitli matematiksel tekniklerden sadece biridir. Büyük Verilerin çoğu görüntü biçimini alır. Bu nedenle görüntüleri sınıflandıran, yorumlayan, analiz eden ve sıkıştıran matematiksel algoritmalar da son derece önemlidir. İstatistiksel yöntemler, görüntüleri analiz etmek ve yorumlamak için uzun süredir kullanılmaktadır. Ancak son zamanlarda yeni matematiksel algoritmalarda önemli bir büyüme olmuştur. Bu algoritmalardan bazıları karmaşık denklemlerin analizine dayanmaktadır. Örneğin, Cebir kullanarak şekillerin özelliklerini araştıran bir matematik alanı olan cebirsel topoloji, görüntüleri sınıflandırmada çok faydalı bir rol oynar.

Ayrıca matematiksel yapıları soyut bir düzeyde araştıran bir alan olan kategori teorisinden gelen teknikler, çeşitli bileşenlerin birbirine nasıl uyduğunu görmek için kullanılabilir. Makine öğrenimi bağlamında bu, makinelerin bir görüntüdeki nesnelerin ne olduğunu “algılamasına” ve bu konuda “mantıklı” kararlar vermesine olanak tanır.

Veri bilimi, büyük veri yani Big Data ile matematik arasında buraya kadar aktardıklarımız detaylı olmayan kısa bir liste. Bu çalışmalarda yer edinen matematik ve bilgisayar biliminin başka birçok alanı vardır. Veri bilimi geleceğin bilimidir. Bu nedenle sevin ya da sevmeyin bu alana dahil olmak en azından olan biteni anlamak için matematik bilmek bir zorunluluktur.


Bunlara da göz atmak isteyebilirsiniz…


Kaynaklar ve ileri okumalar:

Matematiksel

Fatma Ayca Cetinkaya

Matematik alanındaki lisans derecemi Ankara Üniversitesi'nden, yüksek lisans ve doktora derecelerimi Mersin Üniversitesi'nden aldım. Mersin Üniversitesi Matematik bölümünde öğretim üyesi olarak görev yapmaktayım.
Başa dön tuşu