
İnsanlığın kaydettiği bilgi miktarı baş döndürücü bir hızla artıyor. Günümüzde yeni bilgilerin neredeyse tümünü dijital ortamda, bilgisayarların okuyabileceği biçimde üretiyoruz. Yaptığınız alışverişler, Google aramalarınız, iletişiminizin tümü, cebinizde telefonunuzla saat kaçta nereye kaç adım atarak gittiğiniz, bir web sitesini incelerken imleci ekranın neresinde kaç saniye tuttuğunuz, tüm sağlık bilgileriniz, hepsi kayıt altında. İstatistik bilimiyle büyük veri işleme gücünü birleştiren veri biliminin dünyasına hoş geldiniz.
Veri Bilimi Nedir?

Veri bilimi, görünmeyen kalıpları bulmak, anlamlı bilgiler türetmek ve iş kararları almak için modern araç ve teknikleri kullanarak büyük hacimli verilerle ilgilenen bir çalışma alanıdır. Tahmine dayalı modeller oluşturmak için karmaşık makine öğrenimi algoritmaları kullanır.
İçinde matematik, istatistik, büyük veri, makine öğrenesi, derin öğrenme gibi konuları içeren veri bilim son yıllarda oldukça popüler hale gelmiş ve ilgi odağı olmaya başlamıştır. Veri bilimin çekirdek alanı konusunda henüz tartışmalar sürse de kabaca istatistik ve matematik ile bilgisayar bilimlerinin kesişimi olarak düşünülmelidir.
Bir hiyerarşiye yerleştirmek gerekirse de en altta geniş bir alan olarak matematiği; onun üstünde istatistik ve bilgisayar bilimlerini; onun üstünde algoritma geliştirme, modelleme ve sınıflama yer alacaktır. Bu nedenle de veri bilimi ile uğraşmak isteyen bir kişinin öncelikle matematiği detaylıca öğrenmesi gerekmektedir.
Veri Bilimi Oyununda Ön Sıralarda Yer Almak İçin Hangi Matematik Konularını Bilmelisiniz?

Fonksiyonlar, Değişkenler, Denklemler ve Grafikler: Matematiğin bu alanı bir doğru denkleminden binom teoremine ve bu ikisi arasındaki diğer tüm temel konuları kapsar. Bir milyon veriden oluşan bir veri tabanında yapılan bir aramanın daha hızlı nasıl yapılabileceğini anlamak isterseniz, “ikili arama” denen bir kavramla karşılaşırsınız.
Bu aramanın dinamiğini anlamak için, logaritmayı ve indirgeme bağıntılarını anlamanız gerekir. Veya bir zaman serisini analiz etmek istiyorsanız “periyodik fonksiyonlar” ve “üstel azalma” gibi kavramlarla karşılaşırsınız.
İstatistik: Temel istatistik ve olasılık kavramları ile ilgili sağlam bir anlayışa sahip olmanın önemi azımsanmamalıdır. Bu alandaki birçok uygulamacı klasik makine öğrenmesini istatistiksel öğrenmeden ayrı düşünmez. Olasılık dağılım fonksiyonları rastgele sayı üretimi, doğrusal regresyon ve diğerleri. Bir veri bilimcisi neredeyse her gün bu kavramlara ihtiyaç duyar.
Lineer cebir: Facebook’taki arkadaş önerilerinden, Spotify’daki şarkı önerilerine, çektiğiniz selfieyi Salvador Dali tarzı bir portreye aktarmaya kadar her şey gücünü matrislerden ve matris cebirinden alır. Tüm sinir ağı algoritmaları, ağ yapılarını ve öğrenme işlemlerini temsil etmek ve işlemek için lineer cebirsel teknikler kullanır.
Matematiksel Analiz: Şimdiye kadar ister sevmiş, ister nefret etmiş olun eğer veri bilimi ve makine öğrenmesinde akranlarınızdan bir adım öne çıkmak istiyorsanız matematiksel analizden kurtuluşunuz yoktur.
Ayrık Matematik: Matematiğin bu alt dalı, veri biliminde sık tartışılmaz. Fakat tüm modern veri bilimi hesaplama sistemlerinin kalbinde yer alır.
Optimizasyon ve Yöneylem Araştırması: Bu konular teorik bilgisayar bilimi, kontrol teorisi veya yöneylem araştırması gibi uzmanlık gerektiren alanlarla ilgilidir. Ancak bu tekniklerin temel olarak anlaşılması makine öğrenmesinde de verimli olacaktır. Neredeyse her makine öğrenmesi algoritması, çeşitli kısıtlamaları tabi olan bir tür tahmin hatasını en aza indirmeyi amaçlar. Bu ise bir optimizasyon problemidir.
Veri Biliminin Arka Planında Ağ Teorisinin Gücü Vardır

Ağ teorisi, düğüm adı verilen ve kenar adı verilen şeylerle birbirine bağlanan nesneleri tanımlar. Burada düğümler dediğimiz şey bilgisayarlar veya web siteleri olur. Kenarlar ile de bilgisayarlar veya web siteleri arasındaki bağlantılar anlaşılmalıdır.
Düğümler ayrıca insanlar ve arkadaşlarının Facebook veya Twitter’daki bağlantıları gibi şeyler de olur. Ağ teorisi, ağların doğasını açıklar, veri kümelerindeki bireysel noktalar arasındaki bağlantıları aramamıza izin verir. Bu sayede bir ağ etrafındaki bilginin hareketini tanımlayabiliriz.
Çok büyük ağlarla uğraşırken, kümeleri belirlemek veya verileri ortak özellikleri paylaşan gruplara bölmek kolay değildir. Bu tür bilgiler, veri madenciliği ve örüntü tanımada hayati öneme sahiptir. Özellikle müşterilerinin davranışları ve tercihleriyle ilgilenen perakende sektörüyle de ilgilidir. Aynı zamanda sosyal ağlardaki arkadaşlık gruplarını belirlemek ve hatta oylama kalıplarını bulmak için de kullanılır.
Bu tür bir analiz aynı zamanda birçok uygulamada karşılaşılan çok önemli bir başka soruna da çözüm sağlar. Bu uzay ve zamanda farklı ayrıntı düzeylerine sahip veri tabanlarını birbirine bağlamaktır. Bir örnek, verilerin bir kısmının Dünya’nın yörüngesindeki uydulardan geldiği hava durumu tahminidir. Diğer veriler, her gün sadece birkaç ölçüm yapabilen izole yer istasyonlarından gelir. İki veri kümesi de faydalıdır ve sorunsuz bir şekilde birbirine bağlanmaları gerekir.
Bir ağın bütün olarak ne kadar bağlantılı olduğu sorusu da aynı derecede önemlidir. Bireysel düğümler ağ boyunca diğer birçok düğüme mi bağlı, yoksa bağlantılar seyrek mi? Ağdaki en kısa yol nedir? Bu sorular, internette verimli yönlendirme, lojistik verilerin yorumlanması ve hatta pazarlamanın hızını anlamak için gereklidir. Ağ teorisi, büyük ağlarda etkili düğümleri aramak için de gereklidir. Yüksek düzeyde bağlantılı düğümler bir ağın sağlamlığı için son derece önemlidir. Daha fazlası için: Düğüm Düğüm Bir Dünya: Düğüm Teorisi Nedir?
Matematik Veri Biliminde Başka Ne İşe Yarar?

Ağ teorisi, Büyük Veriyi incelemek için kullanılan çeşitli matematiksel tekniklerden sadece biridir. Büyük Verilerin çoğu görüntü biçimini alır. Bu nedenle görüntüleri sınıflandıran, yorumlayan, analiz eden ve sıkıştıran matematiksel algoritmalar da son derece önemlidir.
İstatistiksel yöntemler, görüntüleri analiz etmek ve yorumlamak için uzun süredir kullanılmaktadır. Ancak son zamanlarda yeni matematiksel algoritmalarda önemli bir büyüme olmuştur. Bu algoritmalardan bazıları karmaşık denklemlerin analizine dayanmaktadır. Örneğin, Cebir kullanarak şekillerin özelliklerini araştıran bir matematik alanı olan cebirsel topoloji, görüntüleri sınıflandırmada çok faydalı bir rol oynar.
Ayrıca matematiksel yapıları soyut bir düzeyde araştıran bir alan olan kategori teorisinden gelen teknikler, çeşitli bileşenlerin birbirine nasıl uyduğunu görmek için kullanılabilir. Makine öğrenimi bağlamında bu, makinelerin bir görüntüdeki nesnelerin ne olduğunu “algılamasına” ve bu konuda “mantıklı” kararlar vermesine olanak tanır.
Veri bilimi ile matematik arasında buraya kadar aktardıklarımız detaylı olmayan kısa bir listedir. Bu çalışmalarda yer edinen matematik ve bilgisayar biliminin başka birçok alanı vardır. Veri bilimi geleceğin bilimidir. Bu nedenle sevin ya da sevmeyin bu alana dahil olmak en azından olan biteni anlamak için matematik bilmek bir zorunluluktur.
Kaynaklar ve ileri okumalar
- Essential Math for Data Science; Yayınlanma tarihi: 9 Ağustos 2018; Bağlantı: https://medium.com
- Necmi Gürsakal, Ecem Özkan, Fırat Melih Yılmaz, Deniz Oktay. “Veri Bilim Eğitimi Nasıl Olmalıdır?”. 1st International Data Science & Engineering Symposium (IDSES’19), 2-3 Mayıs 2019, Safranbolu, Karabük, Türkiye; https://www.academia.edu/
Size Bir Mesajımız Var!
Matematiksel, 2015 yılından beri yayında olan ve Türkiye’de matematiğe karşı duyulan önyargıyı azaltmak ve ilgiyi arttırmak amacıyla kurulmuş bir platformdur. Sitemizde, öncelikli olarak matematik ile ilgili yazılar yer almaktadır. Ancak bilimin bütünsel yapısı itibari ile diğer bilim dalları ile ilgili konular da ilerleyen yıllarda sitemize dahil edilmiştir. Bu sitenin tek kazancı sizlere göstermek zorunda kaldığımız reklamlardır. Yüksek okunurluk düzeyine sahip bir web sitesi barındırmak ne yazık ki günümüzde oldukça masraflıdır. Bu konuda bizi anlayacağınızı umuyoruz. Ayrıca yazımızı paylaşarak veya Patreon üzerinden ufak bir bağış yaparak da büyümemize destek olabilirsiniz. Matematik ile kalalım, bilim ile kalalım.
Matematiksel