Veri bilimi sürecini kim denetliyor?
Çoğu kurumda veri bilimi projeleri, genellikle üç tür yönetici tarafından denetlenir:
İşletme yöneticileri: Bu yöneticiler, sorunu tanımlamak ve analiz stratejisi geliştirmek üzere veri bilimi ekibi ile birlikte çalışır. Pazarlama, finans veya satış gibi bir iş kolunun yöneticisi olabilirler ve bu yöneticilere bağlı çalışan bir veri bilimi ekibi bulunur. Projelerin teslim edilmesini sağlamak üzere veri bilimi ve BT yöneticileriyle yakın çalışma yürütürler.
BT yöneticileri: Kıdemli BT yöneticileri, veri bilimi operasyonlarını destekleyecek altyapı ve mimariden sorumludur. Veri bilimi ekiplerinin verimli ve güven içinde çalışmasını sağlamak üzere operasyonları ve kaynak kullanımını sürekli izlerler. Aynı zamanda veri bilimi ekipleri için BT ortamlarının oluşturulması ve güncellenmesi sorumluluğunu üstlenmiş olabilirler.
Veri bilimi yöneticileri: Bu yöneticiler, veri bilimi ekibini ve günlük faaliyetlerini gözetir. Ekip gelişimini proje planlama ve izleme ile dengeleyebilecek ekip kuruculardır.
Ancak bu süreçteki en önemli oyuncu veri bilimcidir.
Veri bilimci kimdir?
Veri bilimi bir uzmanlık olarak henüz gençlik döneminde. İstatistiksel analiz ve veri madenciliği alanlarından ortaya çıktı. Data Science Journal 2002 yılında International Council for Science: Committee on Data for Science and Technology tarafından yayımlanarak yayın hayatına başladı. 2008 yılına gelindiğinde veri uzmanı unvanı ortaya çıktı ve kısa süre içinde bu alanda büyük ilerlemeler kaydedildi. Giderek daha fazla sayıda kolej ve üniversitede veri bilimi bölümleri açılmaya başlansa da o zamandan bu yana yeterince veri uzmanı bulunamıyor.
Veri bilimcilerin görevleri arasında verileri analiz etmek için strateji geliştirme, verileri analiz için hazırlama, verileri keşfetme, analiz etme ve görselleştirme, Python ve R gibi programlama dillerini kullanarak verilerle birlikte modeller oluşturma ve modelleri uygulama yazılımlarına konuşlandırma sayılabilir.
Veri uzmanları tek başına çalışmaz. Hatta en etkili veri bilimi, ekipler hâlinde yapılır. Bu ekip veri bilimciye ek olarak, sorunu tanımlayan bir iş analistinden, verileri hazırlayan ve verilere nasıl erişileceğini belirleyen bir veri mühendisinden, altta yatan süreçlere ve altyapıya ilişkin gözetim faaliyetlerini yürüten bir BT mimarından ve modelleri veya analiz sonuçlarını uygulama yazılımlarına ve ürünlere konuşlandıran bir uygulama yazılımı geliştiricisinden oluşur.
Veri bilimi projelerini uygulamanın zorlukları
Veri biliminin vaatlerine ve veri bilimi ekiplerine yapılan büyük yatırımlara rağmen pek çok şirket verilerinin sağladığı değerin tamamımdan yararlanamıyor. Bazı şirketler yetenekleri işe alma ve veri bilimi programları oluşturma konusunda yarışırken farklı çalışanların birlikte iyi çalışmayan araç ve süreçleri kullandığı verimsiz ekip iş akışlarıyla karşılaştı. Yöneticiler, daha disiplinli ve merkezi bir yönetim olmadan yatırımlarının karşılığını tam olarak alamayabilir.
Bu kaos ortamı beraberinde pek çok zorluğu getirir.
Veri uzmanları verimli çalışamıyor. Veri uzmanları, verilere erişim iznini BT yöneticisinin vermesi gerektiğinden genellikle verileri ve bu verileri analiz etmek için gereken kaynakları uzun süre beklemek zorunda kalıyor. Veri bilimi ekibi eriştikleri verileri farklı ve muhtemelen uyumsuz araçları kullanarak analiz ediyor olabilir. Örneğin, bir uzman R dilini kullanarak model geliştirebilir ancak kullanılacağı uygulama yazılımı farklı dilde yazılmış olabilir. Bu nedenle modelleri kullanışlı uygulama yazılımlarına dağıtmak haftalar, hatta aylar sürebilir.
Uygulama yazılımı geliştiricileri kullanılabilir makine öğrenimine erişemiyor. Bazı durumlarda geliştiricilerin aldığı makine öğrenimi modelleri uygulama yazılımlarında konuşlandırmaya hazır olmayabiliyor. Erişim noktaları sabit olabileceği için modeller tüm senaryolarda konuşlandırılamıyor ve ölçeklenebilirlik uygulama yazılımı geliştiricisine bırakılıyor.
BT yöneticileri desteğe çok fazla zaman harcıyor. Açık kaynak araçların çoğalması nedeniyle BT’nin desteklemesi gereken araçlar listesi gittikçe büyüyebilir. Örneğin, pazarlama bölümündeki bir veri uzmanı, finans bölümündeki bir veri uzmanından farklı araçlar kullanabilir. Ekipler de farklı iş akışlarıyla çalışabilir. Bu da BT ekibinin ortamları sürekli yeniden oluşturmasını ve güncellemesini gerektirir.
İş yöneticileri, veri biliminden fazla kopuk. Veri bilimi iş akışları her zaman iş kararlarını alma süreçlerine ve sistemlerine entegre edilmez ve bu durum, iş yöneticilerinin veri uzmanlarıyla bilgiye dayalı bir iş birliği kurmasını zorlaştırır. Daha iyi entegrasyon olmadan, iş yöneticileri neden prototipten üretime kadarki sürecin uzun sürdüğünü anlamakta güçlük çekiyor ve çok yavaş olarak gördükleri projelere yatırım yapılmasını destekleme olasılıkları daha düşük oluyor.