İş Zekasıyla Bilgi Üretmek ve Yorumlamak Üzerine

Bir iş zekası çözümü üretmek oldukça kapsamlı ve çetrefilli bir meydan okuma. Öyle ülkemizde sunulduğu gibi "veritabanınızdaki verileri dilediğiniz gibi boyutlandırıp raporlayabilirsiniz" basitliğinde değil. Zaten bu yüzden veri madenciliği teknolojisi bir devrim olarak ortaya konulduğu halde beklenen etkinliği yaratamadı. Verileri boyutlandırıp raporlamak "business intelligence tools" araçları sayesinde gerçekten çok kolay ve zevkliydi ama işin kritik noktası bunun çok ötesindeydi. Veritabanı uzmanlarının ya da yazılımcıların teknik konulardan ziyade, işin özüne odaklanabilmek gibi çok özel yetenekleri yoksa; bu araçların ürettiği raporlar Excel ya da Word raporlarından pek de fazla katma değer yaratmıyordu. Çünkü iş zekası kavramı bir mühendislik işi olmasından çok daha fazla, bir vizyon ve sezgi meselesiydi.

Bir iş zekası çözümünü operasyonel verinin raporlanması olarak algılama yanlışından çıkmak gerek önce. Gerçekten kurumun süreçlerinin ve faaliyetlerinin performansını doğru şekilde ölçmek ve bu performansların nasıl iyileştirilebileceği üzerine bilgi üretmek istiyorsanız operasyonel veriden çok daha fazlasına gereksinimizin var demektir. Operasyonel süreçte hiç ihtiyacınız olmayan; ama süreç ya da faaliyet performansını etkileyen etkenlere ilişkin verilere mesela.

Solice Technologies'de İş Zekası Çözümleri Direktörlüğü'nü yürüttüğüm dönemde bankalara ve bağımsız ATM operatörlerine yönelik olarak bir tahminleme (forecasting) uygulaması geliştiriyorduk ekibimle. Hangi ATM'ye hangi tarihte ne kadar para yüklenmesi gerektiğine ilişkin oldukça karmaşık algoritmalar geliştirdik. Temel olarak yapay sinir ağları prensiplerine dayanan bu algoritmalar pek çok parametreyi dikkate alıyordu: geçmişe yönelik para çekim miktarları, maaş ödeme tarihleri, dönemsel etkinlikler, tatil ya da bayram günleri vs. Operasyon içinde anlamlı olduğuna inandığımız tüm parametreleri algoritmamıza dahil ettiğimizde halde beklediğimiz başarı oranını tutturamamıştık. Bazı günlerde beklenmedik artışlar ya da düşüşler olabiliyordu.

Sonra bir gün verilerini işlediğimiz bankanın Beşiktaş ilçesi sınırları içindeki tüm ATM'lerine ilişkin bir veri toplama çalışması yaptık. Bu çalışma sonucunda, bir ATM'nin parformansını etkileyen pek çok kriter daha olduğunu farkettik. Bir kısmının etkisinin bu kadar yüksek olacağını tahmin etmemiştik, bir kısmı ise aklımıza bile gelmemişti. ATM'nin hemen yanındaki diğer makinanın çalışıp çalışmadığı, güneş ışığının ATM ekranının görüntüsünü etkileyip etkilemediği, üzerinde bir tente olup olmadığı gibi pek çok faktör vardı aslında. Havanın yağmurlu olup olmaması durumunu algoritmamıza bir parametre olarak eklediğimizde gerçek verilere yüzde 8 oranında daha fazla yaklaştık örneğin.

Görüldüğü gibi, sadece operasyonel veriden yola çıktığınızda bu türlü bir uygulamanın başarıya ulaşma şansı pek yoktu. Başka pek çok parametre daha vardı düşünülmesi gereken. Üstelik bunlar sistem çalışır hale geldikten sonra eklenebilir türden parametreler değildi. Daha en baştan veritabanı tasarımına dahil edilmesi gerekiyordu.

Buradaki kritik nokta elbette ki, bu parametrelerin algoritmaya dahil edilmesi değil. Asıl önemli olan bir ATM'nin performansını etkileyen faktörleri masanın üzerine koyabilmek. Bunu da bir ofis odasında oturduğunuz yerden yapamazsınız. Gerçekten işin özünü bilmek, güçlü sezgilere sahip olmak (ilki olmadan ikincisi zaten olamaz) ve "yok daha neler, ATM üzerindeki bir tente ne kadar önemli olabilir ki" demeyecek kadar aklı özgür bırakabilmek gerek.

Bu detayları bilmiyorsanız ve sisteminize ona göre tasarlamamışsanız harika özelliklere sahip bir raporlama aracı neyinize yarar ki!

Süreç ya da faaliyetlerin performanslarını etkileyen parametreleri yapıya entegre etmek yetmiyor çok zaman. Bu parametreler arasındaki ilişkiyi de doğru belirleyebilmek gerek.

ATM tahminleme projesinde karşılaştığımız ilginç durumlardan biri de şuydu: Yağışlı havalarda ATM'lerden çekilen para miktarlarının düşeceğini ama bu oranın ATM'den ATM'ye değişiklik göstereceğini varsaymıştık. Gerçekten de yağmurlu bir günde ATM'den para çekme oranları "outdoor" makinalarda ciddi oranda düşüyordu. Ama alışveriş merkezlerinde konumlandırılmış makinalar için bu durum her zaman bu şekilde gerçekleşmiyordu. Hatta yağmur sebebiyle kapalı mekanlara yönelen insanlar para çekim miktarlarının artmasına sebep oluyordu.

"Yağmurlu hava, açık ve kapalı mekanlardaki ATM'leri farklı yönde etkiler gibi" bir mantık kurmak da mümkün değildi. Çünkü Beşiktaş'ın İnönü Stadyumu'nda maçı yaptığı günlerde yağmurun etkisi ihmal edilebilir bir hale dönüşüyor, başat parametre futbol maçı oluyordu. Beşiktaş'ın maç programını sisteminize dahil etmeniz gerektiğini düşünmez ya da parametreler arasındaki ilişkileri doğru kuramazsanız, elinizdeki operasyonel veri neye yarar ki!

Tabii iş, altyapıyı düzgün kurup doğru bilgiler üreten raporu hazırlamakla bitmiyor. Raporu doğru okuyabilmeli ve bu bilgileri doğru bir şekilde yorumlayabilmelisiniz. Bununla ilgili çok çarpıcı bir örneğim var. Ülkemizin aklı en özgür akademisyenlerinden ve gazetecilerinden biri olan Mehmet Altan, Star Gazetesi'ndeki 30 Temmuz 2009 tarihli Meryem'in Kürt Açılımı adlı yazısında tam da buna değinmişti:

Türkiye'nin en yüksek doğum oranına sahip kentlerden biri olan Muş'ta, 6,5 aylık olarak dünyaya gelen ikiz kardeşlerin yaşayabilmeleri için solunum cihazlı kuvözlere konmaları gerekiyordu. Oysa bu tip kuvöz Muş'ta yoktu. Erzurum'da, Diyarbakır'da, Elazığ'da, Şanlıurfa'da ve Bingöl'de de yoktu. Güzel haber Van'dan gelmişti, ama ne yazık ki orada da yalnızca bir tane vardı. Doktorlar sağlık durumu kardeşine göre daha iyi olan Ebrar bebeği Van'a naklettiler. Ebrar bebek kurtulmuştu ama Meryem bebek ikinci bir solunum cihazlı kuvöz bulunamadığı için maalesef yaşamını yitirmişti.

Olay gerçekten çok acı ve konumuz açısından da ibret verici. Tüm verileri değerlendirip, yüksek yetenekli raporlama araçları kullanıp Doğu Anadolu Bölgesi'nin Türkiye'nin doğum oranı en yüksek bölgesi olduğunu, Muş'taki doğum oranının da bölgeyle paralellik gösterdiğini açıklıkla ortaya koyabilirsiniz. Verinin gerçek anlamda bilgiye dönüşmesi için çok güzel bir örnek. Ancak okuma, anlama ve yorumlayabilme yeteneğiniz yoksa, bu bilgiye sahip olmak neye yarar? Böyle bir bilgi üretildikten sonra, bölgedeki hastanelere yeterli sayıda solunum cihazlı kuvöz konması akıl edilemiyorsa, o bilgi neden üretilir ki? İstatistik, yalnızca okumak için midir, biraz da yorumlayabilmek gerekmez mi?

İşte bu yüzden veri madenciliği tek başına hiçbir şeyken, iş zekası çok fazla şeydir. Bu yüzden iş zekası çözümleri üretiyoruz diyen kurumlar, - bilerek ya da bilmeyerek - aslında sadece basit veri madenciliği uygulamaları sunuyorlar. Sektör bilgisi dahil edilmemiş bir sistem nasıl bir iş zekası çözümü olabilir ki? Üstelik bu yazılımlar bir bilgiyi yorumlayıp nasıl çözüm üretebilir ki... Kavramın içini boşalttıkça, hem kendimizi hem de müşterilerimizi daha fazla kandırmıyor muyuz, ne dersiniz?

Bülent Göven - 11.09.2009