Share

Gizli donanım girişimlerinden fintech devlerine ve kamu kurumlarına kadar, ekipler AI stratejileri üzerinde çalışmakta. Ekiplerin aklında her zaman “Yaptığımız işte daha iyi olmak için AI ve makine öğrenimini nasıl kullanabiliriz?” sorusu varken, henüz en temel veri bilimi algoritmalarını ve operasyonlarını uygulamak için çok daha az makine öğrenimini uygulamak (ve bunların faydalarını toplamak) için altyapıyı kurabilmiş değiliz.

AI’ı bir ihtiyaçlar piramidinin tepesi olarak düşünün. Kendini gerçekleştirme (AI) harika, ancak önce yiyecek, su ve barınağa (veri okuryazarlığı, toplama ve altyapı) ihtiyacınız var.

Yapay Zeka İhtiyaçlar Hiyerarşisi

Yapay zeka ve makine öğreniminden önce verileriniz için sağlam bir temele ihtiyacınız vardır.

Temel İhtiyaçlar Nelerdir?

Piramidin dibinde  veri toplama var . Hangi verilere ihtiyacınız var?… Kullanıcıya yönelik bir ürünse, ilgili tüm kullanıcı etkileşimlerini kaydediyor musunuz? Eğer bir sensörse, hangi verileri üretiyor ve nasıl? Henüz enstrümanlaşmamış bir etkileşimi kaydetmek ne kadar kolay? Sonuçta, doğru  veri seti, makine öğreniminin geliştirilmesini mümkün kılan şeydir.

Ardından, veriler sistemden nasıl geçiyor veya depolanıyor? Güvenilir akışlarınız (ETL) var mı? Nerede saklıyorsunuz ve erişim ve analiz etmek ne kadar kolay? Jay Kreps  (yaklaşık on yıldır) güvenilir veri akışının veri ile ilgili herhangi bir şey yapmanın anahtarı olduğunu söylüyor.

Sadece veri erişilebilir olduğunda, onu  keşfedebilir ve dönüştürebilirsiniz. Burada öne çıkan anahtar kelime ‘veri temizliği’ dir. Bu aşmada, bir sürü veriyi kaçırdığınızı, sensörlerinizin güvenilmez olduğunu, bir veriyi yanlış yorumladığınızı ve piramidin tabanının sağlam olmadığını anlayabilirsiniz.

Verileri güvenilir bir şekilde araştırıp temizleyebildiğiniz zaman, geleneksel olarak BI veya analitik düşüncesini oluşturmaya başlayabilirsiniz: izlemek için metrikleri, bunların mevsimselliklerini ve çeşitli faktörlere karşı duyarlılıklarını tanımlayabilirsiniz. Belki kabaca bir müşteri  segmentasyonunu yapıyorsunuz ve bazı verileri dahil etmeye gerek olmadığını düşünüyorsunuz. Ancak, hedefiniz AI olduğundan, makine öğrenim modelinize dahil edileceğimiz, daha sonra değişkenler olarak adlandıracağımız yapıyı inşa ettiğimizi dikkate alarak ilerlemekte fayda var.

Veriler hazır, sonra…

Verilerimiz var, peki şimdi makine öğrenimi yapabilir miyiz? Bir test çerçevesine sahip olmanız gerekir, majör sorunlarla karşılaşmamak adına aşamalarla ilerlemek gerekebilir. Değişiklikleri direk kapsama almak yerine önce etkilerinin kaba bir tahminini yapabiliriz.

Bu noktada, çok basit bir ML algoritmasını kullanabilir, ardından sonuçlarınızı etkileyebilecek yeni değişkenleri düşünebilirsiniz; hava durumu, nüfus sayısı, siyasi gelişmeler, kültürel farklılıklar gibi.

Verileriniz organize ve temizlendi. Gösterge tablolarınız, etiketleriniz ve değişkenleriniz hazır, doğru şeyleri ölçüyorsunuz. Her gün en yeni ve en iyi ML algoritmalarını deneyin. Tıpkı geleneksel bir MVP (minimal olarak uygulanabilir ürün) oluştururken olduğu gibi, modelinize küçük, dikey bir bölümle ile başlarsınız ve bunu baştan sona aşama aşama geliştirirsiniz ve sonuçta tamamlanmış bir modele ulaşırsınız.

Çeviridir: Monica Rogati, Data Science advisor. Turning data into products and stories. Former VP of Data @Jawbone & @LinkedIn data scientist. Equity partner @DCVC. CMU CS PhD. https://hackernoon.com/the-ai-hierarchy-of-needs-18f111fcc00

Share