Veri biliminin Türkiye ve dünyadaki gelişimi
16 Eyl 2021
5 dk okuma süresi
Veri bilimi günümüzün en parlak ve gelecek vadeden alanlarının başında geliyor. Büyük veri hazinelerinin üzerinde oturan şirketler veri bilimiyle her zamankinden daha büyük hedeflere ulaşmak istiyor ve veri bilimcilerin önemi günbegün artıyor.
Veri bilimi, toplanan ve oluşturulan artan veri hacimlerinden eyleme dönüştürülebilir içgörüler çıkarmaya yönelik çok disiplinli bir alandır.
Veri bilimi ve veri bilimi projeleri yapay zekanın bir alt kümesidir. İstatistik, bilimsel yöntemler ve veri analizinin örtüşen alanlarını ifade eder. Bunların tümü verilerden anlam çıkarmak ve içgörü elde etmek için kullanılır.
Dünyadaki verilerin yüzde 90'ının son iki yılda oluşturulduğu tahmin ediliyor. Örneğin, Facebook kullanıcıları her saat 10 milyondan fazla fotoğraf yüklüyor. Ancak bu veriler çoğu zaman veritabanlarında kullanılmadan saklanıyor.
Veri bilimi, Türkiye de dahil olmak üzere tüm dünyada, son on yılda hayatın her alanını değiştirecek kadar büyüdü. Şimdiyse hükümetler, genetik bilimciler, mühendisler ve gökbilimciler tarafından kullanılıyor. Veri biliminin evriminde büyük verinin tek rolü verilerin ölçeklendirilmesi değildi. Baş edilemeyecek kadar büyük verileri işlemek için yeni sistemlere geçişin, verilerin incelenme ve analiz edilme yöntemlerinin değişimini de içeriyordu.
Veri bilimi, modern çağda iş ve akademik araştırmaların önemli bir parçası haline geldi. Teknik olarak buna makine çevirisi, robotik, konuşma tanıma, dijital ekonomi ve arama motorlarını dahil edebiliriz. Veri biliminin araştırma alanları biyoloji, sağlık hizmetleri, tıbbi bilişim, beşerî bilimler ve sosyal bilimleri kapsayacak şekilde genişledi.
Yapay zeka alt kümesi: Veri bilimi ve gelişimi
Veri bilimi 50 yılı aşkın bir süredir var olmasına rağmen, popülerlik kazanması 2010’ların başında gerçekleşti. Bu alanın dikkat çekmesi, iş dünyasında rekabet avantajı için anahtarın veri olduğunun fark edilmesiyle gerçekleşti. İş dünyası veriyi stratejik odağı haline getirdi.
Son 10 yılda veri bilimi alanında gelişim ve değişim hâkim, bunun önümüzdeki yıllarda da hızlanarak sürmesi bekleniyor. Bu alanlardaki eşzamanlı ilerlemeler ve sektördeki parlak beyinlerin yeni yaklaşımlarıyla, veri biliminin yeni çığırlar açacağına kesin gözüyle bakılıyor.
Veri bilimi, işletmelerin daha iyi kararlar alması, daha yenilikçi ürün ve servisler yaratması için içgörüler üretir, saklı desenleri ve trendleri ortaya çıkarır. Veri biliminin en yenilikçi yaklaşımlarından birisi, verilerden keşfedilebilecekleri görmek için yalnızca analistlere güvenmek yerine, makine öğrenimi (ML) modellerini kullanmasıdır. Bu modeller, büyük miktarda veri üzerinde çalışarak, insanların algılayamayacağı dev desenleri keşfeder.
Veri inovasyonun temel taşıdır ancak gerçek değeri veriden elde edilebilen bilgiler ve onlar ışığında gerçekleştirilecek eylemlerden gelir.
Veri bilimi nasıl yapılır?
Verileri analiz etme ve bu temelde hareket etme süreci doğrusal değil, kademeli ilerleyen bir süreçtir. Bir veri modelleme projesi için tipik akış şu şekildedir:
Planlama: Projeyi ve potansiyel sonuçlarını tanımlayın.
Veri modeli oluşturma: Veri bilimcileri, makine öğrenimi modelleri oluşturmak için genellikle çeşitli açık kaynak kitaplıklarını veya veritabanı araçlarını kullanır. Kullanıcılar genellikle API'lerin veri alımı, veri profili oluşturma, görselleştirme veya özellik mühendisliğine yardımcı olmasını isterler. Doğru verilere ve bilgi işlem gücü gibi diğer kaynaklara erişimin yanı sıra doğru araçlara da ihtiyaçları olur.
Modeli değerlendirme: Veri bilimcilerinin, kendilerinden emin biçimde konuşlandırmadan önce modelleri için yüksek bir doğruluk yüzdesi elde etmeleri gerekir. Model değerlendirmesi, model performansını yeni verilere göre ölçmek için genellikle kapsamlı değerlendirme metrikleri ve görselleştirme seti oluşturur. Ayrıca üretimde optimum davranışı sağlamak için bunları zaman içinde sıralar. Model değerlendirmesi, beklenen temel davranışı hesaba katmak için ham performansın ötesine geçer.
Modeli açıklama: Makine öğrenimi modellerinin ürettiği sonuçların iç mekaniklerini insani anlamda açıklamak her zaman mümkün olmadı ama bu giderek daha önemli hale geliyor. Veri bilimcileri, tahmin oluşturmakta rol oynayan faktörlerin göreli ağırlığı ve önemi hakkında otomatik açıklamaların yanı sıra model tahminleriyle ilgili modele özgü açıklayıcı ayrıntılar istiyor.
Modeli konuşlandırma: Eğitilmiş bir makine öğrenimi modelini alıp doğru sistemlere yerleştirmek genellikle zor ve zahmetli bir süreçtir. Bu, modelleri ölçeklenebilir ve güvenli API'ler olarak çalıştırarak veya veritabanı içi makine öğrenimi modelleri kullanarak daha kolay hale getirilebilir.
Modeli izleme: Düzgün çalıştıklarından emin olmak için modellerin konuşlandırmadan sonra sürekli izlenmeleri gerekiyor. Modelin eğitiminde kullanılan veriler, belirli bir süre sonra gelecekteki tahminler için geçerli olmayabilir. Örneğin, dolandırıcılık tespiti alanında suçlular hesapları ele geçirmek için her zaman yeni yollar buluyor.
İyi bir veri bilimcisi kimdir, nasıl olunur?
Veri bilimi, verilerden anlamlı içgörüler elde etmek için alan uzmanlığını, programlama becerilerini, matematik ve istatistik bilgilerini birleştiren çalışma alanıdır. Veri bilimcileri de normalde insan zekası gerektiren görevleri gerçekleştirmek ve yapay zeka (AI) sistemleri üretmek için sayılara, metinlere, resimlere, videolara, seslere ve daha fazlasına makine öğrenimi algoritmaları uygular. Buna karşılık, bu sistemler, analistlerin ve iş kullanıcılarının somut iş değerine çevirebilecekleri içgörüler üretir.
Uzmanlık olarak henüz gençlik döneminde olan veri bilimcisi, istatistiksel analiz ve veri madenciliği alanlarından ortaya çıktı. İnsanlar 2008 yılında veri uzmanı unvanıyla tanıştı ve bu alanda kısa süre içinde büyük ilerlemeler kaydedildi. Giderek daha fazla sayıda kolej ve üniversitede veri bilimi bölümleri açılmaya başlansa da o zamandan bu yana yeterince veri uzmanı bulunamıyor.
Veri bilimcilerin görevleri arasında verileri analiz etmek için stratejiler geliştirme, verileri analiz için hazırlama, verileri keşfetme, analiz etme ve görselleştirme, Python ve R gibi programlama dillerini kullanarak verilerle birlikte modeller oluşturma ve modelleri uygulama yazılımlarına konuşlandırma sayılabilir.
Veri uzmanları tek başına çalışmaz. Hatta en etkili veri bilimi, ekipler halinde yapılır. Bu ekip veri bilimciye ek olarak, sorunu tanımlayan bir iş analistinden, verileri hazırlayan ve verilere nasıl erişileceğini belirleyen bir veri mühendisinden, altta yatan süreçlere ve altyapıya ilişkin gözetim faaliyetlerini yürüten bir BT mimarından ve modelleri veya analiz sonuçlarını uygulama yazılımlarına ve ürünlere konuşlandıran bir uygulama yazılımı geliştiricisinden oluşur.
Türkiye’de veri bilimine ilgi
Günümüzde veri için yeni elektrik diyebiliriz. Dördüncü sanayi devrimi çağında yaşıyoruz. Yeni teknolojilerin ve daha akıllı ürünlerin ortaya çıkmasıyla sonuçlanan büyük bir veri patlaması var. Her gün yaklaşık 2,5 eksabayt veri oluşturuluyor. Veriye olan ihtiyaç son on yılda muazzam bir şekilde arttı. Birçok şirket işlerini veriye odakladı. Türkiye’de de veri ve veri bilimine gösterilen ilgi gün geçtikçe artıyor.
Türkiye’deki pek çok kurum, ürünleri ve servislerini geliştirerek verileri rekabet avantajına dönüştürmek üzere veri biliminden yararlanıyor.
Pek çok şirket veri bilimine öncelik veriyor ve buna ciddi yatırımlar yapıyor. Gartner tarafından 3000'den fazla CIO ile yapılan son ankete göre, ankete katılanların tümü veri bilimini, analitiği ve iş zekasını kendi kurumları için en fazla fark yaratan teknoloji olarak tanımladı. Ankete katılan CIO'lar, bu teknolojileri şirketleri için en stratejik unsurlar olarak görüyor ve buna göre yatırım yapıyor.
Veri Biliminin Bileşenleri Nelerdir?
Verinin büyük miktarlar ve çeşitlilikte aktığı bir dünyada yaşıyoruz ve herkes verinin çok önemli bir bilgi kaynağı olduğundan bahsediyor. Bu doğrultuda veri biliminin temel bileşenleri arasında şunlar yer alıyor:
İstatistik
İstatistik, veri biliminin en önemli bileşenlerinden biridir. İstatistik, sayısal verileri büyük miktarda toplamanın, analiz etmenin ve ondan anlamlı içgörüler bulmanın bir yoludur.
Alan Uzmanlığı
Veri biliminde alan uzmanlığı, veri bilimini birbirine bağlar. Alan uzmanlığı, belirli bir alana ilişkin özel bilgi veya beceriler anlamına gelir. Veri biliminde, alan uzmanlarına ihtiyaç duyduğumuz çeşitli alanlar vardır.
Veri mühendisliği
Veri mühendisliği, verilerin elde edilmesini, depolanmasını, alınmasını ve dönüştürülmesini içeren veri biliminin bir parçasıdır. Veri mühendisliği ayrıca verilere meta veriler (veriler hakkında veriler) de içerir.
Görselleştirme
Veri görselleştirme, insanların verilerin önemini kolayca anlayabilmeleri için verileri görsel bir bağlamda temsil etmesi anlamına gelir. Veri görselleştirme, görsellerdeki büyük miktardaki verilere erişmeyi kolaylaştırır.
Gelişmiş bilgi işlem
Gelişmiş bilgi işlem, bilgisayar programlarının kaynak kodunu tasarlamayı, yazmayı, hata ayıklamayı ve bakımını içerir.
Matematik
Matematik, veri biliminin kritik bir parçasıdır. Matematik, nicelik, yapı, uzay ve değişimlerin incelenmesini içerir. Bir veri bilimcisi için iyi bir matematik bilgisi esastır.
Makine öğrenimi
Makine öğrenimi, veri biliminin bel kemiğidir. Makine öğrenimi, bir makineye insan beyni gibi davranabilmesi için eğitim verir. Veri biliminde, sorunları çözmek için çeşitli makine öğrenmesi algoritmaları kullanılır
İlgili Postlar
Veri okuryazarlığı nedir?
7 Eki 2024
Büyük Veri