8 Eki 2020
2 dk okuma süresi
Büyük Veri, birçok sektörde oyunun kuralını değiştiren ana unsur olarak görülüyor. Büyük Veri Gölü adı verilen merkezi depolama noktaları, kamu kurumlarından sigorta şirketlerine, STK'lardan eğitim kurumlarına kadar tüm organizasyonlar için yeni faydalar sağlıyor.
Sağladığı bu faydalara rağmen, fazla verinin beraberinde getirdiği birtakım dezavantajlar da söz konusu. Büyük Veri akımının üstesinden gelemediği bu sorunları gidermek amacıyla, verilerin nasıl saklandığı, işlendiği, yönetildiği ve karar vericilerle nasıl paylaşıldığı konusunda bir devrim yaşanıyor. Gelin bu devrimden bahsedelim…
Büyük Veri Gölü nedir?
Büyük Veri, veri odaklı projelerin ölçeklenebilirliğini ve maliyet etkinliğini geleneksel veri yönetimi altyapısıyla mümkün olandan daha fazla sağlayan teknolojilerdir. Günümüzde ortaya çıkan Veri Gölü (Data Lake) ise büyük verinin gücünü kullanan bir yaklaşımdır. Bu iki terimin birleşmesiyle ortaya çıkan Büyük Veri Gölü, halihazırda birçok kuruluş tarafından benimsenen bir yaklaşım haline geliyor ve işletmeler ekosistemlerinde veri göllerini uygulamaya hazırlanıyor.
Verilerin bir eve ihtiyacı var ve Veri Gölü bu yuvayı oluşturmak için tercih edilen çözüm olarak öne çıkıyor. Bu göller de tıpkı doğada rastladığımız göllerin suya yaptığı gibi, depolanan büyük bir veri kütlesine ev sahipliği yapıyor. Göl içindeki veriler herhangi bir biçimde, doğal veya ham hallerde saklanabiliyor. Buradan çeşitli kullanıcılar veya büyük kullanıcı toplulukları tarafından erişilebiliyor.
Veri Gölü olgunluk aşamaları
Bir Veri Gölünün birden fazla olgunluk aşaması bulunuyor. Veri Gölleri, ürettiği verileri kullandıkça olgunlaşma eğilimindedir. Verileriyle ne kadar çok şey yapılırsa, örneğin anlamlandırılır ve bu verilerden sonuçlar üretilirse, o kadar olgun verilere sahip olunur. Bu da olgunluk ölçeğinde yükselme anlamına gelir. Olgunluk ölçeğinde yer alan dört farklı aşama bulunur.
Veri Birikintisi
Veri Birikintisi, büyük veri teknolojisi kullanılarak oluşturulmuş tek amaçlı veya tek projeli bir veri pazarıdır. Veri birikintisine yüklenen veriler tek bir proje veya ekip içindir.
Veri Havuzu
Veri Birikintilerinin bir koleksiyonudur. Veri Havuzu, diğer ortak konumlandırılmış veri reyonlarından veri almak üzere kötü tasarlanmış bir veri ambarı formunda görünebilir veya dağıtılmış bir veri ambarının sonucu olabilir. Kullanım sınırlıdır çünkü sadece onu gerektiren proje için mevcuttur. Yüksek maliyetlidir ve sınırlı kullanım alanları sunar.
Veri Gölü
Veri Havuzundan iki yönden farklıdır. Öncelikle, iş kullanıcılarının BT departmanından yardım almadan, gerekli verileri kolayca bulup anlayabileceği self servis yaklaşımını destekler. İkinci olarak, belirli bir projenin kullanımıyla sınırlı olmayan genel kullanım için veriler içerdiğinden daha geniş veri ihtiyaçlarını karşılayabilir.
Büyük Veri Gölü (Veri Okyanusu)
Veri Gölüne yüklenen veya yüklenmeyen verilerden bağımsız olarak, self servis veriler ve karar verme süreçleri tüm kurumsal verilere uygulanabilir.
Herhangi bir projenin başarılı olabilmesi için, öncelikle şirketin stratejisiyle uyumlu ve gerekli yönetici sponsorluğuna sahip olması gerekir. Tüm bunlar sağlandığında, doğru veriler, platform ve arayüz günümüz iş dünyasında bir projenin başarılı olma şansına dramatik katkı sağlar.
Kuruluşlar tarafından toplanan verilerin büyük bir kısmı çöptür. Yalnızca küçük bir yüzde toplanır ve birkaç yıl depoda tutulur. Bununla birlikte, verilerin depolanması ve atılması, verilerin analizini zorlaştırır. Verileri attıktan sonra onları yeniden incelemek istediğinizde, veri geçmişini bir araya getirmek çok zaman alabilir. Veri Gölü, verileri gelecekte kullanılmak üzere yerel biçimde kaydederek bu soruna çözüm sunmayı hedefliyor. Öte yandan, iyi yönetilen bir Veri Gölü şirket operasyonlarını merkezileştirir ve organizasyon genelinde şeffaf bir süreç sunar.
İlgili Postlar
Veri okuryazarlığı nedir?
7 Eki 2024
Büyük Veri