Gözetimsiz makine öğrenimi: Makineler kendi kendilerini nasıl eğitirler?

Gözetimsiz makine öğrenimi: Makineler kendi kendilerini nasıl eğitirler?

2 Ağu 2021

4 dk okuma süresi

Gözetimsiz öğrenme (denetimsiz öğrenme- unsupervised learning), makinelerin kendi kendilerine öğrenmesini sağlar. Bu tür makine öğrenimi, yapay zeka uygulamalarına insan denetimi olmadan büyük veri kümelerinde gizli kalıpları öğrenme ve bulma yeteneği verir. Gözetimsiz öğrenme, yapay genel zekaya ulaşmak için kilit tekniklerden birisi olarak kabul edilmektedir.

Gözetimsiz öğrenme, sınıflandırılmamış veya etiketlenmemiş veri noktalarını içeren veri kümelerindeki kalıpları tanımlamak için yapay zeka (AI) algoritmalarının kullanımını ifade eder.

Gözetimsiz öğrenme, İnnova Blog’da inceleyeceğimiz ikinci makine öğrenimi tekniğidir. Devam etmeden önce ilkini hatırlamak isterseniz, pekiştirmeli makine öğrenimi yazımıza buradan ulaşabilirsiniz.

Gözetimsiz öğrenme nedir?

Gözetimli öğrenmenin aksine, bu makine öğrenimi tekniğinde modeli denetlemek için insana gerek yoktur. Veri bilimcisi, makinenin verileri gözlemleyerek ve kendi başına kalıplar bularak öğrenmesini sağlar. Başka bir deyişle, makine öğreniminin bu alt kategorisi, bir sistemin herhangi bir dış rehberlik olmadan verilen bilgiler üzerinde hareket etmesine izin verir.

Yapay zeka, gözetimsiz öğrenmede hiçbir kategori sağlanmasa bile sıralanmamış bilgileri benzerliklere ve farklılıklara göre gruplayabilir.

Gözetimsiz öğrenme teknikleri, insan zekası ile yapay zeka sistemleri oluşturmak için kritik öneme sahiptir. Bunun nedeni, akıllı makinelerin büyük hacimli etiketlenmemiş verileri analiz ederek kararlar alabilmesini sağlamasıdır.

Gözetimli öğrenme algoritmalarıyla karşılaştırıldığında, gözetimsiz öğrenme algoritmaları karmaşık görevleri gerçekleştirmede daha iyidir.

Gözetimsiz öğrenmenin avantajları

Yapay zekaların eğitilebileceği verilerin göz ardı edilemeyecek büyük bir bölümü etiketlenmemiş ve yapılandırılmamıştır. Verileri etiketlemek ise insan emeği gerektiren rutin bir iştir. Bununla birlikte sürecin kendisi makine öğrenimi destekli olabilir. Bu da verileri etiketlemeyi kolaylaştırır. Gözetimsiz öğrenme, bilinmeyen ve ham verileri keşfetmek için kullanışlıdır. Büyük veri kümelerinde örüntü tanıma gerçekleştirmek için insan emeği gerektirmez.

Gözetimsiz öğrenme nasıl çalışır?

Gözetimsiz öğrenme, makine öğrenimi mühendisleri veya veri bilimcileri veri kümelerini algoritmalardan geçirdiğinde başlar.

Daha önce belirttiğimiz gibi, bu tür sistemleri eğitmek için kullanılan veri setlerinde yer alan hiçbir etiket veya kategori yoktur. Eğitim sırasında algoritmalardan geçirilen her bir veri, etiketlenmemiş bir girdi nesnesi veya örneğidir.

Denetimsiz öğrenmenin amacı, algoritmaların eğitim veri kümeleri içindeki kalıpları tanımlamasını ve girdi nesnelerini sistemin tanımladığı kalıplara göre kategorize etmesini sağlamaktır. Bu algoritmaların, her bir örnek veya girdi nesnesi arasındaki ilişkileri arayarak yapılandırılmamış girdilerden belirli çıktılar geliştirmesi beklenir.

Bu makine öğrenimi tekniğinin çalışma prensibini örneklemek gerekirse, yapay zeka ajanlarına hayvan görüntüleri içeren veri setleri verilebilir. Yapay zeka hayvanları kürklüler, pullular ve tüylüler gibi kategorilere ayırabilir. Daha sonra, her bir kategori içindeki ayrımları belirlemeyi öğrenirken, görüntüleri giderek daha spesifik alt gruplar halinde gruplayabilir. Yapay zeka ajanları bunu kalıpları ortaya çıkararak ve tanımlayarak yapar. Ancak gözetimsiz öğrenmede kalıp tanıma, sisteme memeliler, balıklar ve kuşlar arasında ayrım yapmayı veya memelilerin alt türlerini ayırt etmeyi öğreten veriler olmadan gerçekleşir.

Gözetimsiz öğrenme türleri

Gözetimsiz öğrenme teknikleri kümeleme ve ilişkilendirme olarak ikiye ayrılır.

Kümeleme

Kümeleme veya küme analizi, nesneleri kümeler halinde gruplama işlemidir. En çok benzerliğe sahip öğeler birlikte gruplanırken, geri kalanlar diğer kümelere ayrılır.

Nasıl çalıştıklarına bağlı olarak, kümeleme de kendi içerisinde dört gruba ayrılabilir:

Özel kümeleme: Adından da anlaşılacağı gibi, özel kümeleme, bir veri noktasının veya nesnenin yalnızca bir kümede var olabileceğini belirtir.

Hiyerarşik kümeleme: Bu, hiyerarşik bir küme oluşturmaya çalışır. İki tür hiyerarşik kümeleme vardır: Aglomeratif ve bölücü. Aglomeratif aşağıdan yukarıya yaklaşımı izler. Başlangıçta her veri noktasını ayrı bir küme olarak ele alır ve küme çiftleri hiyerarşide yukarı doğru hareket ederken birleştirilir. Bölücü ise aglomeratifin tam tersidir. Her veri noktası tek bir kümede başlar ve hiyerarşide aşağı indikçe bölünür.

Örtüşen kümeleme: Bir veri noktasının iki veya daha fazla kümede gruplandırılmasına izin verir.

Olasılıksal kümeleme: Olasılık, kümeler oluşturmak için olasılık dağılımlarını kullanır. Örneğin, yeşil çoraplar, mavi çoraplar, yeşil tişört ve mavi tişört; “yeşil ve mavi” ya da “çorap ve tişört” olmak üzere iki kategoriye ayrılabilir.

İlişkilendirme

İlişkilendirme kuralı öğrenimi (Association Rule Learning – ARL), büyük veri tabanlarında değişkenler arasındaki ilişkileri bulmak için kullanılan denetimsiz bir öğrenme yöntemidir. Bazı makine öğrenimi algoritmalarından farklı olarak ARL, sayısal olmayan veri noktalarını işleyebilir.

Daha basit anlatımla ARL, belirli değişkenlerin birbirleriyle nasıl ilişkilendirildiğini bulmakla ilgilidir. Örneğin, motosiklet satın alan kişilerin kask satın alma olasılığı daha yüksektir.

Bu tür ilişkileri bulmak kazançlı olabilir. Örneğin, X ürününü satın alan müşteriler Y ürününü satın alma eğilimindeyse, çevrimiçi bir perakendeci X ürününü satın alan herkese Y ürününü önerebilir.

Gözetimsiz ve gözetimli öğrenme karşılaştırması

Gözetimli öğrenmede algoritmalar tanımlama ve sıralama yapmaları için eğitilirken etiketli veri kümelerinden faydalanılır. Girdi nesnesi veya örnek, algoritmaların aynı etiketle eşleşen girdi nesnelerini tanımlamayı ve sınıflandırmayı öğrenmesi için karşılık gelen bir etikete sahiptir.

Başka bir deyişle algoritmalar, makine öğrenimi mühendisleri veya veri bilimcileri tarafından etiketlenmiş eğitim verilerinden öğrendiklerine dayanarak, verilen girdilerden belirli sonuçlar ve haritalar oluşturur.

Ayrıca, gözetimli öğrenme hem etiketlenmiş eğitim verilerini hem de etiketlenmiş doğrulama verilerini kullanır. Bu, gözetimli öğrenme çıktılarının doğruluğunun ve denetimsiz öğrenmenin ölçülemeyecek şekilde doğruluğunun kontrol edilmesini sağlar. Makine öğrenimi mühendisleri veya veri bilimcileri, yapay zekaları eğitmek için etiketli ve etiketsiz verilerin bir kombinasyonunu kullanmayı tercih edebilir.

Gözetimsiz öğrenmenin zorlukları

Gözetimsiz makine öğrenimi, verilerdeki önceden bilinmeyen kalıpları tanımlayabilir. Gözetimli öğrenmenin gerektirdiği etiketleme verileriyle ilişkili manuel çalışmayı gerektirmediğinden, kullanımı denetimli öğrenmeye göre daha kolay, daha hızlı ve daha az maliyetli olabilir. Gözetimsiz öğrenme aynı zamanda kalıpları belirlemek için gerçek zamanlı verilerle çalışabilir. Kuruluşlar gözetimsiz öğrenmenin bu özelliklerine değer verse de, aşağıdakiler de dahil olmak üzere bazı dezavantajlarından da bahsedilebilir:

Gözetimsiz öğrenme çıktılarının doğruluğu belirsiz olabilir. Sonuçları doğrulamak için etiketlenmiş veri setleri olmadığı için denetimsiz öğrenme çıktılarının doğruluğunu kontrol etmek zordur. Mühendislerin ve veri bilimcilerin, gözetimli öğrenmeye göre gözetimsiz öğrenme sonuçlarını yorumlamak ve etiketlemek için daha fazla zamana ihtiyacı vardır. Gözetimsiz bir sistemin, sonuçlarına nasıl veya neden ulaştığına dair kavrayış eksikliği mevcuttur.

Kümeleme tekniğinin de kendine has bir dezavantajı vardır. Küme analizi, girdi nesnelerindeki benzerlikleri olduğundan fazla varsayabilir. Bu da amacın bireysel müşterileri anlamak olduğu müşteri segmentasyonu gibi bazı kullanım durumları için önemli olabilecek bireysel veri noktalarının gözden kaçırılmasına sebep olabilir.

İlgili Postlar

data_literacy

Veri okuryazarlığı nedir?

7 Eki 2024

Büyük Veri
Başarı Hikayeleri
Teknik Destek ‍
444 5INV
444 5 468 ‍
info@innova.com.tr