Yapay zekada doğrusal regresyon
28.10.2021
Sosyal Medya

Yapay zekada doğrusal regresyon

Doğrusal regresyon analizi, bir değişkenin değerini başka bir değişkenin değerine göre tahmin etmek için kullanılır. Doğrusal regresyon, aynı zamanda istatistiksel veri analizinde de sıkça kullanılan bir yöntemdir. Bu yazımızda doğrusal regresyon tekniğinin yapay zeka için ne anlama geldiğini masaya yatırıyoruz.

Çoğu makine öğrenimi algoritması, başta istatistik olmak üzere çeşitli alanlardan ödünç alınmıştır. Modellerin daha iyi tahmin etmesine yardımcı olabilecek her şey, sonunda makine öğreniminin bir parçası olacaktır. Dolayısıyla, doğrusal regresyonun hem istatistiksel hem de makine öğrenmesi algoritması olduğunu söyleyebiliriz. 

Doğrusal regresyon, veri bilimi ve makine öğreniminde kullanılan popüler ve karmaşık olmayan bir algoritmadır. Denetimli bir öğrenme algoritması olmanın yanında değişkenler arasındaki matematiksel ilişkiyi incelemek için de kullanılan en basit regresyon biçimidir.

Doğrusal regresyon nedir?

Doğrusal regresyon, değişkenler arasındaki ilişkiyi göstermeye çalışan istatistiksel bir yöntemdir. Bu yöntem, farklı veri noktalarına bakıp bir eğilim çizgisi çizer. Örneğin, bir makine parçasının tamir maliyetinin zamanla artışını bulmak gibi.

Bu analiz biçimi, bağımlı değişkenin değerini en iyi öngören bir ya da daha fazla bağımsız değişkeni kullanarak doğrusal denklemin katsayılarını tahmin eder. Doğrusal regresyon, öngörülen ve gerçek çıkış değerleri arasındaki uyumsuzlukları en aza indiren düz bir çizgi ya da yüzeye yerleşir.

Bağımlı değişken ile bir dizi başka bağımsız değişken arasındaki ilişkinin karakterini ve gücünü belirlemek için yine doğrusal regresyon kullanılır. Bir şirketin hisse senedi fiyatını tahmin etmek için modeller oluşturmasına da yardımcı olabilir.

Gözlenen veri kümesine doğrusal bir model uydurmaya çalışmadan önce, değişkenler arasında bir ilişki olup olmadığı değerlendirilmelidir. Elbette bu, bir değişkenin diğerine neden olduğu anlamına gelmez. Ancak aralarında gözle görülür bir korelasyon olması gerekiyor. Örneğin, yüksek üniversite notları olan birinin daha yüksek maaş alacağı doğru değildir. Ancak iki değişken arasında yine de bir ilişki olabilir.

Korelasyon katsayıları, iki değişken arasındaki ilişkinin ne kadar güçlü olduğunu hesaplamak için kullanılır. Genellikle “r” ile gösterilir ve -1 ile 1 arasında bir değere sahiptir. Pozitif bir korelasyon katsayısı değeri, değişkenler arasında pozitif bir ilişki olduğunu gösterir. Benzer şekilde, negatif bir değer, değişkenler arasında negatif bir ilişki olduğunu gösterir.

Doğrusal regresyon türleri nelerdir?

İki tür doğrusal regresyon vardır. Bunlar basit doğrusal regresyon ve çoklu doğrusal regresyon.

  • Basit doğrusal regresyon yöntemi: tek bir bağımsız değişken ve karşılık gelen bir bağımlı değişken arasındaki ilişkiyi bulmak için çalışır. Bağımsız değişken girdi ve karşılık gelen bağımlı değişken ise çıktıdır.
  • Çoklu doğrusal regresyon yöntemi: iki veya daha fazla bağımsız değişken ve ona karşılık gelen bağımlı değişken arasındaki ilişkiyi bulmak için çalışır. Ayrıca polinom regresyonu adı verilen özel bir çoklu doğrusal regresyon yöntemi de vardır.

Basit bir doğrusal regresyon modeli yalnızca tek bir bağımsız değişkene sahipken, çoklu bir doğrusal regresyon modeli iki veya daha fazla bağımsız değişkene sahip olabilir. Ve evet, oldukça karmaşık veri analizi için kullanılan başka doğrusal olmayan regresyon yöntemleri de mevcut.

Bunlara ek olarak doğrusal regresyon yöntemini aşağıdakiler dahil, çeşitli programlar ve ortamlarda yürütebilirsiniz:

  • R doğrusal regresyonu
  • MATLAB doğrusal regresyonu
  • Sklearn doğrusal regresyonu
  • Python doğrusal regresyonu
  • Excel doğrusal regresyonu

Doğrusal regresyon neden önemlidir?

Doğrusal regresyon modelleri nispeten basittir ve tahminler üretebilen, yorumlanması kolay bir matematiksel formül sağlar. Doğrusal regresyon, iş dünyasında ve akademik çalışmalardaki çeşitli alanlara uygulanabilir.

Doğrusal regresyonun biyolojik, davranışsal, çevresel ve sosyal bilimlerden iş dünyasına kadar her alanda kullanıldığını görebilirsiniz. Bilimsel olarak kanıtlanmış bir yöntem haline gelen doğrusal regresyon modelleri, geleceği güvenilir bir şekilde öngörebilir.

İşletme ve kuruluş liderleri ise doğrusal regresyon tekniklerini kullanarak daha iyi kararlar alabilir. Kuruluşlar sonuçta büyük miktarlarda veri toplar ve bunları depolar. Doğrusal regresyon ise deneyimlere ve sezgiye güvenmek yerine, gerçekliği daha iyi yönetmeleri için bu verileri kullanmalarında onlara yardımcı olur. Büyük miktarda ham veriyi alıp eyleme dönüştürülebilecek bilgiler haline getirebilirler.

Lojistik regresyon ve doğrusal regresyon arasındaki farklar nedir?

Doğrusal regresyon, belirli bir bağımsız değişken kümesi için sürekli bağımlı değişkeni tahmin ederken; lojistik regresyon, kategorik bağımlı değişkeni tahmin eder.

Her ikisi de denetimli öğrenme yöntemleridir. Ancak, regresyon problemlerini çözmek için doğrusal regresyon kullanılırken, sınıflandırma problemlerini çözmek için lojistik regresyon kullanılır.

Elbette lojistik regresyon, regresyon problemlerini çözebilir. Ancak esas olarak bu, sınıflandırma problemlerinde kullanılır. Çıktısı sadece 0 veya 1 olabilir. İki sınıf arasındaki olasılıkları belirlemeniz veya başka bir deyişle, bir olayın olasılığını hesaplamanız gereken durumlarda değerlidir. Örneğin, lojistik regresyon bugün yağmur yağıp yağmayacağını tahmin etmek için kullanılabilir.

Doğrusal regresyon varsayımları nelerdir?

Değişkenler arasındaki ilişkiyi modellemek için doğrusal regresyon kullanırken birkaç varsayımda bulunabilirsiniz. Varsayımlar, tahmin yapmak için bir model kullanmadan önce karşılanması gereken koşulları ifade eder.

Doğrusal regresyon modelleriyle ilgili genel olarak dört varsayım vardır:

  • Doğrusal ilişki: Bağımsız değişken “x” ile bağımlı değişken “y” arasında doğrusal bir ilişki vardır.
  • Bağımsızlık: Artıklar bağımsızdır. Zaman serisi verilerindeki ardışık artıklar arasında bir ilişki yoktur.
  • Homoscedasticity: Artıklar tüm seviyelerde eşit varyanta sahiptir.
  • Normallik: Artıklar normal dağılmıştır.

Doğrusal regresyonun avantajları ve dezavantajları

Doğrusal regresyon, anlaşılması çok karmaşık olmayan ve aslında uygulanması en basit algoritmalardan biridir. Değişkenler arasındaki ilişkileri analiz etmek için de harika bir araçtır.

Peki bu doğrultuda doğrusal regresyonun avantajları nedir?

  • Basitliği nedeniyle bir go-to algoritmasıdır.
  • Aşırı sığdırmaya duyarlı olmasına rağmen, boyut küçültme teknikleri yardımıyla önlenebilir.
  • Yorumlanabilir.
  • Doğrusal olarak ayrılabilir ve veri kümelerinde iyi performans gösterir.
  • Uzay karmaşıklığı düşüktür. Bu nedenle, yüksek gecikmeli bir algoritmadır.

Bununla birlikte, pratik uygulamaların çoğu için doğrusal regresyon genellikle önerilmez. Bunun nedeni, değişkenler arasında doğrusal bir ilişki olduğunu varsayarak gerçek dünya problemlerini aşırı basitleştirmesidir.

Doğrusal regresyonun bazı dezavantajları da şu şekildedir:

  • Aykırı değerlerin regresyon üzerinde olumsuz etkileri olabilir.
  • Doğrusal bir modele uyması için değişkenler arasında doğrusal bir ilişki olması gerektiğinden, değişkenler arasında doğrusal bir ilişki olduğunu varsayar.
  • Verilerin normal dağıldığını algılar.
  • Bağımsız ve bağımlı değişkenlerin ortalaması arasındaki ilişkiye de bakar.
  • Doğrusal regresyon, değişkenler arasındaki ilişkilerin tam bir açıklaması değildir.
  • Değişkenler arasında yüksek bir korelasyonun varlığı, doğrusal bir modelin performansını önemli ölçüde etkileyebilir.

Doğrusal regresyonda, değişkenlerin doğrusal bir ilişkisi olup olmadığını değerlendirmek çok önemlidir. Bazı insanlar trende bakmadan tahmin etmeye çalışsa da değişkenler arasında orta derecede güçlü bir korelasyon olduğundan emin olmak en iyisidir.

Daha önce de bahsettiğimiz gibi burada dağılım grafiğine ve korelasyon katsayısına bakmak mükemmel yöntemlerdir. Korelasyon yüksek olsa bile, dağılım grafiğine bakmak gerekli bir sağlamadır. Veriler görsel olarak doğrusal ise doğrusal regresyon analizi yapılabilir.

Öne Çıkan Yazılar
NFT nedir, nasıl yapılır ve satılır?
NFT nedir, nasıl yapılır ve alınır?
Son dönemde blok zinciri ve kripto paraların yükselişini NFT teknolojisi izledi, özellikle sanat eserlerinin yüksek fiyatlarla...
15.06.2021
Dijital Dönüşüm
Robotik Süreç Otomasyonu (RPA) Nedir? Nasıl Çalışır?
Robotik Süreç Otomasyonu (RPA) Nedir? Nasıl Çalışır?
Robotik süreç otomasyonu (Robotic Process Automation - RPA) nedir? Nasıl çalışır? Bu soruların cevaplarını bulmaya çalışacağımız...
14.03.2019
Dijital Dönüşüm
Nesnelerin İnterneti (IoT) Nedir?
Nesnelerin İnterneti (IoT) Nedir?
Nesnelerin İnterneti, bilgi üretebilen ve internet üzerinden bunu paylaşabilen tüm bilgi işlem cihazlarını, mekanik ve dijital...
7.05.2021
Dijital Dönüşüm
Gelecekte tarım nasıl olacak?
Gelecekte tarım nasıl olacak?
Tarım sektörünün önemi küreselleşen ekonomik sistem, artan rekabet ve değişkenlik gösteren pazar şartlarının etkisiyle giderek...
28.08.2020
Dijital Dönüşüm
Geleceğin akıllı şehir konsepti nasıl bir yaşam vadediyor?
Geleceğin akıllı şehir konsepti nasıl bir yaşam vadediyor?
20. yüzyılın son çeyreğinden itibaren gelişen teknolojilerle yenilikçilik kavramlarını bir araya getiriliyor ve yeni bir...
17.04.2020
Dijital Dönüşüm
Endüstri 4.0 ile Gelen Yeni Üretim Çağı - Akıllı Fabrikalar
Endüstri 4.0 İle Gelen Yeni Üretim Çağı - Akıllı Fabrikalar
Makinelerin kendi aralarında konuştuğu, üretimi insanların değil makinelerin organize ettiği Akıllı Fabrikalar ile üretimin...
13.07.2016
Dijital Dönüşüm