28 Eki 2021
4 dk okuma süresi
Doğrusal regresyon analizi, bir değişkenin değerini başka bir değişkenin değerine göre tahmin etmek için kullanılır. Doğrusal regresyon, aynı zamanda istatistiksel veri analizinde de sıkça kullanılan bir yöntemdir. Bu yazımızda doğrusal regresyon tekniğinin yapay zeka için ne anlama geldiğini masaya yatırıyoruz.
Çoğu makine öğrenimi algoritması, başta istatistik olmak üzere çeşitli alanlardan ödünç alınmıştır. Modellerin daha iyi tahmin etmesine yardımcı olabilecek her şey, sonunda makine öğreniminin bir parçası olacaktır. Dolayısıyla, doğrusal regresyonun hem istatistiksel hem de makine öğrenmesi algoritması olduğunu söyleyebiliriz.
Doğrusal regresyon, veri bilimi ve makine öğreniminde kullanılan popüler ve karmaşık olmayan bir algoritmadır. Denetimli bir öğrenme algoritması olmanın yanında değişkenler arasındaki matematiksel ilişkiyi incelemek için de kullanılan en basit regresyon biçimidir.
Doğrusal regresyon, değişkenler arasındaki ilişkiyi göstermeye çalışan istatistiksel bir yöntemdir. Bu yöntem, farklı veri noktalarına bakıp bir eğilim çizgisi çizer. Örneğin, bir makine parçasının tamir maliyetinin zamanla artışını bulmak gibi.
Bu analiz biçimi, bağımlı değişkenin değerini en iyi öngören bir ya da daha fazla bağımsız değişkeni kullanarak doğrusal denklemin katsayılarını tahmin eder. Doğrusal regresyon, öngörülen ve gerçek çıkış değerleri arasındaki uyumsuzlukları en aza indiren düz bir çizgi ya da yüzeye yerleşir.
Bağımlı değişken ile bir dizi başka bağımsız değişken arasındaki ilişkinin karakterini ve gücünü belirlemek için yine doğrusal regresyon kullanılır. Bir şirketin hisse senedi fiyatını tahmin etmek için modeller oluşturmasına da yardımcı olabilir.
Gözlenen veri kümesine doğrusal bir model uydurmaya çalışmadan önce, değişkenler arasında bir ilişki olup olmadığı değerlendirilmelidir. Elbette bu, bir değişkenin diğerine neden olduğu anlamına gelmez. Ancak aralarında gözle görülür bir korelasyon olması gerekiyor. Örneğin, yüksek üniversite notları olan birinin daha yüksek maaş alacağı doğru değildir. Ancak iki değişken arasında yine de bir ilişki olabilir.
Korelasyon katsayıları, iki değişken arasındaki ilişkinin ne kadar güçlü olduğunu hesaplamak için kullanılır. Genellikle “r” ile gösterilir ve -1 ile 1 arasında bir değere sahiptir. Pozitif bir korelasyon katsayısı değeri, değişkenler arasında pozitif bir ilişki olduğunu gösterir. Benzer şekilde, negatif bir değer, değişkenler arasında negatif bir ilişki olduğunu gösterir.
İki tür doğrusal regresyon vardır. Bunlar basit doğrusal regresyon ve çoklu doğrusal regresyon.
· Basit doğrusal regresyon yöntemi: tek bir bağımsız değişken ve karşılık gelen bir bağımlı değişken arasındaki ilişkiyi bulmak için çalışır. Bağımsız değişken girdi ve karşılık gelen bağımlı değişken ise çıktıdır.
· Çoklu doğrusal regresyon yöntemi: iki veya daha fazla bağımsız değişken ve ona karşılık gelen bağımlı değişken arasındaki ilişkiyi bulmak için çalışır. Ayrıca polinom regresyonu adı verilen özel bir çoklu doğrusal regresyon yöntemi de vardır.
Basit bir doğrusal regresyon modeli yalnızca tek bir bağımsız değişkene sahipken, çoklu bir doğrusal regresyon modeli iki veya daha fazla bağımsız değişkene sahip olabilir. Ve evet, oldukça karmaşık veri analizi için kullanılan başka doğrusal olmayan regresyon yöntemleri de mevcut.
Bunlara ek olarak doğrusal regresyon yöntemini aşağıdakiler dahil, çeşitli programlar ve ortamlarda yürütebilirsiniz:
· R doğrusal regresyonu
· MATLAB doğrusal regresyonu
· Sklearn doğrusal regresyonu
· Python doğrusal regresyonu
· Excel doğrusal regresyonu
Doğrusal regresyon modelleri nispeten basittir ve tahminler üretebilen, yorumlanması kolay bir matematiksel formül sağlar. Doğrusal regresyon, iş dünyasında ve akademik çalışmalardaki çeşitli alanlara uygulanabilir.
Doğrusal regresyonun biyolojik, davranışsal, çevresel ve sosyal bilimlerden iş dünyasına kadar her alanda kullanıldığını görebilirsiniz. Bilimsel olarak kanıtlanmış bir yöntem haline gelen doğrusal regresyon modelleri, geleceği güvenilir bir şekilde öngörebilir.
İşletme ve kuruluş liderleri ise doğrusal regresyon tekniklerini kullanarak daha iyi kararlar alabilir. Kuruluşlar sonuçta büyük miktarlarda veri toplar ve bunları depolar. Doğrusal regresyon ise deneyimlere ve sezgiye güvenmek yerine, gerçekliği daha iyi yönetmeleri için bu verileri kullanmalarında onlara yardımcı olur. Büyük miktarda ham veriyi alıp eyleme dönüştürülebilecek bilgiler haline getirebilirler.
Doğrusal regresyon, belirli bir bağımsız değişken kümesi için sürekli bağımlı değişkeni tahmin ederken; lojistik regresyon, kategorik bağımlı değişkeni tahmin eder.
Her ikisi de denetimli öğrenme yöntemleridir. Ancak, regresyon problemlerini çözmek için doğrusal regresyon kullanılırken, sınıflandırma problemlerini çözmek için lojistik regresyon kullanılır.
Elbette lojistik regresyon, regresyon problemlerini çözebilir. Ancak esas olarak bu, sınıflandırma problemlerinde kullanılır. Çıktısı sadece 0 veya 1 olabilir. İki sınıf arasındaki olasılıkları belirlemeniz veya başka bir deyişle, bir olayın olasılığını hesaplamanız gereken durumlarda değerlidir. Örneğin, lojistik regresyon bugün yağmur yağıp yağmayacağını tahmin etmek için kullanılabilir.
Değişkenler arasındaki ilişkiyi modellemek için doğrusal regresyon kullanırken birkaç varsayımda bulunabilirsiniz. Varsayımlar, tahmin yapmak için bir model kullanmadan önce karşılanması gereken koşulları ifade eder.
Doğrusal regresyon modelleriyle ilgili genel olarak dört varsayım vardır:
· Doğrusal ilişki: Bağımsız değişken “x” ile bağımlı değişken “y” arasında doğrusal bir ilişki vardır.
· Bağımsızlık: Artıklar bağımsızdır. Zaman serisi verilerindeki ardışık artıklar arasında bir ilişki yoktur.
· Homoscedasticity: Artıklar tüm seviyelerde eşit varyanta sahiptir.
· Normallik: Artıklar normal dağılmıştır.
Doğrusal regresyon, anlaşılması çok karmaşık olmayan ve aslında uygulanması en basit algoritmalardan biridir. Değişkenler arasındaki ilişkileri analiz etmek için de harika bir araçtır.
Peki bu doğrultuda doğrusal regresyonun avantajları nedir?
· Basitliği nedeniyle bir go-to algoritmasıdır.
· Aşırı sığdırmaya duyarlı olmasına rağmen, boyut küçültme teknikleri yardımıyla önlenebilir.
· Yorumlanabilir.
· Doğrusal olarak ayrılabilir ve veri kümelerinde iyi performans gösterir.
· Uzay karmaşıklığı düşüktür. Bu nedenle, yüksek gecikmeli bir algoritmadır.
Bununla birlikte, pratik uygulamaların çoğu için doğrusal regresyon genellikle önerilmez. Bunun nedeni, değişkenler arasında doğrusal bir ilişki olduğunu varsayarak gerçek dünya problemlerini aşırı basitleştirmesidir.
Doğrusal regresyonun bazı dezavantajları da şu şekildedir:
· Aykırı değerlerin regresyon üzerinde olumsuz etkileri olabilir.
· Doğrusal bir modele uyması için değişkenler arasında doğrusal bir ilişki olması gerektiğinden, değişkenler arasında doğrusal bir ilişki olduğunu varsayar.
· Verilerin normal dağıldığını algılar.
· Bağımsız ve bağımlı değişkenlerin ortalaması arasındaki ilişkiye de bakar.
· Doğrusal regresyon, değişkenler arasındaki ilişkilerin tam bir açıklaması değildir.
· Değişkenler arasında yüksek bir korelasyonun varlığı, doğrusal bir modelin performansını önemli ölçüde etkileyebilir.
Doğrusal regresyonda, değişkenlerin doğrusal bir ilişkisi olup olmadığını değerlendirmek çok önemlidir. Bazı insanlar trende bakmadan tahmin etmeye çalışsa da değişkenler arasında orta derecede güçlü bir korelasyon olduğundan emin olmak en iyisidir.
Daha önce de bahsettiğimiz gibi burada dağılım grafiğine ve korelasyon katsayısına bakmak mükemmel yöntemlerdir. Korelasyon yüksek olsa bile, dağılım grafiğine bakmak gerekli bir sağlamadır. Veriler görsel olarak doğrusal ise doğrusal regresyon analizi yapılabilir.
İlgili Postlar
Bulut maliyet yönetimi nedir?
31 Eki 2024
Dijital DönüşümYapay zeka şeffaflığı nedir?
28 Eki 2024
Dijital Dönüşüm