Logistik regresyon, sınıflandırma problemleri için kullanılan bir makine öğrenimi algoritmasıdır. Bu algoritma, bağımlı değişkenin kategorik veya sınıflandırma türünde olduğu durumlarda kullanılır. Örneğin, bir gözlemi iki veya daha fazla sınıfa ayırmak istediğinizde logistik regresyon kullanılır.
Logistik regresyon, doğrusal regresyon ile benzerdir, ancak çıktıyı bir sigmoid fonksiyonuna geçirerek sınıflandırma yapar. Bu sigmoid fonksiyonu, çıktıyı 0 ile 1 arasında bir değere sıkıştırır, bu da sonuçların olasılık olarak yorumlanabilmesini sağlar.
Nasıl Çalışır?
- Veri Hazırlığı: Logistik regresyon algoritması, önceki modellerde olduğu gibi, uygun bir veri hazırlığı gerektirir. Bu adımlar arasında eksik verilerin ele alınması, kategorik değişkenlerin kodlanması ve özelliklerin ölçeklendirilmesi gibi aşamalar vardır.
- Sigmoid Fonksiyonu: Logistik regresyon, çıktıyı hesaplamak için bir sigmoid fonksiyonunu kullanır. Sigmoid fonksiyonu, giriş değerini 0 ile 1 arasında bir değere dönüştürür. Matematiksel olarak, sigmoid fonksiyonu şu şekildedir:
σ(z) = 1/(1+e-z)
Burada z giriş değerini ve σ(z) ise çıktıyı ifade eder.
- Parametre Tahmini: Logistik regresyon modeli, giriş özelliklerini ve onlara karşılık gelen ağırlıkları kullanarak bir tahmin yapar. Bu ağırlıklar, modelin eğitim verisi üzerinde uyum sağlaması sırasında öğrenilir. Genellikle, bu ağırlıklar en uygun değerleri bulmak için bir optimizasyon algoritması kullanılarak tahmin edilir.
- Karar Sınırı Belirleme: Sınıflandırma problemlerinde, bir karar sınırı belirlenir. Bu sınır, sınıflar arasındaki ayrımı tanımlar. Örneğin, iki sınıflı bir problemde, bir gözlem pozitif sınıfa aitse veya negatif sınıfa aitse belirli bir eşik değeri kullanılarak karar verilir.
Avantajları ve Dezavantajları
Avantajları:
- Basit ve anlaşılması kolay bir algoritmadır.
- Hızlı bir şekilde eğitilir.
- Sonuçları olasılık olarak sağlar, bu da tahminlerin belirsizlik seviyesini gösterir.
Dezavantajları:
- Doğrusal sınırlamaları olduğu için karmaşık ilişkileri modellemekte sınırlıdır.
- Aşırı öğrenmeye (overfitting) eğilimlidir, özellikle de çok fazla özellik varsa.
Logistik regresyon, özellikle iki sınıflı sınıflandırma problemlerinde kullanılabilir.
Logistik Regresyon (Logistic Regression) Python uygulaması için tıklayınız.
