logistic-regression

Lojistik regresyon, bir veya daha fazla bağımsız değişkene dayalı olarak ikili bir sonucun (örneğin, evet/hayır, doğru/yanlış) olasılığını tahmin etmek için kullanılan istatistiksel bir yöntemdir.

Lojistik regresyon, bağımsız değişkenler ile sonuç olasılığı arasındaki ilişkiyi modellemek için lojistik bir fonksiyon (sigmoid fonksiyonu) kullanır. Sürekli değerleri tahmin eden doğrusal regresyonun aksine, lojistik regresyon kategorik bir sonucun olasılığını tahmin eder. Çıktı, sonucun belirli bir kategoriye ait olma olasılığını temsil eden 0 ile 1 arasında bir değerdir.

Model, bağımsız değişkenlerin katsayılarını maksimum olabilirlik tahmini adı verilen bir süreç aracılığıyla tahmin eder. Bu katsayılar, her bir değişkenin tahmin edilen olasılık üzerindeki etkisini belirler. Lojistik regresyon, kredi puanlaması, hastalık teşhisi ve müşteri kaybı tahmini gibi görevler için finans, sağlık hizmetleri ve pazarlama dahil olmak üzere çeşitli alanlarda yaygın olarak kullanılmaktadır.

        graph LR
  Center["logistic-regression"]:::main
  Pre_logic["logic"]:::pre --> Center
  click Pre_logic "/terms/logic"
  Rel_function["function"]:::related -.-> Center
  click Rel_function "/terms/function"
  Rel_inference["inference"]:::related -.-> Center
  click Rel_inference "/terms/inference"
  Rel_log_management["log-management"]:::related -.-> Center
  click Rel_log_management "/terms/log-management"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧠 Bilgi testi

1 / 3

🧒 5 yaşındaki gibi açıkla

Lojistik regresyon, akıllı bir evet/hayır tahmincisi gibidir. İpuçlarına (bir kişinin yaşı ve alışkanlıkları gibi) bakar ve bunları bir şeyin olma olasılığını tahmin etmek için kullanır (belirli bir filmi beğenip beğenmeyeceği gibi), size %0 ile %100 arasında bir olasılık verir.

🤓 Expert Deep Dive

Lojistik regresyonun özü, sonucun log-olasılığını (logit) öngörücülere bağlı doğrusal bir fonksiyon olarak modellemektir: log(P(Y=1|X) / P(Y=0|X)) = β₀ + β₁x₁ + ... + βnxn. Bu, logit bağlantı fonksiyonu olarak bilinir. Maksimum Olabilirlik Tahmini (MLE), parametre tahmini için standart yöntemdir ve log-olabilirlik fonksiyonunu maksimize eden β katsayılarını bulmak için gradyan inişi veya Newton-Raphson gibi yinelemeli optimizasyon algoritmalarını içerir. Aşırı uyumu önlemek, özellikle yüksek boyutlu verilerde, maliyet fonksiyonuna ceza terimleri ekleyerek düzenlileştirme teknikleri (L1 ve L2) sıklıkla kullanılır. İkili sınıflandırma için etkili olsa da, çok terimli lojistik regresyon ve sıralı lojistik regresyon gibi uzantılar sırasıyla çok sınıflı ve sıralı kategorik sonuçları ele alır. Katsayılar (β) üstel hale getirilerek odds oranları elde edilebildiği ve bu da bir öngörücüdeki bir birimlik değişiklik için sonucun olasılığındaki çarpımsal değişimi gösterdiği için yorumlanabilirlik önemli bir avantajdır. Ancak, log-olasılıklarda doğrusalliği ve hataların bağımsızlığını varsayar ve bu varsayımlar ihlal edilirse veya veri önemli çoklu doğrusallık sergilerse performansı düşebilir.

🔗 İlgili terimler

Ön koşullar:

📚 Kaynaklar