logistic-regression
Regresja logistyczna to metoda statystyczna używana do przewidywania prawdopodobieństwa wyniku binarnego (np. tak/nie, prawda/fałsz) na podstawie jednej lub więcej zmiennych niezależnych.
Regresja logistyczna wykorzystuje funkcję logistyczną (funkcję sigmoidalną) do modelowania związku między zmiennymi niezależnymi a prawdopodobieństwem wyniku. W przeciwieństwie do regresji liniowej, która przewiduje wartości ciągłe, regresja logistyczna przewiduje prawdopodobieństwo wyniku kategorycznego. Wynikiem jest wartość z przedziału od 0 do 1, reprezentująca prawdopodobieństwo, że wynik należy do określonej kategorii.
Model szacuje współczynniki zmiennych niezależnych za pomocą procesu zwanego estymacją największej wiarygodności. Współczynniki te określają wpływ każdej zmiennej na przewidywane prawdopodobieństwo. Regresja logistyczna jest szeroko stosowana w różnych dziedzinach, w tym w finansach, opiece zdrowotnej i marketingu, do takich zadań, jak scoring kredytowy, diagnozowanie chorób i przewidywanie odejść klientów.
graph LR
Center["logistic-regression"]:::main
Pre_logic["logic"]:::pre --> Center
click Pre_logic "/terms/logic"
Rel_function["function"]:::related -.-> Center
click Rel_function "/terms/function"
Rel_inference["inference"]:::related -.-> Center
click Rel_inference "/terms/inference"
Rel_log_management["log-management"]:::related -.-> Center
click Rel_log_management "/terms/log-management"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧠 Sprawdzenie wiedzy
🧒 Wyjaśnij jak 5-latkowi
Regresja logistyczna to taki sprytny przewidywacz "tak/nie". Patrzy na wskazówki (na przykład wiek i nawyki danej osoby) i używa ich, żeby oszacować prawdopodobieństwo, że coś się wydarzy (na przykład czy dana osoba polubi konkretny film), podając Ci wynik między 0% a 100%.
🤓 Expert Deep Dive
Rdzeń regresji logistycznej polega na modelowaniu logarytmu szans (logit) wyniku jako funkcji liniowej predyktorów: log(P(Y=1|X) / P(Y=0|X)) = β₀ + β₁x₁ + ... + βnxn. Jest to znane jako funkcja wiążąca logit. Metoda największej wiarygodności (MLE) jest standardową metodą estymacji parametrów, obejmującą iteracyjne algorytmy optymalizacji, takie jak spadek gradientu lub metoda Newtona-Raphsona, w celu znalezienia współczynników β maksymalizujących funkcję log-wiarygodności. Techniki regularyzacji (L1 i L2) są często stosowane w celu zapobiegania przeuczeniu, zwłaszcza w przypadku danych o dużej wymiarowości, poprzez dodanie członów kary do funkcji kosztu. Chociaż jest skuteczna w klasyfikacji binarnej, rozszerzenia, takie jak regresja logistyczna wielomianowa i regresja logistyczna porządkowa, obsługują odpowiednio wyniki wieloklasowe i uporządkowane kategoryczne. Interpretowalność jest kluczową zaletą, ponieważ współczynniki (β) można potęgować, aby uzyskać ilorazy szans, wskazujące na multiplikatywną zmianę szans wyniku przy jednostkowej zmianie predyktora. Jednakże zakłada liniowość w logarytmie szans i niezależność błędów, a jej wydajność może ulec pogorszeniu, jeśli te założenia zostaną naruszone lub jeśli dane wykazują znaczącą współliniowość.