logistic-regression
Логістична регресія - це статистичний метод, який використовується для прогнозування ймовірності бінарного результату (наприклад, так/ні, правда/неправда) на основі однієї або декількох незалежних змінних.
Логістична регресія використовує логістичну функцію (сигмоїдну функцію) для моделювання взаємозв'язку між незалежними змінними та ймовірністю результату. На відміну від лінійної регресії, яка прогнозує безперервні значення, логістична регресія прогнозує ймовірність категоріального результату. Вихідні дані - це значення від 0 до 1, що представляє ймовірність того, що результат належить до певної категорії.
Модель оцінює коефіцієнти незалежних змінних за допомогою процесу, який називається оцінкою максимальної правдоподібності. Ці коефіцієнти визначають вплив кожної змінної на прогнозовану ймовірність. Логістична регресія широко використовується в різних областях, включаючи фінанси, охорону здоров'я та маркетинг, для таких завдань, як оцінка кредитоспроможності, діагностика захворювань та прогнозування відтоку клієнтів.
graph LR
Center["logistic-regression"]:::main
Pre_logic["logic"]:::pre --> Center
click Pre_logic "/terms/logic"
Rel_function["function"]:::related -.-> Center
click Rel_function "/terms/function"
Rel_inference["inference"]:::related -.-> Center
click Rel_inference "/terms/inference"
Rel_log_management["log-management"]:::related -.-> Center
click Rel_log_management "/terms/log-management"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧠 Перевірка знань
🧒 Простими словами
Логістична регресія — це як розумний передбачувач "так/ні". Вона аналізує підказки (наприклад, вік людини та її звички) і використовує їх, щоб вгадати ймовірність чогось (наприклад, чи сподобається їй певний фільм), надаючи вам шанс від 0% до 100%.
🤓 Expert Deep Dive
Суть логістичної регресії полягає в моделюванні логарифма шансів (логіту) результату як лінійної функції предикторів: log(P(Y=1|X) / P(Y=0|X)) = β₀ + β₁x₁ + ... + βnxn. Це відомо як логіт-зв'язувальна функція. Метод максимальної правдоподібності (MLE) є стандартним методом оцінки параметрів, який включає ітеративні алгоритми оптимізації, такі як градієнтний спуск або метод Ньютона-Рафсона, для знаходження коефіцієнтів β, що максимізують функцію логарифмічної правдоподібності. Техніки регуляризації (L1 та L2) часто використовуються для запобігання перенавчанню, особливо з високорозмірними даними, шляхом додавання штрафних членів до функції втрат. Хоча логістична регресія ефективна для бінарної класифікації, її розширення, такі як мультиноміальна логістична регресія та порядкова логістична регресія, відповідно обробляють багатокласові та впорядковані категоріальні результати. Інтерпретованість є ключовою перевагою, оскільки коефіцієнти (β) можна піднести до степеня, щоб отримати відношення шансів, що вказують на мультиплікативну зміну шансів результату при зміні предиктора на одну одиницю. Однак, вона передбачає лінійність у логарифмі шансів та незалежність помилок, і її продуктивність може погіршитися, якщо ці припущення порушуються або якщо дані демонструють значну мультиколінеарність.