logistic-regression
A regressão logística é um método estatístico usado para prever a probabilidade de um resultado binário (por exemplo, sim/não, verdadeiro/falso) com base em uma ou mais variáveis independentes.
A regressão logística emprega uma função logística (função sigmóide) para modelar a relação entre as variáveis independentes e a probabilidade do resultado. Ao contrário da regressão linear, que prevê valores contínuos, a regressão logística prevê a probabilidade de um resultado categórico. A saída é um valor entre 0 e 1, representando a probabilidade de o resultado pertencer a uma categoria específica.
O modelo estima os coeficientes das variáveis independentes por meio de um processo chamado estimativa de máxima verossimilhança. Esses coeficientes determinam o impacto de cada variável na probabilidade prevista. A regressão logística é amplamente utilizada em vários campos, incluindo finanças, saúde e marketing, para tarefas como avaliação de crédito, diagnóstico de doenças e previsão de evasão de clientes.
graph LR
Center["logistic-regression"]:::main
Pre_logic["logic"]:::pre --> Center
click Pre_logic "/terms/logic"
Rel_function["function"]:::related -.-> Center
click Rel_function "/terms/function"
Rel_inference["inference"]:::related -.-> Center
click Rel_inference "/terms/inference"
Rel_log_management["log-management"]:::related -.-> Center
click Rel_log_management "/terms/log-management"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧠 Teste de conhecimento
🧒 Explique como se eu tivesse 5 anos
Regressão logística é como um preditor inteligente de "sim" ou "não". Ele observa pistas (como a idade e os hábitos de uma pessoa) e as usa para adivinhar a chance de algo acontecer (como se ela vai gostar de um determinado filme), dando a você uma probabilidade entre 0% e 100%.
🤓 Expert Deep Dive
O cerne da regressão logística reside na modelagem do log-odds (logit) do resultado como uma função linear dos preditores: log(P(Y=1|X) / P(Y=0|X)) = β₀ + β₁x₁ + ... + βnxn. Isso é conhecido como a função de ligação logit. A Estimativa de Máxima Verossimilhança (EMV) é o método padrão para estimação de parâmetros, envolvendo algoritmos de otimização iterativa como o gradiente descendente ou Newton-Raphson para encontrar os coeficientes β que maximizam a função de log-verossimilhança. Técnicas de regularização (L1 e L2) são frequentemente empregadas para prevenir o sobreajuste (overfitting), especialmente com dados de alta dimensionalidade, adicionando termos de penalidade à função de custo. Embora eficaz para classificação binária, extensões como a regressão logística multinomial e a regressão logística ordinal lidam com resultados categóricos multiclasse e ordenados, respectivamente. A interpretabilidade é uma vantagem chave, pois os coeficientes (β) podem ser exponenciados para gerar razões de chances (odds ratios), indicando a mudança multiplicativa nas chances do resultado para uma mudança de uma unidade em um preditor. No entanto, assume linearidade nos log-odds e independência dos erros, e seu desempenho pode degradar se essas suposições forem violadas ou se os dados apresentarem multicolinearidade significativa.