logistic-regression

A regressão logística é um método estatístico usado para prever a probabilidade de um resultado binário (por exemplo, sim/não, verdadeiro/falso) com base em uma ou mais variáveis independentes.

A regressão logística emprega uma função logística (função sigmóide) para modelar a relação entre as variáveis independentes e a probabilidade do resultado. Ao contrário da regressão linear, que prevê valores contínuos, a regressão logística prevê a probabilidade de um resultado categórico. A saída é um valor entre 0 e 1, representando a probabilidade de o resultado pertencer a uma categoria específica.

O modelo estima os coeficientes das variáveis independentes por meio de um processo chamado estimativa de máxima verossimilhança. Esses coeficientes determinam o impacto de cada variável na probabilidade prevista. A regressão logística é amplamente utilizada em vários campos, incluindo finanças, saúde e marketing, para tarefas como avaliação de crédito, diagnóstico de doenças e previsão de evasão de clientes.

        graph LR
  Center["logistic-regression"]:::main
  Pre_logic["logic"]:::pre --> Center
  click Pre_logic "/terms/logic"
  Rel_function["function"]:::related -.-> Center
  click Rel_function "/terms/function"
  Rel_inference["inference"]:::related -.-> Center
  click Rel_inference "/terms/inference"
  Rel_log_management["log-management"]:::related -.-> Center
  click Rel_log_management "/terms/log-management"
  classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
  classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
  classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
  classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
  linkStyle default stroke:#4b5563,stroke-width:2px;

      

🧠 Teste de conhecimento

1 / 3

🧒 Explique como se eu tivesse 5 anos

Regressão logística é como um preditor inteligente de "sim" ou "não". Ele observa pistas (como a idade e os hábitos de uma pessoa) e as usa para adivinhar a chance de algo acontecer (como se ela vai gostar de um determinado filme), dando a você uma probabilidade entre 0% e 100%.

🤓 Expert Deep Dive

O cerne da regressão logística reside na modelagem do log-odds (logit) do resultado como uma função linear dos preditores: log(P(Y=1|X) / P(Y=0|X)) = β₀ + β₁x₁ + ... + βnxn. Isso é conhecido como a função de ligação logit. A Estimativa de Máxima Verossimilhança (EMV) é o método padrão para estimação de parâmetros, envolvendo algoritmos de otimização iterativa como o gradiente descendente ou Newton-Raphson para encontrar os coeficientes β que maximizam a função de log-verossimilhança. Técnicas de regularização (L1 e L2) são frequentemente empregadas para prevenir o sobreajuste (overfitting), especialmente com dados de alta dimensionalidade, adicionando termos de penalidade à função de custo. Embora eficaz para classificação binária, extensões como a regressão logística multinomial e a regressão logística ordinal lidam com resultados categóricos multiclasse e ordenados, respectivamente. A interpretabilidade é uma vantagem chave, pois os coeficientes (β) podem ser exponenciados para gerar razões de chances (odds ratios), indicando a mudança multiplicativa nas chances do resultado para uma mudança de uma unidade em um preditor. No entanto, assume linearidade nos log-odds e independência dos erros, e seu desempenho pode degradar se essas suposições forem violadas ou se os dados apresentarem multicolinearidade significativa.

🔗 Termos relacionados

Pré-requisitos:

📚 Fontes