logistic-regression
La regresión logística es un método estadístico utilizado para predecir la probabilidad de un resultado binario (por ejemplo, sí/no, verdadero/falso) basado en una o más variables independientes.
La regresión logística emplea una función logística (función sigmoide) para modelar la relación entre las variables independientes y la probabilidad del resultado. A diferencia de la regresión lineal, que predice valores continuos, la regresión logística predice la probabilidad de un resultado categórico. La salida es un valor entre 0 y 1, que representa la probabilidad de que el resultado pertenezca a una categoría específica.
El modelo estima los coeficientes de las variables independientes a través de un proceso llamado estimación de máxima verosimilitud. Estos coeficientes determinan el impacto de cada variable en la probabilidad predicha. La regresión logística se utiliza ampliamente en varios campos, incluyendo finanzas, atención médica y marketing, para tareas como la calificación crediticia, el diagnóstico de enfermedades y la predicción de la pérdida de clientes.
graph LR
Center["logistic-regression"]:::main
Pre_logic["logic"]:::pre --> Center
click Pre_logic "/terms/logic"
Rel_function["function"]:::related -.-> Center
click Rel_function "/terms/function"
Rel_inference["inference"]:::related -.-> Center
click Rel_inference "/terms/inference"
Rel_log_management["log-management"]:::related -.-> Center
click Rel_log_management "/terms/log-management"
classDef main fill:#7c3aed,stroke:#8b5cf6,stroke-width:2px,color:white,font-weight:bold,rx:5,ry:5;
classDef pre fill:#0f172a,stroke:#3b82f6,color:#94a3b8,rx:5,ry:5;
classDef child fill:#0f172a,stroke:#10b981,color:#94a3b8,rx:5,ry:5;
classDef related fill:#0f172a,stroke:#8b5cf6,stroke-dasharray: 5 5,color:#94a3b8,rx:5,ry:5;
linkStyle default stroke:#4b5563,stroke-width:2px;
🧠 Prueba de conocimiento
🧒 Explícalo como si tuviera 5 años
La regresión logística es como un predictor inteligente de sí o no. Examina pistas (como la edad y los hábitos de una persona) y las usa para adivinar la probabilidad de que algo suceda (como si les gustará una película en particular), dándote una probabilidad entre el 0% y el 100%.
🤓 Expert Deep Dive
El núcleo de la regresión logística radica en modelar el logaritmo de las probabilidades (logit) del resultado como una función lineal de los predictores: log(P(Y=1|X) / P(Y=0|X)) = β₀ + β₁x₁ + ... + βnxn. Esto se conoce como la función de enlace logit. La Estimación por Máxima Verosimilitud (MLE, por sus siglas en inglés) es el método estándar para la estimación de parámetros, que implica algoritmos de optimización iterativos como el descenso de gradiente o Newton-Raphson para encontrar los coeficientes β que maximizan la función de log-verosimilitud. Las técnicas de regularización (L1 y L2) se emplean a menudo para prevenir el sobreajuste, especialmente con datos de alta dimensionalidad, añadiendo términos de penalización a la función de coste. Si bien es eficaz para la clasificación binaria, extensiones como la regresión logística multinomial y la regresión logística ordinal manejan resultados categóricos multiclase y ordenados, respectivamente. La interpretabilidad es una ventaja clave, ya que los coeficientes (β) pueden ser exponenciados para obtener razones de probabilidades (odds ratios), lo que indica el cambio multiplicativo en las probabilidades del resultado por un cambio de una unidad en un predictor. Sin embargo, asume linealidad en los log-odds e independencia de los errores, y su rendimiento puede degradarse si estas suposiciones se violan o si los datos presentan multicolinealidad significativa.