Regresión Logistica
Danna Ruizにより

1. Considerado como un componente clave del aprendizaje de máquinas, principalmente para la creación de modelos estadísticos que se utilizan para la clasificación, análisis predictivo y estima la probabilidad de que ocurra un evento, en función de un conjunto de datos determinado de variables independientes.
1.1. Se emplea principalmente para problemas de clasificación binaria o multiclase, su salida es una probabilidad entre 0 y 1.
2. Tipos de Problema
2.1. Binaria
2.1.1. Se utiliza para analizar situaciones donde la variable dependiente es dicotómica, con dos posibles resultados.
2.2. Multiclase
2.2.1. Es una extensión de la regresión logística tradicional para más de dos clases.
3. Ventajas
3.1. Interpretación sencilla: Los coeficientes indican la dirección y magnitud de la relación entre variables.
3.2. Simplicidad y eficiencia: Fácil de implementar y rápido de entrenar.
4. Desventajas
4.1. Supone una relación lineal: Puede no ser adecuada en todos los casos.
4.2. Sensibilidad a valores atípicos: Los valores extremos pueden afectar el modelo.
5. Supuestos de modelo
5.1. Variable dependiente binaria: La respuesta debe ser dicotómica.
5.2. Observaciones independientes: Cada observación debe ser independiente.
5.3. Ausencia de multicolinealidad: Las variables independientes no deben estar altamente correlacionadas.
5.4. Relación lineal con el logit: Debe existir una relación lineal con la variable dependiente.
5.5. Tamaño de muestra adecuado: Se recomienda una muestra grande para resultados confiables.
6. Casos de uso
6.1. 1. Predicción del rendimiento estudiantil
6.1.1. Identificar variables que predicen el éxito académico en el primer semestre universitario.
6.2. 2. Clasificación de gravedad de lesiones en accidentes
6.2.1. Estudiar lesiones abdominales en niños causadas por cinturones de seguridad.
6.3. 3. Identificación de factores en bajo rendimiento en matemáticas
6.3.1. Determinar si variables socioeconómicas influyen en el rendimiento matemático.