1. Tipos de problemas
1.1. Clasificación binaria
1.1.1. La variable de salida es binaria
1.2. Clasificación multiclase
1.2.1. Problemas con múltiples categorías
2. Casos de uso Reales
2.1. Predicción de rendimiento estudiantil
2.1.1. Regresión logística para predecir el éxito académico de los estudiantes de primer semestre de ingeniería en la universidad de Antofagasta
2.1.2. Variables: puntaje en matemáticas y lengua (PSU), promedio de notas en secundaria y factores motivacionales.
2.1.3. Resultados: Identificación temprana de estufiantes en riesgo con precisión del 76%
2.2. Estudios epidemológicos de casos y controles
2.2.1. Regresión logística para identificar factores de riesgo a la enfermedad de hodgkin
2.2.2. Variables: edad, antecedentes familiares yexposición a agentes infecciosos.
2.2.3. Resultados: Identificación de factores de riesgo y contribución de estrategias preventivas
2.3. Éxito en proyectos de crowfunding
2.3.1. Regresión lineal para predecir si se alcanzará una meta de financiamiento
2.3.2. Variables: Monto objetivo, duración de campaña, categoría del proyecto
2.3.3. Resultados: Optimización de estratégias, 80% de precisión en predicción
3. Referencias (comentarios)
4. ¿Que es?
4.1. Modelo estadístico para estimar la probabilidad de que ocurra un evento ( resultado binario)
5. Ventajas, desventajas y supuestos
5.1. Ventajas
5.1.1. Interpretabilidad
5.1.2. Facilidad de trabajo
5.1.3. Eficiencia
5.1.4. Manejo de variables categóricas
5.2. Desventajas
5.2.1. Sensible a problemas no lineales
5.2.2. Dependencia de supuestos
5.3. Supuestos
5.3.1. Variable de respuesta binaria
5.3.2. Observaciones de conjunto de datos son independientes entre si
5.3.3. No existe multicolinealidad
5.3.4. No hay valores atípicos extremos
5.3.5. relación entre variable explicativa y logit
5.3.6. Tamaño de muestra de datos grande
6. Fundamentos matemáticos
6.1. Ecuación Sigmoide
6.1.1. P(Y=1∣X) = 1/(1+e−(β0+β1X1+⋯+βnXn))
6.2. Logit
6.2.1. logit (P)= log(P/(1−P)) = β0+β1X1+⋯+βnXn