Regresión y Correlación

Get Started. It's Free
or sign up with your email address
Regresión y Correlación by Mind Map: Regresión y Correlación

1. REGRESIÓN LINEAL SIMPLE

1.1. La regresión está dirigida a describir como es la relación entre dos variables X e Y, de tal manera que incluso se pueden hacer predicciones sobre los valores de la variable Y, a partir de los de X. Cuando la asociación entre ambas variables es fuerte, la regresión nos ofrece un modelo estadístico que puede alcanzar finalidades predictivas.

1.1.1. La regresión supone que hay una variable fija, controlada por el investigador (es la variable independiente o predictora), y otra que no está controlada (variable respuesta o dependiente). La correlación supone que ninguna es fija: las dos variables están fuera del control de investigador.

1.1.2. Ajuste de una recta por mínimos cuadrados

1.1.2.1. El método de los mínimos cuadrados consiste en buscar los valores de los parámetros a y b de manera que la suma de los cuadrados de los residuos sea mínima. Esta recta es la recta de regresión por mínimos cuadrados.

1.1.2.2. La regresión lineal consiste en encontrar (aproximar) los valores de una variable a partir de los de otra, usando una relación funcional de tipo lineal, es decir, buscamos cantidades a (ordenada en el origen) y b (pendiente de la recta lineal)

2. CORRELACIÓN

2.1. La finalidad de la correlación es examinar la dirección y la fuerza de la asociación entre dos variables cuantitativas. Así conoceremos la intensidad de la relación entre ellas y si, al aumentar el valor de una variable, aumenta o disminuye el valor de la otra variable

2.1.1. Para valorar la asociación entre dos variables, la primera aproximación suele hacerse mediante un diagrama de dispersión.

2.1.2. Si se desea medir o cuantificar el grado de asociación entre dos variables cuantitativas se debe calcular un coeficiente de correlación.

2.1.2.1. Coeficiente de Correlación lineal de Pearson

2.1.2.1.1. El estimador muestral más utilizado para evaluar la asociación lineal entre dos variables X e Y es el coeficiente de correlación de Pearson (r). Se trata de un índice que mide si los puntos tienen tendencia a disponerse en una línea recta. Puede tomar valores entre -1 y +1. Es un método estadístico paramétrico, ya que utiliza la media, la varianza,…y por tanto, requiere criterios de normalidad para las variables analizadas.

2.1.2.2. Covarianza

2.1.2.2.1. El numerador del coeficiente de correlación es la covarianza muestral SXY entre X e Y, que nos indica si la posible relación entre dos variables es directa o inversa. Es una medida que nos habla de la variabilidad conjunta de dos variables cuantitativas.

3. Supuestos del modelo de regresión

3.1. Linealidad: El valor esperado de la variable dependiente Y es una función lineal de la variable explicativa X, de tal forma que cambios de magnitud constante a distintos niveles de X se asocian con un mismo cambio en el valor medio de Y.

3.2. Homogeneidad de la varianza: La varianza de la variable dependiente Y es la misma para cualquier valor de la variable explicativa X; es decir, a diferencia de la media, la varianza de Y no está relacionada con X.

3.3. Normalidad: Para un valor fijo de la variable explicativa X, la variable dependiente Y sigue una distribución normal.

3.4. Independencia: Cada observación de la variable Y debe ser independiente de las demás.