Análisis descriptivo de variables cuantitativas

Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
Análisis descriptivo de variables cuantitativas por Mind Map: Análisis descriptivo de   variables cuantitativas

1. Dispersión.

1.1. Grado de concentración o alejamiento de los valores en torno al centro de la variable.

1.1.1. Desviaciones promedio

1.1.1.1. Media de las desviaciones

1.1.1.1.1. se toma en valor absoluto y su suma se divide por el número de puntuaciones, para obtener la desviación promedio, recoge la idea de dispersión respecto del valor central (la media) y representa el promedio del conjunto de distancias a la media.

1.1.1.2. Mediana de las desviaciones

1.1.1.2.1. Si la distribución es simétrica, la mediana de las desviaciones tomará un valor parecido al de la media de las desviaciones. Pero conforme la distribución se vaya haciendo asimétrica, el valor de la media de las desviaciones se verá más alterado que el de la mediana de las desviaciones.

1.1.2. Varianza y desviación típica

1.1.2.1. Varianza

1.1.2.1.1. Es el promedio de las desviaciones cuadráticas de la media, es decir, el promedio de las desviaciones de la media elevadas al cuadrado.

1.1.2.2. Desviación típica

1.1.2.2.1. Es un promedio basado en las desviaciones de la media.

1.1.3. Comparación entre estadísticos de disepersión

1.1.3.1. La dispersión no se altera cuando a los valores de una variable se les suma o resta una constante.

1.1.3.2. Los estadísticos que se basan en las desviaciones del centro no son igualmente sensibles al grado de asimetría de la distribución.

1.1.4. Coeficientes de variación

1.1.4.1. Centrado en la media.

1.1.4.1.1. Expresa la desviación típica como un porcentaje del valor absoluto de la media.

1.1.4.2. Centrado en a mediana

1.1.4.2.1. Se calculan las desviaciones de la mediana, se elevan al cuadrado, se promedian utilizando, se obtiene la raíz cuadrada de ese promedio y el resultado se divide entre el valor absoluto de la mediana. Todo ello se multiplica por 100 para expresar el resultado final como un porcentaje.

2. Cuantiles

2.1. Son cada uno de los J valores que dividen la distribución en J + 1 partes iguales.

3. Tendencia Central

3.1. Media Aritmética

3.1.1. Se define como la suma de todas las puntuaciones dividida por el número de puntuaciones y se representa con el nombre de la variable coronado con un guión.

3.2. Media Ponderada

3.2.1. Cuando se trabaja con varios grupos resulta útil conocer la correspondencia existente entre las medias de los grupos y la media total (la media de todas las puntuaciones).

3.3. Mediana

3.3.1. Es el valor que ocupa la posición central cuando los casos están ordenados.

3.4. Estadisticos Resistentes

3.4.1. Es cuando es poco sensible a la presencia de anomalías en los datos.

3.4.2. Esta propiedad es particularmente útil cuando se trabaja con distribuciones asimétricas.

3.4.3. Media Recortada

3.4.3.1. Se obtiene calculando la media aritmética tras eliminar de los extremos de la distribución un determinado porcentaje de casos.

3.4.4. Media Winsorisada

3.4.4.1. Se basa en una lógica similar a la de la recortada, pero en lugar de eliminar un determinado porcentaje de casos de los extremos, sustituye los valores de esos casos por el valor adyacente a ellos.

3.4.5. Trimedia

3.4.5.1. Se obtiene promediando tres valores: los tres cuartiles.

3.4.6. Estimadores M

3.4.6.1. Son un grupo de estadísticos resistentes basados en el método de máxima verosimilitud , no es más que una media ponderada

3.5. Comparación entre estadísticos de tendencia central

3.5.1. Media Aritmética

3.5.1.1. Utiliza las propiedades cuantitativas de los datos y se basa en una ponderación uniforme de todos ellos.

3.5.2. Medias recortadas y Winsorizada

3.5.2.1. Intentan corregir la falta de resistencia de la media aritmética modificando el tratamiento que dan a un determinado porcentaje de casos de los extremos de la distribución; esta modificación, implica una pérdida de información.

3.5.3. Mediana

3.5.3.1. Elimina del análisis todos los casos menos el(los) que ocupa(n) la posición central; de este modo, su resistencia a la presencia de anomalías en los datos es máxima.

3.5.4. Estimadores M

3.5.4.1. Asignan pesos muy pequeños a los que se alejan mucho del centro.

4. Forma de la distribución

4.1. Refleja la frecuencia con la que se repite cada valor o cada rango de valores.

4.1.1. Gráficos para variables cuantitativas

4.1.1.1. Histograma

4.1.1.1.1. Es parecido al gráfico de barras, pero con las barras juntas. Se construye sobre el plano definido por dos ejes cartesianos: en el eje horizontal se colocan los valores de la variable ordenados de menor a mayor, en el vertical se colocan las frecuencias (número de veces que se repite cada valor) y sobre cada valor se levanta una barra o rectángulo de altura proporcional a su frecuencia.

4.1.1.2. Poligono de frecuencias

4.1.1.2.1. La información de este gráfico es idéntica a la de un histograma. Es bastante habitual representarlo como si los intervalos fueran infinitamente pequeños.

4.1.1.3. Diagrama de tallo y hojas

4.1.1.3.1. Si las barras del histograma se sustituyen por los valores de la variable se obtiene un gráfico que informa simultáneamente de los valores que toma la variable y de la forma de la distribución. Permite comprobar si existen valores que se repiten mucho o valores que no aparecen. Suele representarse en horizontal, no en vertical como el histograma.

4.1.1.4. Diagrama de caja y bigotes

4.1.1.4.1. Es un gráfico que contempla el centro, dispersión y forma. Incluye la mediana, los percentiles 9, 25 y 75, y una serie de puntos que identifican a los valores que se alejan excesivamente del centro. La mediana identifica el centro de la distribución. La altura de la caja y la longitud de los bigotes permiten valorar el grado de dispersión y de asimetría. Los círculos y los asteriscos, si existen, delatan casos excesivamente alejados del centro.

4.1.2. Indices de asimetría y curtosis

4.1.2.1. Asimetría

4.1.2.1.1. Se refiere a la forma en que los datos se distribuyen por encima y por debajo del centro. En una distribución simétrica, las distribuciones a cada lado del centro tienen la misma forma (una es espejo de la otra).

4.1.2.2. Curtosis

4.1.2.2.1. Se refiere a su grado de apuntamiento. Expresa el grado en que una distribución acumula casos en sus colas en comparación con los casos que acumulan las colas de una curva normal con la misma media y con la misma desviación típica.

4.1.3. Análisis descriptivo y exploratorio

4.1.3.1. Describir correctamente una variable cuantitativa requiere prestar atención a tres propiedades básicas de su distribución (centro, dispersión y forma). Esto es, sin duda, la esencia del análisis descriptivo.

4.1.3.2. Una exploración descriptiva de los datos permite identificar, entre otras cosas, posibles errores, valores atípicos, pautas extrañas en los datos, variabilidad no esperada, etc.