medidas estadísticas univariantes

Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
Rocket clouds
medidas estadísticas univariantes por Mind Map: medidas estadísticas  univariantes

1. 1.1.3. Moda

1.1. Se trata del valor más frecuente en un conjunto de datos. Se considera como el valor más representativo o típico de una serie de valores. Es simbolizada como Mo. Si dos valores tienen la misma frecuencia se dice que el conjunto es bimodal. Cuando más de dos valores ocurren con la misma frecuencia y ésta es la más alta, todos los valores son modas, por lo que el conjunto de datos recibe el nombre de multimodal. Cuando los datos se encuentran agrupados la moda es la marca de clase del intervalo de clase que contiene la mayor frecuencia. La moda también puede determinarse gráficamente, usando un histograma de frecuencias o un polígono de frecuencias. La barra más alta o el pico más alto corresponde al valor que más se repite. Generalmente las curvas de frecuencia presentan un solo pico, pero a veces se encuentran series con dos o más picos, es decir puntos que corresponden a una mayor densidad de frecuencias. Esto sucede cuando se trabaja con grupos de datos heterogéneos.

2. 1.1.1. Media aritmética

2.1. Es la medida más conocida y la más fácil de calcular. Se define como la suma de los valores de una cantidad dada de números dividido entre la cantidad de números.

2.1.1. donde: n = cantidad de elementos Xi = valor de cada elemento X= media aritmética, o simplemente media

3. 1.1. MEDIDAS DE TENDENCIA CENTRAL

3.1. 1.1.2. Mediana

3.1.1. Se define como el valor que divide una distribución de datos ordenados en dos mitades, es decir, se encuentra en el centro de la distribución. La mediana se simboliza como Me. Es menos usada que la media aritmética. Para su cálculo es necesario que los datos estén ordenados. Cuando la cantidad de datos es impar, fácilmente se identifica la mediana; pero cuando el número de datos es par, la mediana se calcula hallando el valor medio entre los dos valores centrales y no coincidirá con ninguno de los valores del conjunto de datos.

3.1.1.1. a. Dados los valores: 19, 15, 23, 28, 14, 26, 18, 20, 30, determinar su media. Lo primero que debe hacerse es ordenar los datos: 14 15 18 19 20 23 26 28 30 Como el número de datos es 9, el valor del medio de estos datos es la mediana, puesto que deja cuatro valores por debajo y cuatro valores por encima. Este valor es 20.

3.1.1.1.1. b. Hallar la media del siguiente conjunto de datos ordenados: 14 15 18 19 20 23 26 28 30 32 Observe que son 10 datos, un número par de datos. En este caso se toman los dos valores del medio y se promedian: Me=20+23/2 = 21.5

4. 1.2. MEDIDAS DE DISPERSIÓN

4.1. 1.2.1. Rango o recorrido

4.1.1. Sobre esta medida ya se había trabajado en la construcción de las tablas de frecuencia agrupada. Se trata de la diferencia entre el límite superior y el límite inferior de un conjunto de datos. Es la medida de dispersión más fácil de calcular, sólo requiere que los datos estén ordenados. Pero es poco usada como medida de dispersión porque se deja afectar fácilmente de los valores extremos de poca frecuencia.

4.2. 1.2.2. Varianza

4.2.1. Es una de las medidas más usadas en estadística, ella a su vez da origen a otra mucho más significativa: la desviación típica o estándar. Se define como la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética. Se simboliza s2 para la varianza muestral y σ2 para la varianza poblacional.

4.2.1.1. La varianza indica la desviación de los datos respecto a la media. Para comparar dos distribuciones, en cuanto a su variabilidad absoluta, se pueden utilizar sus varianzas de manera que el resultado indique cuál de ellas es más homogénea o cuál es más heterogénea.

4.3. 1.2.3. Desviación típica o estándar

4.3.1. Esta medida se obtiene extrayendo la raíz cuadrada de la varianza, tomando siempre el valor positivo. Se simboliza por s en la muestra y σ en la población. Esta es la medida de dispersión más conocida y más utilizada en el análisis de datos estadísticos.

4.4. 1.2.4. Coeficiente de variación

4.4.1. Las medidas de dispersión que se han estudiado son medidas absolutas y se expresan en las mismas unidades con las que se mide la variable. Cuando se comparan dos o más conjuntos de datos con unidades de medida de observación diferentes, no es posible compararlas con estas medidas absolutas. Si las unidades de observación de los conjuntos de datos son iguales, estos pueden compararse usando cualquiera de estos estadísticos (como en el ejemplo anterior) pero siempre y cuando la media aritmética sea la misma, de lo contrario estas apreciaciones no aportarán una buena conclusión sobre las series que se comparan.

4.4.1.1. Para efectuar comparaciones entre series de observaciones distintas, en estadística se usa el coeficiente de variación y así se puede determinar cuál serie tiene mayor o menor variabilidad relativa. CV=s/x * 100%

4.5. 1.2.5. Desviación media

4.5.1. Se define como la media aritmética de las desviaciones respecto a la media, tomadas en valor absoluto . Es una de las medidas más fáciles de calcular y por ello, muy usada. Ella toma todos los valores de la variable y es menos afectada que la desviación estándar por los valores extremos. Su valor siempre será menor que la desviación estándar.

4.6. 1.2.6. Puntaje típico o estandarizado

4.6.1. Cuando se tiene una distribución simétrica, su polígono de frecuencias revelará una forma de campana muy común en estadística. Esta curva es llamada curva normal, de error, de probabilidad o campana de Gauss. En ella la media aritmética se localiza en la mitad de la distribución. En el eje horizontal se ubican los valores que toma la variable y en el vertical la frecuencia absoluta o relativa. El área bajo la curva tendrá un valor del 100%