Datos Unidimensionales
par Maria Alejandra Castaño Ramirez
1. MEDIDAS DE DISPERSIÓN El término dispersión o variabilidad hace referencia a cómo de distantes, de separados, se encuentran los datos. En este sentido, si los distintos valores de la distribución se encuentran próximos entre sí, estos presentarán poca dispersión o variabilidad; si por el contrario están alejados, mostrarán mucha dispersión.
1.1. Rango: El rango o recorrido de una distribución es la diferencia entre el valor máximo y mínimo, es decir, Re = xmax - xmin. La principal desventaja de este tipo de medida de dispersión es la que tiene en cuenta dos valores de la variable.
1.2. Varianza y desviación típica La varianza, que se denota por S2X, se define como la media aritmética de los cuadrados de las diferencias de los valores de la variable a la media aritmética
2. MEDIDAS DE POSICIÓN: indican un valor de la variable en torno al cual se sitúan un grupo de observaciones. Puede distinguirse entre: a. Medidas de tendencia central: media aritmética, armónica, geométrica, mediana y moda. b. Medidas de tendencia no central: cuantiles.
2.1. Mediana Ordenada la distribución de frecuencias de menor a mayor, la mediana, que se denota por mí, es un valor del recorrido de la variable que deja el mismo número de observaciones a su izquierda ya su derecha. Para el cálculo de la mediana es necesario distinguir entre distribuciones de frecuencias de valores sin agrupar y agrupados, pero la idea que siempre hay que tener presente es la mediana es aquel valor de la variable al que corresponde una frecuencia acumulada igual a N / 2 .
2.2. Moda: La moda de una distribución, a la que se denotará por Mo, representa el valor de la variable con mayor frecuencia. No tiene por qué ser única. Es decir, si hay dos o más valores de la variable que tienen la misma frecuencia, siendo esta la mayor, estará ante una distribución multimodal (bimodal, dos modas; trimodal, tres modas, etc.).
2.3. Cuantiles: ordenados de menor a mayor los valores de la variable y dado un entero positivo k, las familias de cuantiles serán valores del recorrido de la variable que dividirán la distribución en k partes, conteniendo cada una de ellas la misma proporción de observaciones Las familias de cuantiles más utilizados son específicos que dividen la distribución de frecuencias en cuatro, diez y cien partes y se conocen con el nombre de cuartiles, deciles y percentiles, respectivamente:
2.3.1. Deciles (k = 10): son nueve valores del recorrido (Ds, s = 1, 2,…, 9) que divide la distribución en 10 partes, de tal forma que cada una de ellas contendrá el 10% de las observaciones.
2.3.2. Cuartiles (k = 4): son tres valores (Cs, s = 1, 2, 3) del recorrido que divide la distribución en 4 partes, conteniendo cada una de ellas el 25% de las observaciones.
2.3.3. Percentiles (k = 100): son noventa y nueve valores del recorrido (Ps, s = 1, 2,…, 99) que divide la distribución en 100 partes, conteniendo cada una de ellas el 1% de las observaciones.