1. Introducción a la Estadística:
1.1. Rama de las matemáticas que se encarga de recolectar, organizar, analizar e interpretar datos para tomar decisiones informadas.
1.1.1. Hay 2 tipos
1.1.1.1. Descriptiva
1.1.1.1.1. Se enfoca en resumir y describir las características de un conjunto de datos. Utiliza medidas como la media, mediana, moda, varianza, etc.
1.1.1.2. Inferencial
1.1.1.2.1. Permite hacer inferencias o predicciones sobre una población basándose en una muestra representativa. Incluye métodos como estimación de parámetros, pruebas de hipótesis, regresión, etc.
2. Tipos de Variables y Escalas de Medición
2.1. Tipos de variables
2.1.1. Categoricas
2.1.1.1. Describen cualidades o características y no pueden ser medidas numéricamente
2.1.1.1.1. Nominales: No tienen orden específico. Ejemplo: Color de ojos (azul, verde, marrón). Ordinales: Tienen un orden o jerarquía. Ejemplo: Nivel de satisfacción (bajo, medio, alto).
2.1.2. Numéricas
2.1.2.1. Representan cantidades y pueden ser medidas numéricamente.
2.1.2.1.1. Discretas: Valores enteros específicos. Ejemplo: Número de hijos (0, 1, 2, 3). Continuas: Pueden tomar cualquier valor en un rango. Ejemplo: Estatura en metros (1.65, 1.70, 1.75).
2.2. Tipos de escalas de medición
2.2.1. Nominal
2.2.1.1. Descripción: Clasifica datos en categorías sin orden. Ejemplo: Tipo de sangre (A, B, AB, O).
2.2.1.1.1. .
2.2.2. Ordinal
2.2.2.1. Descripción: Clasifica datos en categorías con un orden establecido. Ejemplo: Grados militares (soldado, cabo, sargento).
2.2.2.1.1. .
2.2.3. De Intervalo
2.2.3.1. Descripción: Las diferencias entre valores son significativas; no tiene cero absoluto. Ejemplo: Temperatura en Celsius. La diferencia entre 20°C y 30°C es la misma que entre 30°C y 40°C.
2.2.3.1.1. .
2.2.4. De Razón
2.2.4.1. Descripción: Similar a la de intervalo, pero con un cero absoluto que indica ausencia de la característica. Ejemplo: Peso en kilogramos. Un objeto que pesa 0 kg no tiene peso.
2.2.4.1.1. .
3. Presentación Tabular para Variable Cualitativa
3.1. Métodos para Organizar Datos Cualitativos en Tablas de Frecuencia
3.1.1. Una tabla de frecuencia resume los datos mostrando el número de observaciones en cada categoría.
3.1.1.1. Pasos para Construir una Tabla de Frecuencia:
3.1.1.1.1. °Listar las Categorías: Identificar todas las categorías posibles de la variable cualitativa. °Contar las Frecuencias Absolutas (fi): Número de veces que aparece cada categoría. °Calcular las Frecuencias Relativas (hi): Proporción de cada categoría respecto al total. °Calcular las Frecuencias Porcentuales (%): Frecuencia porcentual=hi×100%
4. Presentación Gráfica para Variable Cualitativa
4.1. Gráficos adecuados para representar variables cualitativas: gráficos de barras y de sectores.
4.1.1. Barras
4.1.1.1. Descripción: Representa categorías en el eje horizontal y frecuencias en el eje vertical con barras separadas. Uso: Comparar frecuencias de diferentes categorías.
4.1.1.1.1. .
4.1.2. Sectores
4.1.2.1. Descripción: Muestra proporciones relativas de cada categoría en un círculo dividido en sectores. Uso: Visualizar la participación porcentual de cada categoría respecto al total.
4.1.2.1.1. .
5. Medidas de Punto
5.1. Conceptos y aplicación de medidas de resumen como media, mediana y moda.
5.1.1. Media
5.1.1.1. Es el valor promedio de un conjunto de datos.
5.1.1.1.1. X=∑i=1*Xi/n
5.1.2. Mediana
5.1.2.1. Es el valor central de un conjunto de datos ordenados.
5.1.2.1.1. Cálculo:
5.1.3. Moda
5.1.3.1. Es el valor que aparece con mayor frecuencia en el conjunto de datos.
6. Presentación Tabular para Variable Cuantitativa
6.1. Para variables cuantitativas, las tablas de frecuencia se pueden agrupar en clases. Esto permite organizar los datos y observar cómo se distribuyen.
6.1.1. Ejemplo
6.1.1.1. Se tienen las alturas de 20 personas (en cm): Datos: 150, 155, 158, 160, 161, 162, 163, 165, 167, 170, 172, 173, 174, 175, 177, 178, 180, 182, 183, 185. Tabla de Frecuencia Agrupada: Rango de Altura (cm) | Frecuencia 150-159 3 160-169 6 170-179 7 180-189 4
7. Presentación Gráfica para Variable Cuantitativa
7.1. Gráficos para representar datos cuantitativos: histogramas, polígonos de frecuencia, y diagramas de caja.
7.1.1. Histograma
7.1.1.1. Representa la frecuencia de los datos en intervalos continuos mediante barras.
7.1.1.1.1. .
7.1.2. Polígono de Frecuencia
7.1.2.1. Conecta los puntos medios de los intervalos en un histograma mediante líneas.
7.1.2.1.1. .
7.1.3. Diagrama de Caja
7.1.3.1. Representa la mediana, cuartiles y valores extremos, mostrando la dispersión y posibles valores atípicos.
7.1.3.1.1. .
8. Medidas de Tendencia Central, Posición y Dispersión (Serie Simple):
8.1. Análisis de medidas de tendencia central (media, mediana, moda), de posición (cuartiles, percentiles) y de dispersión (varianza, desviación estándar, rango).
8.1.1. Dispersión:
8.1.1.1. Rango: Diferencia entre el valor máximo y el mínimo. Ejemplo: En las alturas, el rango es: 185−150=35 cm Varianza y Desviación Estándar: La varianza es la media de las diferencias al cuadrado respecto a la media, y la desviación estándar es la raíz cuadrada de la varianza.
9. Regresión Lineal Simple:
9.1. Método para modelar la relación entre dos variables cuantitativas mediante una línea recta.
9.1.1. 𝑌=𝛽0+𝛽 1*𝑋 Donde 𝛽0 es el intercepto y 𝛽1 es la pendiente.
9.1.1.1. Ejemplo
9.1.1.1.1. Si queremos predecir el peso (𝑌) en función de la altura (𝑋), el modelo puede ser: 𝑃𝑒𝑠𝑜=50+0.5×𝐴𝑙𝑡𝑢𝑟𝑎 Esto indica que por cada cm adicional en altura, el peso aumenta en 0.5 kg.
10. Correlación Lineal Simple
10.1. Medida que cuantifica la fuerza y dirección de la relación entre dos variables.
10.1.1. r=∑(Xi−X)2(Yi−Y)//ˉ ∑(Xi−X)(Yi−Y) Si 𝑟=1 hay correlación positiva perfecta. Si 𝑟=−1 hay correlación negativa perfecta. Si 𝑟=0 no hay correlación. Si la correlación entre altura y peso es 𝑟 =0.85 indica una fuerte relación positiva.
11. Teoría de Probabilidad
11.1. Principios y reglas básicas de la probabilidad en la toma de decisiones estadísticas.
11.1.1. Es la medida de incertidumbre. Para un evento (A) se define como: P(A)= Número de resultados favorables/Número total de resultados posibles.
12. Aplicación de Distribución Normal:
12.1. La distribución normal es una curva simétrica en forma de campana. Está definida por su media 𝜇 y su desviación estándar 𝜎.
12.1.1. Ejemplo
12.1.1.1. Si las alturas siguen una distribución normal con media 170 cm y desviación estándar de 10 cm, podemos calcular la probabilidad de que una persona mida más de 180 cm usando la tabla Z.
13. Introducción al Muestreo
13.1. El muestreo es el proceso de seleccionar una porción representativa de una población para hacer inferencias sobre esta.
13.1.1. Aleatorio Simple
13.1.1.1. Cada individuo tiene la misma probabilidad de ser elegido.
13.1.1.1.1. Ejemplo: Elegir 100 estudiantes al azar en una universidad.
13.1.2. Estratificado
13.1.2.1. La población se divide en subgrupos (estratos) y se seleccionan muestras de cada estrato proporcionalmente.
13.1.2.1.1. Ejemplo: Seleccionar estudiantes de cada facultad de una universidad para garantizar que todas las facultades estén representadas.
13.1.3. Sistemático
13.1.3.1. Se selecciona cada n-ésimo miembro de la población después de ordenar la lista de manera aleatoria.
13.1.3.1.1. .
13.1.4. Por convenencia
13.1.4.1. Se eligen los elementos más fáciles de obtener, aunque no siempre representan a la población de manera adecuada.
13.1.4.1.1. .
14. Estimación para una Media con (Z):
14.1. Se utiliza la distribución Z cuando se conoce la desviación estándar 𝜎 de la población para calcular un intervalo de confianza para la media poblacional. Esto proporciona un rango dentro del cual probablemente se encuentre la verdadera media.
14.1.1. Ejemplo: Si la media muestral de una muestra de 50 estudiantes es 70 kg, la desviación estándar de la población es 𝜎=10 kg, y se quiere un intervalo de confianza del 95%, el intervalo sería. Esto da un intervalo de 67.23 a 72.77 kg.
15. Estimación para una Media con (t):
15.1. Cuando no se conoce la desviación estándar de la población, se utiliza la distribución t de Student en lugar de la Z. Esto es necesario, ya que la estimación basada en la muestra puede ser menos precisa con tamaños de muestra pequeños.
15.1.1. Ejemplo: Si en un estudio la media es 30 años con una desviación estándar muestral de 5 años, en una muestra de 25 personas, y se quiere un intervalo de confianza del 95%, el valor de 𝑡 para 24 grados de libertad es 2.064. Esto da un intervalo de 27.94 a 32.06 años.
16. Estimación para una Proporción
16.1. Cuando se busca estimar una proporción poblacional 𝑝, se calcula un intervalo de confianza para la proporción.
16.1.1. Ejemplo: Si en una encuesta 60 de 100 personas prefieren el producto A, entonces 𝑝=0.60. Para un intervalo de confianza del 95%. El intervalo sería de 0.504 a 0.696.
17. Tamaño de Muestra para una Media:
17.1. El tamaño de muestra necesario para estimar una media con un margen de error 𝐸 se calcula como: 𝑛=((𝑍𝛼/2×𝜎)/𝐸)^2 Donde: 𝐸 es el error máximo permitido.
17.1.1. Ejemplo: Si se quiere un margen de error de 2 kg, con 𝜎=10 kg y un nivel de confianza del 95% (valor de 𝑍= 1.96 Z=1.96): 𝑛=(1.96×10/2)^2=96.04 Se necesitaría una muestra de al menos 97 personas.
17.1.1.1. .
18. Tamaño de Muestra para una Proporción:
18.1. El tamaño de muestra necesario para estimar una proporción con un margen de error 𝐸 es: 𝑛=𝑍𝛼/2*𝑝(1−𝑝)/𝐸^2
18.1.1. Ejemplo: Para estimar una proporción con 𝑝=0.50, un margen de error de 0.05, y un nivel de confianza del 95%: 𝑛=(1.96)^2×0.50(1−0.50)/0.05^2= 384.16 Se necesitaría una muestra de 385 personas.
19. Prueba de Hipótesis para una Media (Z):
19.1. Se usa cuando se conoce la desviación estándar de la población. La prueba de hipótesis para una media poblacional se formula como: Hipótesis nula: 𝐻o:𝜇=𝜇o Hipótesis alternativa: 𝐻1:𝜇≠𝜇o
19.1.1. jemplo: Si la media teórica es 𝜇o =50, y una muestra de 100 personas da 𝑋=5 con 𝜎= 10, el valor de 𝑍 sería: 𝑍=52−50/(10/√ 100)=2.0 Dependiendo del valor crítico, se rechaza o no la hipótesis nula.
20. Prueba de Hipótesis para una Proporción:
20.1. Para probar si una proporción difiere de un valor específico, se usa: 𝑍=𝑝−𝑝o/√(𝑝o(1−𝑝o)/𝑛)
20.1.1. Ejemplo: Si la proporción teórica es 𝑝o=0.40, y en una muestra de 100 personas 𝑝=0.45, el estadístico sería: 𝑍=0.45−0.40/√(0.40(1−0.40)/100= 1.03
20.1.1.1. .
21. Prueba de Hipótesis con Distribución Ji Cuadrado:
21.1. Se usa para probar la independencia entre dos variables categóricas. El estadístico ji cuadrado es: 𝜒^2=∑((0-E)^2/E) Donde 0 son los valores observados y E son los valores esperados bajo la independencia.
21.1.1. Ejemplo: Si se observa que 60 personas prefieren un producto y se esperaban 50, el valor 𝜒^2 puede calcularse para verificar si la preferencia es significativa.