SABERES CONCEPTUALES DE LA BIOESTADISTICA

Grupo 6

Comienza Ya. Es Gratis
ó regístrate con tu dirección de correo electrónico
SABERES CONCEPTUALES DE LA BIOESTADISTICA por Mind Map: SABERES CONCEPTUALES DE LA BIOESTADISTICA

1. Introducción a la Estadística:

1.1. Rama de las matemáticas que se encarga de recolectar, organizar, analizar e interpretar datos para tomar decisiones informadas.

1.1.1. Hay 2 tipos

1.1.1.1. Descriptiva

1.1.1.1.1. Se enfoca en resumir y describir las características de un conjunto de datos. Utiliza medidas como la media, mediana, moda, varianza, etc.

1.1.1.2. Inferencial

1.1.1.2.1. Permite hacer inferencias o predicciones sobre una población basándose en una muestra representativa. Incluye métodos como estimación de parámetros, pruebas de hipótesis, regresión, etc.

2. Tipos de Variables y Escalas de Medición

2.1. Tipos de variables

2.1.1. Categoricas

2.1.1.1. Describen cualidades o características y no pueden ser medidas numéricamente

2.1.1.1.1. Nominales: No tienen orden específico. Ejemplo: Color de ojos (azul, verde, marrón). Ordinales: Tienen un orden o jerarquía. Ejemplo: Nivel de satisfacción (bajo, medio, alto).

2.1.2. Numéricas

2.1.2.1. Representan cantidades y pueden ser medidas numéricamente.

2.1.2.1.1. Discretas: Valores enteros específicos. Ejemplo: Número de hijos (0, 1, 2, 3). Continuas: Pueden tomar cualquier valor en un rango. Ejemplo: Estatura en metros (1.65, 1.70, 1.75).

2.2. Tipos de escalas de medición

2.2.1. Nominal

2.2.1.1. Descripción: Clasifica datos en categorías sin orden. Ejemplo: Tipo de sangre (A, B, AB, O).

2.2.1.1.1. .

2.2.2. Ordinal

2.2.2.1. Descripción: Clasifica datos en categorías con un orden establecido. Ejemplo: Grados militares (soldado, cabo, sargento).

2.2.2.1.1. .

2.2.3. De Intervalo

2.2.3.1. Descripción: Las diferencias entre valores son significativas; no tiene cero absoluto. Ejemplo: Temperatura en Celsius. La diferencia entre 20°C y 30°C es la misma que entre 30°C y 40°C.

2.2.3.1.1. .

2.2.4. De Razón

2.2.4.1. Descripción: Similar a la de intervalo, pero con un cero absoluto que indica ausencia de la característica. Ejemplo: Peso en kilogramos. Un objeto que pesa 0 kg no tiene peso.

2.2.4.1.1. .

3. Presentación Tabular para Variable Cualitativa

3.1. Métodos para Organizar Datos Cualitativos en Tablas de Frecuencia

3.1.1. Una tabla de frecuencia resume los datos mostrando el número de observaciones en cada categoría.

3.1.1.1. Pasos para Construir una Tabla de Frecuencia:

3.1.1.1.1. °Listar las Categorías: Identificar todas las categorías posibles de la variable cualitativa. °Contar las Frecuencias Absolutas (fi): Número de veces que aparece cada categoría. °Calcular las Frecuencias Relativas (hi): Proporción de cada categoría respecto al total. °Calcular las Frecuencias Porcentuales (%): Frecuencia porcentual=hi×100%

4. Presentación Gráfica para Variable Cualitativa

4.1. Gráficos adecuados para representar variables cualitativas: gráficos de barras y de sectores.

4.1.1. Barras

4.1.1.1. Descripción: Representa categorías en el eje horizontal y frecuencias en el eje vertical con barras separadas. Uso: Comparar frecuencias de diferentes categorías.

4.1.1.1.1. .

4.1.2. Sectores

4.1.2.1. Descripción: Muestra proporciones relativas de cada categoría en un círculo dividido en sectores. Uso: Visualizar la participación porcentual de cada categoría respecto al total.

4.1.2.1.1. .

5. Medidas de Punto

5.1. Conceptos y aplicación de medidas de resumen como media, mediana y moda.

5.1.1. Media

5.1.1.1. Es el valor promedio de un conjunto de datos.

5.1.1.1.1. X=∑i=1*Xi/n​

5.1.2. Mediana

5.1.2.1. Es el valor central de un conjunto de datos ordenados.

5.1.2.1.1. Cálculo:

5.1.3. Moda

5.1.3.1. Es el valor que aparece con mayor frecuencia en el conjunto de datos.

6. Presentación Tabular para Variable Cuantitativa

6.1. Para variables cuantitativas, las tablas de frecuencia se pueden agrupar en clases. Esto permite organizar los datos y observar cómo se distribuyen.

6.1.1. Ejemplo

6.1.1.1. Se tienen las alturas de 20 personas (en cm): Datos: 150, 155, 158, 160, 161, 162, 163, 165, 167, 170, 172, 173, 174, 175, 177, 178, 180, 182, 183, 185. Tabla de Frecuencia Agrupada: Rango de Altura (cm) | Frecuencia 150-159 3 160-169 6 170-179 7 180-189 4

7. Presentación Gráfica para Variable Cuantitativa

7.1. Gráficos para representar datos cuantitativos: histogramas, polígonos de frecuencia, y diagramas de caja.

7.1.1. Histograma

7.1.1.1. Representa la frecuencia de los datos en intervalos continuos mediante barras.

7.1.1.1.1. .

7.1.2. Polígono de Frecuencia

7.1.2.1. Conecta los puntos medios de los intervalos en un histograma mediante líneas.

7.1.2.1.1. .

7.1.3. Diagrama de Caja

7.1.3.1. Representa la mediana, cuartiles y valores extremos, mostrando la dispersión y posibles valores atípicos.

7.1.3.1.1. .

8. Medidas de Tendencia Central, Posición y Dispersión (Serie Simple):

8.1. Análisis de medidas de tendencia central (media, mediana, moda), de posición (cuartiles, percentiles) y de dispersión (varianza, desviación estándar, rango).

8.1.1. Dispersión:

8.1.1.1. Rango: Diferencia entre el valor máximo y el mínimo. Ejemplo: En las alturas, el rango es: 185−150=35 cm Varianza y Desviación Estándar: La varianza es la media de las diferencias al cuadrado respecto a la media, y la desviación estándar es la raíz cuadrada de la varianza.

8.1.1.1.1. Media

8.1.1.1.2. Mediana

8.1.1.1.3. Moda

9. Regresión Lineal Simple:

9.1. Método para modelar la relación entre dos variables cuantitativas mediante una línea recta.

9.1.1. 𝑌=𝛽0+𝛽 1*𝑋 Donde 𝛽0 es el intercepto y 𝛽1 es la pendiente.

9.1.1.1. Ejemplo

9.1.1.1.1. Si queremos predecir el peso (𝑌) en función de la altura (𝑋), el modelo puede ser: 𝑃𝑒𝑠𝑜=50+0.5×𝐴𝑙𝑡𝑢𝑟𝑎 Esto indica que por cada cm adicional en altura, el peso aumenta en 0.5 kg.

10. Correlación Lineal Simple

10.1. Medida que cuantifica la fuerza y dirección de la relación entre dos variables. Implica el cálculo e interpretación del coeficiente de correlación.

10.1.1. r=∑(Xi−X)2(Yi​−Y)//ˉ ∑(Xi​−X)(Yi​−Y) ​Si 𝑟=1 hay correlación positiva perfecta. Si 𝑟=−1 hay correlación negativa perfecta. Si 𝑟=0 no hay correlación. Si la correlación entre altura y peso es 𝑟 =0.85 indica una fuerte relación positiva.

10.1.2. El signo positivo o negativo indica el tipo de relación entre las variables; si es positivo significa que al aumentar la variable independiente también lo hace la dependiente; y si es negativo, al aumentar la variable independiente, la dependiente disminuye.

11. Teoría de Probabilidad

11.1. Principios y reglas básicas de la probabilidad en la toma de decisiones estadísticas.

11.1.1. Es la medida de incertidumbre. Para un evento (A) se define como: P(A)= Número de resultados favorables/Número total de resultados posibles.

11.1.1.1. Probabilidad de un evento

11.1.1.1.1. Probabilidad marginal o general: Es la probabilidad de un único evento, calculada como el número de veces que ocurre el evento de interés sobre el total de casos posibles. Ejemplo: La probabilidad de que un paciente haya sido atendido por quemaduras de grado I es 50/ 105 = 0.4762, es decir, 47.62%

11.1.1.1.2. Probabilidad conjunta: Es la probabilidad de que dos eventos ocurran al mismo tiempo, calculada como el número de veces que ocurren ambos eventos sobre el total de casos. Ejemplo: La probabilidad de que un adolescente haya sido tratado por quemaduras de grado I es 22/105=0.21, es decir, 21%

11.1.1.1.3. Probabilidad de dos eventos mutuamente excluyentes: Es la probabilidad de que ocurra uno u otro de dos eventos que no pueden suceder simultáneamente, sumando las probabilidades marginales de ambos eventos. Ejemplo: La probabilidad de elegir a un joven o a un adulto es 0.1333+0.1619=0.2952, es decir, 29.52%

11.1.1.1.4. Probabilidad de dos eventos no mutuamente excluyentes: Es la probabilidad de que ocurra uno u otro de dos eventos que pueden suceder simultáneamente, sumando las probabilidades marginales de ambos eventos y restando la probabilidad conjunta. Ejemplo: La probabilidad de elegir a un niño o a un paciente tratado por quemaduras de grado II es 0.5143−0.0286=0.4857, es decir, 48.57%

11.1.1.1.5. Probabilidad condicional: Es la probabilidad de que ocurra un evento dado que ya ha ocurrido otro, calculada como el número de veces que ocurren ambos eventos sobre el total del evento condicionante. Ejemplo: La probabilidad de que un anciano haya sido atendido por quemaduras de grado III es 2/25=0.08, es decir, 8%

11.1.1.1.6. Probabilidad de dos eventos independientes: Dos eventos son independientes si la ocurrencia de uno no afecta la probabilidad del otro. Esto se verifica si la probabilidad marginal y la probabilidad condicional son iguales. Ejemplo: Los eventos "ser hombre" y "tener grupo sanguíneo O" son independientes porque 𝑃 (ℎ𝑜𝑚𝑏𝑟𝑒)=0.5 y 𝑃 (ℎ𝑜𝑚𝑏 𝑟𝑒/𝑔𝑟𝑢𝑝𝑜 𝑂) = 0.5

12. Aplicación de Distribución Normal:

12.1. La distribución normal es una curva simétrica en forma de campana. Está definida por su media 𝜇 y su desviación estándar 𝜎.

12.1.1. Ejemplo

12.1.1.1. Si las alturas siguen una distribución normal con media 170 cm y desviación estándar de 10 cm, podemos calcular la probabilidad de que una persona mida más de 180 cm usando la tabla Z.

12.2. Fórmula: 𝑍=𝑥−𝜇 / 𝜎 Uso: Permite comparar valores con la tabla estándar de distribución normal.

12.2.1. Se utiliza para trabajar variables cuantitativas continuas, pueden asumir cualquier valor entre dos valores dados. Por consiguiente, entre dos valores cualesquiera, de la variable continua existe un número infinito de valores.

12.3. Características:

12.3.1. 1. Es simétrica respecto a su media (μ). 2. La media, la mediana y la moda son todas iguales. 3. Es asintótica 4. EI área total bajo la curva sobre el eje de las X es una unidad de área.

13. Introducción al Muestreo

13.1. El muestreo es la técnica que se emplea para seleccionar una muestra a partir de una población. De cualquier población finita de tamaño N, es posible extraer un número de muestras diferentes de tamaño n, siempre que N sea lo suficientemente grande comopara permitir el muestreo. Las poblaciones pequeñas, por razones obvias, no son muestreadas; en lugar de ello, se examina la población completa.

13.1.1. Muestreo no probabilistico

13.1.1.1. La selección de la muestra no sigue un criterio de aleatoriedad, sino que depende de factores subjetivos, como las características de interés para el investigador. Esto lo hace menos representativo y menos confiable estadísticamente.

13.1.1.1.1. Ejemplo: Un investigador decide encuestar a las primeras 10 personas que llegan a la clínica, porque es más fácil y rápido. Aquí, la selección no es aleatoria, sino basada en la conveniencia del investigador.

13.1.2. Muestreo probabilistico

13.1.2.1. La selección de los elementos de la muestra se realiza de manera aleatoria, asegurando que todos los elementos de la población tengan una probabilidad conocida y no nula de ser seleccionados. Esto garantiza que la muestra sea representativa de la población​.

13.1.2.1.1. Ejemplo : En una clínica con 100 pacientes, se desea seleccionar 10 de ellos para un estudio. Usando una lista numerada de los pacientes, se eligen 10 números al azar con un generador de números aleatorios. Así, cada paciente tiene la misma probabilidad de ser seleccionado.

13.1.3. Muestreo con reemplazo

13.1.3.1. Cada vez que un elemento es seleccionado, se devuelve a la población para que pueda ser elegido nuevamente en la misma muestra. Esto permite que el mismo elemento aparezca varias veces, lo cual es útil cuando se quiere mantener la independencia entre las selecciones​, con formula (𝑁^n).

13.1.3.1.1. .

13.1.4. Muestreo sin reemplazo:

13.1.4.1. En este método, una vez que un elemento es seleccionado, se retira de la población y no puede ser elegido nuevamente. Esto garantiza que cada elemento solo aparece una vez en la muestra, lo que es común en investigaciones donde no se puede repetir un mismo sujeto​, con formula (NCn).

13.1.4.1.1. .

14. Estimación para una Media con (Z):

14.1. Método estadístico que calcula un intervalo de confianza para la media poblacional usando la media muestral y la desviación estándar poblacional, ajustado con un valor Z según el nivel de confianza deseado. Proporciona un rango en el que se espera que esté la verdadera media de la población.

14.1.1. Formula : X±Z⋅(σ/√n ) Ejemplo :supongamos que en un estudio se obtiene una media muestral (X) de 50 con una desviación estándar poblacional (σ) de 10, y se utiliza un tamaño de muestra (n) de 30. Para un nivel de confianza del 95%, el valor Z es aproximadamente1.96, introduciendo todo esto a la formula dada tanto para el intervalo menor como el mayor y esto nos da como resultado que El intervalo de confianza es aproximadamente 46.42 a 53.58.

15. Estimación para una Media con (t):

15.1. Método estadístico que calcula un intervalo de confianza para la media poblacional utilizando la media muestral y la desviación estándar muestral, ajustado con un valor t de la distribución t de Student. Es útil cuando la desviación estándar poblacional no es conocida, especialmente en muestras pequeñas.

15.1.1. Formula : X±t⋅(s/√n ) Ejemplo: Supongamos que se realiza un estudio con una muestra de 25 personas, y se obtiene una media muestral (X) de 100 y una desviación estándar muestral (s) de 15. Para un nivel de confianza del 95% con 24 grados de libertad, el valor t es aproximadamente 2.064. El intervalo de confianza es aproximadamente 93.81 a 106.19. Esto indica que, con un 95% de confianza, la verdadera media poblacional está entre esos valores.

16. Tamaño de Muestra para una Proporción:

16.1. Se estima el tamaño de la muestra para una proprción cuado la variable es cualitativa

16.1.1. Cuando el muestreo es con reemplazo, la población es finita o cuando la población no es sufucientemente grande para aplicar el factor finito de correción. se utiliza. 𝑛=𝑍^2pq/d^2

16.1.1.1. Ejemplo: Para estimar una proporción con 𝑝 =0.50, un margen de error de 0.05, y un nivel de confianza del 95%: 𝑛=(1.96)^2×0.50(1−0.50)/0.05^2= 384.16 Se necesitaría una muestra de 385 personas.

16.1.2. Cuando se siguen los mismo criterios anteriores pero no puede descartarse la población finita para n se utiliza: n=NZ^2pq/d^2(N-1)+z^2pq

16.1.2.1. De una población de 1,500 estudiantes se desea extraer una muestra para estimar el porcentaje de los que practican algún deporte, si se utiliza una confianza del 95%, un error del 5% y se sabe que en poblaciones similares la proporción es del 32%. ¿De qué tamaño debería ser la muestra? Aplicando la formula n= 1500(1.96)^2(0.32)(0.68)/(0.05)^2(1500-1)+(1.96)^2(0.32)(0.68) n=273.57 se aproxima al inmediato superior 274.

17. Prueba de Hipótesis para una Media (Z):

17.1. Es un procedimiento estadístico que se utiliza para determinar si la media de una población es significativamente diferente de un valor hipotético. Se compara la media muestral con el valor hipotético utilizando la distribución normal estándar (Z), asumiendo que la desviación estándar poblacional es conocida. El resultado indica si se debe rechazar o no la hipótesis nula.

17.1.1. 1. Datos Primero, identifica la naturaleza de tus datos. Si trabajas con variables cuantitativas, como el promedio, utilizas la media aritmética. Si trabajas con variables cualitativas, trabajas con proporciones o porcentajes. 2. Planteamiento de las Hipótesis Plantea dos hipótesis: Hipótesis nula (Ho): es la que se somete a prueba y generalmente representa la ausencia de efecto o diferencia. Hipótesis alternativa (HA): es la que indica una diferencia o efecto. Se plantea en oposición a la Ho. 3.Regla de Decisión Aquí defines la región de rechazo, que depende del nivel de significancia (α). Utiliza la distribución normal (Z) o la distribución t de Student, dependiendo del tamaño de la muestra y de si se conoce la desviación estándar. 4. Cálculo del Estadístico de Prueba Calcula el estadístico de prueba, que puede ser Z√ Z=​x−μ/σ/√ n ​ 5.Decisión Compara el valor calculado del estadístico con la regla de decisión. Si el estadístico cae en la región de rechazo, rechazas la Ho. Si no, no la rechazas. 6. Conclusión Si rechazas Ho, la conclusión estará alineada con HA. Si no rechazas Ho, concluyes que no hay suficiente evidencia para rechazarla.

17.1.2. Ejemplo: Si la media teórica es 𝜇o =50, y una muestra de 100 personas da 𝑋=5 con 𝜎= 10, el valor de 𝑍 sería: 𝑍=52−50/(10/√ 100)=2.0 Dependiendo del valor crítico, se rechaza o no la hipótesis nula.

18. Prueba de Hipótesis para una Proporción:

18.1. Un estudiante de Ejercicio Profesional Supervisado (EPS), de la Facultad de Ciencias Médicas, de la Universidad de San Carlos de Guatemala, asignado al Centro de Salud de un municipio del Departamento de Chiquimula, considera que más del 65% de los niños en edad preescolar, habitantes de esa localidad, no tienen un estado nutricional adecuado. Para la investigación, el estudiante tomó a 360 niños, encontrando que 249 no tienen el estado nutricional adecuado. Con una significancia del10%, indique si el estudiante está en lo correcto.

18.1.1. Paso 1

18.1.1.1. Para determinar la proporción de niños con la característica de interés, (niños con desnutrición), se realiza el siguiente cálculo: x=Variable de interés n=Tamaño de la muestra α=0.10: Donde: p =x/n=249/360=0.69166=0.69 p=Proporción de la muestra=0.69 po= Proporción supuesta de la población=0.65 qo=1-p=1-0.65=0.35 n=Tamaño de la muestra=360

18.1.1.1.1. paso 2

18.2. Los pasos a seguir para la prueba de hipotesis son:

18.2.1. Datos Obtener los datos del problema

18.2.2. Planteamiento de hipotesis: cosiderar y poner atención acerca de lo que pide el enunciado, si HA siene un signo desigual significa que la prueba es bilateral, si HA es < quiere decir que es unilateral izquierda y si HA es > significa que la prueba es bilateral derecha

18.2.3. Regla de decisión a partir de Z calculada se determina si se rechaza Ho dependiendo del tipo de prueba, es decir si es bilateral o unilateral

18.2.4. Estadísticco de prueba z = (p - p₀) / √[(p₀ * q₀) / n]

18.2.5. Desición Apartir de los datos calculados se decide a partir de la regla de decisión si se rechaza o no la Ho

18.2.6. Conclusión

19. Prueba de Hipótesis con Distribución Ji Cuadrado:

19.1. Se usa para probar la independencia entre dos variables categóricas. El estadístico ji cuadrado es: 𝜒^2=∑((0-E)^2/E) Donde 0 son los valores observados y E son los valores esperados bajo la independencia.

19.1.1. Ejemplo: Si se observa que 60 personas prefieren un producto y se esperaban 50, el valor 𝜒^2 puede calcularse para verificar si la preferencia es significativa.

19.1.2. Propiedades de la distribución: 1. No toma valores negativos, sólo cero o positivos 2. No es Simétrica, está sesgada hacia la derecha 3. Todas las pruebas se hacen solo de un extremo, el derecho 4. El área bajo la curva es igual a uno o el cien por ciento de los casos 5. Utiliza grados de libertad,

20. Tamaño de Muestra para una Media:

20.1. Para calcular tamaño de muestra necesario para estimar una media con un margen de error 𝐸 se calcula se utilizan dos ecuaciones:

20.1.1. Cuando el muestreo se hace sin reemplazos a partir de una población finita y pequeña, se requiere de la corrección por población finita n = (N * z^2 * σ^2) / (d^2 * (N - 1) + z^2 * σ^2)

20.1.1.1. Una investigadora desea realizar un estudio sobre el consumo de frutas en una pequeña comunidad que tiene 500 habitantes. Ella quiere asegurarse de que su muestra sea representativa y ha estimado que la desviación estándar de la cantidad de frutas consumidas semanalmente por persona es de 3 kg. La investigadora quiere un nivel de confianza del 95%, que corresponde a un valor z de 1.96. Además, ella ha decidido que el margen de error permitido es de 0.5 kg.

20.1.1.1.1. n= (500 * 1.96^2 * 3^2) / (0.5^2 * (500 - 1) +1.96^2 * 3^2) n=109

20.1.2. si el muestreo va a ser con reemplazos, a partir de una población infinita o de una que sea lo suficientemente grande como para ignorar la corrección por población finita se utiliza n=Z^2 σ^2/d^2

20.1.2.1. Una investigadora quiere realizar un estudio sobre el consumo de frutas en una ciudad grande, suponiendo que la población es muy grande. Ha estimado que la desviación estándar del consumo de frutas por persona es de 3 kg. Quiere un nivel de confianza del 95%, lo que corresponde a un valor de Z de 1.96. Además, ha decidido que el margen de error permitido será de 0.5 kg.

20.1.2.1.1. n = (1.96^2 * 3^2) / 0.5^2 n=138

21. Estimación para una Proporción

21.1. Cuando se busca estimar una proporción poblacional 𝑝, se calcula un intervalo de confianza para la proporción.

21.1.1. Ejemplo: Si en una encuesta 60 de 100 personas prefieren el producto A, entonces 𝑝 =0.60. Para un intervalo de confianza del 95%. aplicando formula IC = 0.60 ± 1.96 ⋅ √[0.60(1 − 0.60) / 100 El intervalo sería de 0.504 a 0.696.

21.2. Algunas consideraciones si se cuenta con una tamaño de la población N se determina si se utiliza o no le factor de corrección, se aplica cuando n/N>0.05

21.2.1. Las ecuaciones son IC = p̂ ± z(1 - α/2) * √[p̂(1 - p̂) / n] y si se apica factor finito se agrega √(N-n/N-1)