23
SEMINARIO 7 Análisis bivariado con variables cualitativas (proporciones). Grupo 14 Noelia Marmesat Espejo

Seminario 7 blog

Embed Size (px)

Citation preview

Page 1: Seminario 7 blog

SEMINARIO 7

Análisis bivariado con variables cualitativas (proporciones).

Grupo 14Noelia Marmesat Espejo

Page 2: Seminario 7 blog

EJERCICIO 1

Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:De las 250 mujeres fumadoras, 43 tienen un niño con

bajo peso al nacer.De las 1750 mujeres no fumadoras, 105 tienen un niño

con bajo peso al nacer.

Page 3: Seminario 7 blog

1. Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes

V1= mujeresV2= niños

Col 1= bajo peso

Col 2= peso normal

Total

Fil 1= fumadoras

43 207 250

F1 % 17’2% 82’2% 100%

Fil 2= No fumadoras

105 1645 1750

F2 % 6% 94% 100%

Total 148 1852 2000

Total % 7’4% 92’6% 100%

Page 4: Seminario 7 blog

2. Establece una hipótesis adecuada para el estudio.

Una posible hipótesis podría ser: ¿Existe asociación entre el consumo de tabaco en embarazadas y el nacimiento

de niños con bajo peso?

• Ho: no existe asociación entre el consumo de tabaco en embarazadas y el nacimiento de niños con bajo peso. Las variables son independientes, no dependen una de otra, no están relacionadas.

• H1: sí existe asociación entre el consumo de tabaco en embarazadas y el nacimiento de niños con bajo peso. Las variables son dependientes, una depende de la otra, están relacionadas.

Page 5: Seminario 7 blog

3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis.

Las frecuencias observadas o reales son los datos que aparecen en la tabla. “n” es el total, es decir, la población total.

a = 43 ; b =207 ; c =105 ; d = 1645 n = 2000 Para poder calcular chi-cuadrado, primero tenemos que calcular las

frecuencias esperadas o teóricas:

Page 6: Seminario 7 blog

X² observada o real= 40’044 Procederemos a calcular el valor de X² teórica. Para ello, tendremos

que calcular primero el grado de libertad, que cuando hay 2 criterios de clasificación se calcula de la siguiente forma:

Grado de libertad= (nº filas - 1) * (nº columnas - 1)Grado de libertad = (2 filas – 1) * (2 columnas - 1) = 1 grado de

libertad

Page 7: Seminario 7 blog

Teniendo en cuenta que el grado de libertad es 1 y el p valor es 0’05, miramos en la tabla el valor que le corresponde a X² teórica según el grado de libertad y el p valor.

X² teórica o esperada = 3’8415 Si X² real > X² teórica, no se acepta la Ho. Las variables serían

dependientes. Si X² real ≤ X² teórica, se acepta la Ho. Las variables serian

independientes. En este caso, X² real > X² teórica, por lo tanto , rechazamos la Ho.

Page 8: Seminario 7 blog

Conclusión

Dado que la X² real > X² teórica, se rechaza la hipótesis nula (Ho) y, por tanto, se acepta la hipótesis alternativa (H1).Esto implica que:Las variables son dependientes.Las variables están relacionadas.Una variable se comporta en función de la otra.En este caso, diríamos que existe asociación entre el consumo de tabaco en embarazadas y el nacimiento de niños con bajo peso.

Page 9: Seminario 7 blog

4. Calcula la Odds Ratio.

A continuación procederemos a calcular la Odds ratio para cuantificar el grado de asociación existente entre las dos variables:

o

Un valor de OR>1 quiere decir que la presencia del factor de exposición (V1-F1) se asocia a mayor ocurrencia del evento (V2-Col2). Atendiendo al valor de OR que hemos obtenido podríamos decir que ser fumadora se asocia a una mayor aparición de niños con bajo peso.

Page 10: Seminario 7 blog

5. Repite el ejercicio con R Commander ¿Los resultados son los mismos?Paso 1: Seleccionamos la opción “Estadísticos”, posteriormente “Tablas de contingencias”, y por

último “Introducir y analizar una tabla de doble entrada”

Page 11: Seminario 7 blog

Paso 2: Rellenamos los espacios de la tabla 2x2 con los datos correspondientes.

Page 12: Seminario 7 blog

Paso 3: Seleccionamos la pestaña “Estadísticos”, y marcamos todas las opciones que nos interesen, dependiendo de los resultados que queramos ver. Hacemos clic sobre “Aceptar”.

Page 13: Seminario 7 blog

Paso 4: Tras realizar esto, podemos visualizar los siguiente resultados en la pantalla de R commander:

Tabla de contingencia Resultados de Chi-cuadrado.

Frecuencias esperadas

Porcentajes

Resultado de la Odds ratio

Test de Fisher

Page 14: Seminario 7 blog

Conclusión

Los resultados de la Chi-cuadrado y la Odds ratio obtenidos mediante

cálculos realizados a manos, y los resultados obtenidos realizados por el

programa R, coinciden.

Page 15: Seminario 7 blog

EJERCICIO 2

Siguiendo todos los pasos anteriores establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:

• Practicadeporte (Sí, No).• Fruta: 1- “Nunca o casi nunca”, 2- “Menos de

una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”.

Page 16: Seminario 7 blog

Paso 1: Primero tendremos que seleccionar la pestaña “Datos” y posteriormente, “Cargar conjunto de datos”.

Page 17: Seminario 7 blog

Paso 2: Posteriormente seleccionamos el archivo que queremos cargar en R, en este caso “activossalud” y posteriormente hacemos clic sobre “Abrir”.

Page 18: Seminario 7 blog

Paso 3: Una vez cargado el archivo que deseamos seleccionamos en el margen superior de R commander la pestaña “Estadísticos”, posteriormente “Tablas de contingencias”, y por último, “Tabla

de doble entrada”.

Page 19: Seminario 7 blog

Paso 4: Posteriormente seleccionamos las variables que nos interesan son “sexo” y “fruta”. Hacemos clic en “Aceptar”.

Page 20: Seminario 7 blog

Paso 5: En la pantalla de R commander aparecen los siguientes resultados:

En este caso, p valor es mayor que 0’05, por lo que debemos rechazar la H1 y aceptar la Ho.Esto significa que podemos afirmar que no existe relación entre el sexo y el consumo de fruta, es decir, son variables independientes.

Page 21: Seminario 7 blog

Paso 6:A continuación relacionaremos la variable “sexo” con la variable “practicadeporte”. Realizamos la misma operación que antes, pero en este caso, seleccionaremos las dos nuevas variables que nos interesan.

Page 22: Seminario 7 blog

Paso 7: En la pantalla de R commander aparecerán los siguientes resultados:

En este caso, p valor es menor que 0’05, por lo que debemos rechazar la Ho y aceptar la H1.Esto significa afirmar que sí existe relación entre el sexo y la práctica de deporte, es decir son variables dependientes.

Page 23: Seminario 7 blog

¡HASTA PRONTO!