11
Análisis bivariado con variables cuantitativas. Normalidad y linealidad. Diagrama de dispersión. Coeficientes de correlación de Pearson y Rho de Spearman. Ana Bautista Garrote Grupo A, subgrupo 1 ENFERMERIA (Macarena)

Seminario 8

Embed Size (px)

Citation preview

Page 1: Seminario 8

Análisis bivariado con variables cuantitativas.

Normalidad y linealidad. Diagrama de dispersión. Coeficientes de correlación de Pearson y Rho de Spearman.

Ana Bautista GarroteGrupo A, subgrupo 1

ENFERMERIA (Macarena)

Page 2: Seminario 8

EJERCICIO

Determina si existe relación entre las variables altura y peso del fichero de datos

“activos en salud” y si existe determina cómo de fuerte

es.

Page 3: Seminario 8

-En primer lugar, debemos cargar el conjunto de datos de “Activos en salud” en R Commander.

-En segundo lugar comprobamos si las dos variables cuantitativas siguen o no una distribución normal:

Pearson: si sigue una distribución normal. Rho de Spearman: si no sigue una distribución normal.

Page 4: Seminario 8

A continuación observamos con un Diagrama de dispersión si existe algún tipo de relación entre las variables (peso y altura).

Descubrimos que no se puede apreciar con precisión ningún tipo de relación entre ambas por lo que vamos a proceder a realizar los coeficiente de correlación.

Page 5: Seminario 8

Primero vamos a estudiar si existe distribución normal en las variables (peso y altura)

Para ello, vamos a utilizar el Test de Shapiro Wilk, y pasamos a formular las dos hipótesis correspondientes: Hipótesis nula: la variable (peso o altura) sí sigue una distribución normal. Hipótesis alternativa: la variable (peso o altura) no sigue una distribución normal

Page 6: Seminario 8

Al realizar el Test de Shapiro Wilk obtenemos estos resultados:

VARIABLE PESO

Observamos que el p-valor es menor que 0,05, y sabiendo que el error que podíamos cometer es menor del que en un principio estábamos dispuestos a asumir….

…aceptamos la hipótesis alternativa: la variable no sigue una distribución normal

VARIABLE ALTURA

Page 7: Seminario 8

También nos disponemos de tres gráficos que nos ayudan a estudiar la normalidad.

1.-GRÁFICO Q-Q

VARIABLE PESOVARIABLE ALTURA

Se puede ver como no siguen una distribución normal

Page 8: Seminario 8

2.- BOX-PLOT

VARIABLE PESOVARIABLE ALTURA

No siguen distribución normal, puesto que no coinciden media, mediana y moda.

Page 9: Seminario 8

3.- HISTOGRAMA

VARIABLE PESOVARIABLE ALTURA

No siguen distribución normal porque las barras no son simétricas.

Page 10: Seminario 8

Para finalizar, al no seguir una distribución normal las variables, debemos utilizar el coeficiente de Test de Spearman.

Para ello, antes establecemos las dos hipótesis correspondientes: Hipótesis nula: Existe correlación entre peso y altura (Rho entre -1 y 1) Hipótesis alternativa: No existe correlación entre peso y altura (Rho=0)

Page 11: Seminario 8

RESULTADO:Vemos que Rho es distinto de 0. por lo que podemos decir según las hipótesis formuladas anteriormente, que aceptamos la hipótesis nula (existe correlación entre peso y altura).Se trata de una correlación positiva puesto que 0,622 está alejado del 0 y más cerca del 1.