UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE AGRONOMÍA POSTGRADO EN ESTADÍSTICA

Preview:

DESCRIPTION

UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE AGRONOMÍA POSTGRADO EN ESTADÍSTICA. Distribuciones Normales. Bivariadas y Multivariadas. DISTRIBUCIONES MULTIVARIANTES . - PowerPoint PPT Presentation

Citation preview

UNIVERSIDAD CENTRAL DE VENEZUELAFACULTAD DE AGRONOMÍAPOSTGRADO EN ESTADÍSTICA

Distribuciones NormalesBivariadas y Multivariadas

DISTRIBUCIONES MULTIVARIANTES

Cuando hay más de una variable aleatoria presente (es decir, hay dos o más), siempre está la posibilidad de que de alguna manera estén relacionadas. Por eso se trabaja con su función de distribución conjunta (y su función de densidad conjunta, continua o discreta).

DISTRIBUCIONES MULTIVARIANTES

Se habla en ese caso de un vector aleatorio (lo anotaremos aquí X), distribuido según una función de distribución FX que ahora toma sus valores en n (donde n es la cantidad de variables). Habrá, como antes en el caso unidimensional, una función de densidad fX, que verificará:

Para el caso continuo:

Y para el discreto:

A

nn dxdxdxxxxfAXP 1121 ),,,()(

Axxx

nn

xxxfAXP),,,(

2121

),,,( )(

DISTRIBUCION NORMAL BIVARIADA

Sea ( X, Y ) una variable bidimensional continua que toma todos los valores en el plano euclidiano. Decimos que ( X, Y ) tiene distribución normal bivariada si su función conjunta está dada por:

yx

para

yyxxyxf

y

y

yx

yx

x

x

yx

22

222.

121exp

12

1,

DISTRIBUCION NORMAL BIVARIADA

La función generadora de momentos de la distribución normal es:

Y los momento pueden ser hallados calculando las derivadas de m(t1, t2) en t1=0, t2=0. Así, pues

DISTRIBUCION NORMAL BIVARIADA Y, por tanto la varianza de x es,

Análogamente derivando respecto a t2, se halla la media y la varianza de y, que son Se obtienen también los momentos mixtos

Derivando m(t1,t2) r veces respecto a t1 y s veces respecto a t2, y haciendo a continuación t1 y t2 iguales a cero. La covarianza de x y y es:

DISTRIBUCION NORMAL BIVARIADA

El parámetro es el coeficiente de correlación entre las variables X e Y :

yx

yx

yx

YXEYXCov

.,

DISTRIBUCION NORMAL BIVARIADA

DISTRIBUCION NORMAL BIVARIADA

Si = 0, entonces X e Y son independientes, o sea:

Ahora, el valor medio de una variante en una distribución condicional recibe el nombre de regresión cuando se considera como función de las variantes fijadas en la distribución condicional.

22

.21exp

.21,

y

y

x

x

yx

yxyxf

DISTRIBUCION NORMAL BIVARIADA

Así, la regresión para x es:

Que en este caso es una función lineal de y. Para distribuciones bivariantes en general, la media de x en la distribución condicional de x, dado y=y, será cierta función g(y) y la ecuación x=g(y).

Representada en el plano x,y da la curva para x. Se trata de una curva que da la situación de la media de x para los diversos valores de de y en la densidad condicional de x dado y.

DISTRIBUCION NORMAL BIVARIADA

Para la distribución normal bivariante, la curva de de regresión es la recta obtenida representando:

Figura 1. Curva de de regresión para distribución normal bivariante, y la función de densidad condicional de x para los valores particulares y0 y y1, de y.

DISTRIBUCION NORMAL BIVARIADA

Ejemplo: Dos elementos (X,Y) se distribuyen como N (,), siendo :

Al analizar un elemento se observa que contiene 6 gramos de X. - ¿Cuál es el valor más probable de Y?

28.08.01

64

DISTRIBUCION NORMAL BIVARIADA

Primero sacamos 1 y 2 (sacándole raíz a los elementos de la diagonal), y luego con eso obtenemos .

La respuesta consiste en encontrar: 6xyE /

676 11

22 ,)(/

xxyE

72216 222 ,)(/ xyV

A) Variables independientes B) Variables dependientes

DISTRIBUCION NORMAL BIVARIADA

Ejemplos de correlación nula

DISTRIBUCION NORMAL BIVARIADA

Ejemplos de correlación lineal positiva: cercano a 1

DISTRIBUCION NORMAL BIVARIADA

Ejemplos de correlación lineal negativa: acercándose progresivamente a -1

DISTRIBUCION NORMAL BIVARIADA

La mayoría de los métodos multivariados tradicionales dependen de vectores de datos que son muestras aleatorias provenientes de distribuciones normales multivariadas.

Entonces es importante comprender qué se requiere para que un vector de variables aleatorias como:

Sea multivariado normalmente distribuido

Distribución Normal Multivariada (K-Dimensional)

px

xx

x2

1

Se dice que un vector de variables aleatorias

Tiene una distribución normal multivariada si:

Tiene una distribución normal univariada para todos los conjuntos posibles de valores seleccionados para los elementos en el vector a.

Distribución Normal Multivariada (K-Dimensional)

px

xx

x2

1

p

p

x

xx

aaaxa

2

1

21'

Distribución Normal Multivariada (K-Dimensional)

La distribución Normal escalar tiene como función de densidad:

Y escribimos X N (, σ2) para expresar que x tiene distribución normal con media y varianza σ2.

Generalizando esta función, diremos que un vector x sigue una distribución Normal p-dimensional si su función de densidad es:

22)(

21

212\1 )()2(1)(

xexf

)()(

21

21\1

1

)2(1)(

xVx

p

T

eV

xf

Las propiedades principales son: Las distribución es simétrica alrededor de La simetría se comprueba sustituyendo en la densidad x por ±a y observando f(+a)= f( –a). La distribución tiene un único máximo en Al ser V definida positiva, el término del exponente

es siempre positivo, y la densidad f(x) será máxima cuando dicho término sea cero, lo que ocurre para x=. La media del vector aleatorio Normal es y su matriz de varianzas y

covarianzas es V.

Estas propiedades, que pueden demostrarse rigurosamente, se deducen al comparar las densidades univariante y multivariante.

Distribución Normal Multivariada (K-Dimensional)

)()(1

xVx

T

Si p variables aleatorias tienen distribución conjunta normal y están incorreladas son independientes.

La comprobación de esta propiedad consiste en tomar en la definición la matriz V diagonal y comprobar que entonces f(x)=f(x1),…, f(xp).

Cualquier vector x Normal p-dimensional con matriz V no singular puede convertirse mediante transformación lineal en un vector x normal p-dimensionales con vector de medias 0 y matriz de varianzas y covarianzas igual a la identidad (I). Llamaremos normal p-dimensional estándar a la densidad de Z, que vendrá dada por:

p

i

Z

p

VZZ

p

iT

eezf1

21

2\21

2\

2

)2(1

)2(1)(

(1)

Distribución Normal Multivariada (K-Dimensional)

La demostración de esta propiedad es como sigue: al ser V definida positiva existe una matriz cuadrada A simétrica que consideramos su raíz cuadrada y verifica:

V=AA

Definiendo una nueva variable: Z=A-1((x - ), entonces x=+AZ y la función de densidad de z es:

fz(Z)=fx(+AZ)|A| y utilizando AV-1A=I, se obtiene (1). Por tanto, cualquier vector de variable Normales X en Rp puede transformarse en otro vector Rp de variables normales independientes y de varianza unidad. Las distribuciones marginales son normales.

Si las variables son independientes la comprobación de esta propiedad es inmediata.

(2)

Distribución Normal Multivariada (K-Dimensional)

Cualquier sub conjunto de h<p variables es normal h-dimensional.Es una extensión de la propiedad anterior y se demuestra

análogamente.

Si y es (k x 1), k≤p, el vector y=Ax, donde A es una matriz (k x p), es normal k-dimensional. En particular, cualquier variable escalar y=ATx, (siendo AT un vector 1xp no nulo) tiene distribución normal.

Distribución Normal Multivariada (K-Dimensional)

Recommended