48
TEORICA 4 TEORICA 4 Independencia Función de distribución empírica Histograma Autor Dr. Hernán Rey Ultima actualización: Agosto 2010 Truncamiento Media, Mediana, Moda Varianza

04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

TEORICA 4TEORICA 4

Independencia

Función de distribución empírica

Histograma

AutorDr. Hernán Rey

Ultima actualización: Agosto 2010

Truncamiento

Media, Mediana, Moda

Varianza

Page 2: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Como hemos visto, las densidades marginales están determinadas por la densidad conjunta. Suponga que se conocen las densidades marginales, es esto suficiente para especificar la densidad conjunta?

, ( , ) 1 0 1 0 1X Yf x y x y 1 1 , ( , ) 2 0 0.5 0 0.5

0.5 1 0.5 1

X Yf x y x y

x y

1 1

1 1

0.4

0.6

0.8

1

y

0.4

0.6

0.8

1

y

( ) 1 0 1Xf x x 1 ( ) 1 0 1Yf y y 1

Las marginales no tienen (en general) la informaciónsuficiente para especificar la densidad conjunta

0 0.2 0.4 0.6 0.8 1

0

0.2

x

0 0.2 0.4 0.6 0.8 1

0

0.2

x

Page 3: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

A partir de la definición de independencia de eventos, diremos que dos VAs son independientes cuando:

INDEPENDENCIA

, , ( , )X Y X Yf x y f x f y x y

Derivando la expresión anterior, obtenemos la condición equivalente para continuas:

, , ( , )X Y X YF x y F x F y x y

Y en el caso discreto: , , ( , )X Y X Yp x y p x p y x y

Teorema: Si X e Y son independientes, entonces el soporte de su conjunta es el producto cartesiano del soporte de sus marginales

Para probarlo, usaremos el teorema contrarecíproco.

Cuando las VAs son independientes, lasmarginales poseen la misma información

que la conjunta.

Y en el caso discreto: , , ( , )X Y X Yp x y p x p y x y

Page 4: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

y

Sea una conjunta definida en el soporte del problema visto antes:

Observando solamente este soporte podemos obtener algunas conclusiones.

1) La marginal de X será no nula para

0<X<1. Esto se debe a que para esos Xencontraremos algún Y donde ladensidad conjunta es no nula.

2) La marginal de Y será no nula para

0<Y<1. Esto se debe a que para esos Yencontraremos algún X donde la densidad

x

xencontraremos algún X donde la densidadconjunta es no nula.

3) Existen puntos en el cuadrado unitario donde la conjunta es nula.

En esos puntos se verifica que el producto de las marginales es no nulo.

X e Y NO SON INDEPENDIENTES

Se debe ser cuidadoso con la interpretación deeste teorema. Las variables pueden serindependientes con un soporte no rectangular.

(0,0)

Page 5: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

0.5

1

1.5

2

f XY(x

,y)

Imagine una conjunta definida en el rectángulo unitario con densidad uniforme. Es decir:

Se debe ser cuidadoso con la interpretación de este teorema. Si unaconjunta está definida en un soporte rectangular, las variable pueden noser independientes !!! Veamos un ejemplo.

Imagine ahora que toma un cubosólido de 0.5 de lado y lo coloca sobrela superficie centrado en (0.5,0.5).Luego lo hunde en la superficie hastaque quede “sumergido al ras”. Lanueva densidad es:

0

0.25

0.5

0.75

1

0

0.25

0.5

0.75

10

xy

0

0.25

0.5

0.75

1

0

0.25

0.5

0.75

10

0.5

1

1.5

2

x

y

f XY(x

,y)

El soporte de la nuevadensidad sigue siendoel cuadrado unitario.

Sin embargo, lasvariables NO SON

INDEPENDIENTES.

1

2

7

6

Page 6: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

FUNCION DE DISTRIBUCION EMPIRICA

Si se cuenta con n valores de una VA X, es posible obtener información sobre la forma de su función de distribución?

La respuesta es sí, y para ello se define a la función de distribución

empírica. Sea nx el número de veces que ocurre el evento X x en los

n valores observados de X, entonces

* xX

nF x

n

Como FX(x)=P(Xx), vemos que dicho valor es aproximado por la

frecuencia relativa de aparición del evento en los n valores observados.Veremos luego que cuando n, FX*(x)FX(x).

Si X es una VA discreta, las frecuencias relativas permiten aproximar las

probabilidades de cada evento elemental. Si nk es el número de veces que

ocurre el evento X=k en los n valores observados de X, la función deprobabilidad se aproxima por:

* kX

np k

n

Page 7: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

EJEMPLO

Se tienen n valores de una VA X con distribución exponencial deparámetro l=1. Hallar la función de distribución empírica y comparar conla analítica.

0.7

0.8

0.9

1

Fu

nció

n d

e d

istr

ibu

ció

n

Cada valorobservadointroduce enla distribución

0 1 2 3 4 5 60

0.1

0.2

0.3

0.4

0.5

0.6

x

Fu

nció

n d

e d

istr

ibu

ció

n

Real

Empírica (N=20)

Empírica (N=100)

Empírica (N=1000)

Empírica (N=10000)

la distribuciónempírica unamasa puntual

de 1/n.

Page 8: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

“FUNCION DE DENSIDAD EMPIRICA” (HISTOGRAMA)

Si se cuenta con n valores de una VA X continua, es posible obtenerinformación sobre la forma de su función de densidad?

Tengamos en cuenta que la FX*(x) SIEMPRE será escalonada porque

tendremos un número finito n de observaciones (si n es grande, losescalones son tan pequeños que la función parece continua). De modoque la idea de “derivar” la distribución empírica no parece ser muybuena. Sin embargo, recordemos que la utilidad de la densidad radica enpoder calcular la probabilidad en intervalos de la recta real.

Si tomamos una partición de la recta real en intervalos, podemosSi tomamos una partición de la recta real en intervalos, podemosaproximar las probabilidades de cada intervalo a través de las frecuencias

relativas en los n valores observados. Para un intervalo (a,b),

,

ba b

X

a

nP a X b f x dx

n Pero,

,b

X X

a

f x dx f a b b a Si tanto n como el número de intervalosson grandes, y cada intervalo es pequeño,se puede lograr una aproximaciónrazonable

Valor medio de fX(x)en el intervalo (a,b)

Page 9: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

EJEMPLORetomemos el ejemplo del Chevalier de Mere, donde estudiaba laaparición de al menos un 6 al tirar 4 dados legales. Vimos que la

frecuencia relativa en n repeticiones del experimento nos daba una

estimación (p*) del valor de la probabilidad del evento en cuestión (p). Sinembargo, vimos también que si reiterábamos esta rutina, aparecía un valor

p* distinto. Luego, p* presenta fluctuaciones que son de naturaleza

aleatoria, y entonces p* ES una VA.

Consideremos entonces que reiteramos la rutina L veces, obteniendo Lvalores p1*, p2*, …, pL* de la VA p*. Queremos ahora hacer un histogramavalores p1*, p2*, …, pL* de la VA p*. Queremos ahora hacer un histograma

para aproximar la densidad de dicha VA (en verdad, p* puede tomar nvalores distintos, pero si n es grande se aproxima bien con una continua).

Una vez que tenemos los L valores de p*, se buscan los extremos p*min y

p*max y se divide el intervalo (p*min,p*max) en M intervalos. Para el

intervalo Ij=(aj,bj), se calcula la frecuencia relativa lj /L asociada alevento XIj. Finalmente se computa la altura asociada al intervalo j (fj*)como

* 1,

jj X j j

j j

lf f a b

L b a

Esto se repite para todos

los intervalos Ij, con 1jM.

Page 10: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

n = 3000 L = 100000 En verde figura la densidad verdadera de p*En rojo está la curva que une los puntos medios de los intervalos (M)

0

10

20

30

40

50

Número de intervalos=10

0

10

20

30

40

50

Número de intervalos=25

0.5 0.52 0.540

0.5 0.52 0.540

0.5 0.52 0.540

10

20

30

40

50

Número de intervalos=50

0.5 0.52 0.540

10

20

30

40

50

Número de intervalos=100

Page 11: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

EJEMPLO (continuación)Retomando el ejemplo anterior de la distribución exponencial. Se

grafican en cada caso los valores fj* (en el centro de cada intervalo),

habiéndose usado M=20 intervalos.

1

1.2

1.4

Fu

nci

ón

de

de

nsi

da

d

Real

Empírica (N=20)

Empírica (N=100)Empírica (N=1000)

Empírica (N=10000)

0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 60

0.2

0.4

0.6

0.8

x

Fu

nci

ón

de

de

nsi

da

d

Page 12: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

VARIABLE ALEATORIA TRUNCADA

Sea X una VA cuya función de densidad fX(x) es conocida. X puederepresentar el peso de un cierto componente en gramos. Si seconsideran defectuosos a todos aquellos que pesen menos de 2.5gramos, la pregunta es cómo podemos describir a la variable querepresenta a los componentes no defectuosos.

Supongamos que usando la fX(x) original, se verifica que la probabilidadde que un componente pese entre 3 y 4 gramos es el doble de la de quepese entre 4 y 6 gramos. Según el criterio establecido, todos estospese entre 4 y 6 gramos. Según el criterio establecido, todos estoscomponentes son no defectuosas. Entonces, uno esperaría que larelación de probabilidades se mantenga en la nueva variable. Por otrolado, los valores menores a 2.5 gramos ya no son resultados posiblespara el peso de los componentes ya que estos son defectuosos.

La nueva variable que buscamos será la del peso de los componentes,condicionada a que dicho peso sea por lo menos de 2.5 gramos.Cuando una variable se “redefine” a través de una restricción de suespacio muestral, se la conoce como variable truncada.

Page 13: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

La función de densidad surge de derivar la expresión anterior.

2.5

2.5( ) 2.5

2.5X X

P X x XF x P X x X

P X

2.5

( ) (2.5 )( ) 2.5

2.5X X

X X

F x FF x x

P X

1

( )

( ) 2.5f x

f x x 1

Veamos cuanto vale la función de distribución de la VA condicionada:

0.6

Si x < 2.5, el numerador es nulo. Luego:

2.5

( )( ) 2.5

2.5X

X X

f xf x x

P X

1

Al ser proporcional a la densidadoriginal, la relación entre lasprobabilidades mencionada antes serámantenida. La constante deproporcionalidad es justamente la quepermite que la función de densidadtenga área unitaria sobre el nuevoespacio muestral condicionado. 0 1 2 3 4 5 6

0

0.1

0.2

0.3

0.4

0.5

0.6

x

Fu

nció

n d

e d

ensid

ad

fX(x)

fX|X>2.5

(x)

Page 14: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Si se quiere calcular en la truncada la probabilidad del evento B, puedeverse la consistencia con lo visto anteriormente, ya que:

De manera general, la función de densidad de la variable Xcondicionada a la ocurrencia del evento XA es nula para todos los x

que no pertenezcan a A, y en el resto de los casos vale:

( )( ) X

X X A

f xf x x A

P X A

1

( ) ( )

( ) Xf x P A BP B A f x dx dx

( ) ( )

( )( )

XX X A

B A B

f x P A BP B A f x dx dx

P A P A

El mismo principio se utiliza en más dimensiones. Por ejemplo, si C esun evento en R2, la variable X,Y condicionada a C es una truncada,

,

, ,

( , )( , ) ,

,

X Y

X Y X Y C

f x yf x y x y C

P X Y C

1

Page 15: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

EJEMPLO

0.5

fX(x)

fX|A

(x)

Notar que la conjunta X,Y|(X,Y)C, tiene asociada las

distribuciones marginales de X|(X,Y)C y X|(X,Y)C.

ESTAS NO PUEDEN PENSARSE COMO TRUNCADASDEL TIPO X|XC O Y|YC.

Sea fX(x) una función de densidad no nula para todo x real. Si a < b < c < d < e < f, halle fX|XA(x), siendo A = {(a<X<b) (c<X<d) (e<X<f)}.

Realice un esquema.

a b c d e f0

0.1

0.2

0.3

0.4

x

Fu

nci

ón d

e d

en

sida

d

( )X X Af x

( )Xf xx A

P X A

1

Page 16: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

y

A

Habíamos visto que P(A)=1/6. Entonces:

,

8( , )

16

1 0 0.5

X Y A

xyf x y

y x y y

1 1

, ( , ) 8 0 1 0X Yf x y xy x y x 1 1

Retomando el ejemplo donde A= “Y es menor o igual a 1-X”, hallar la

densidad “truncada” fX,Y|A(x,y) y sus marginales.

x

, 0( ) ( , ) 48 0 0.5

x

X A X Y Af x f x y dy xydy x

1

1

,( ) ( , ) 48 0 0.5y

Y A X Y Ay

f y f x y dx xydx y

1

EJERCICIO: Para el Ejercicio 1.36 de la Guía, definir una variable X,Ycon distribución apropiada. Hallar las densidades truncadas para

los eventos A y B. Analizar en cada caso la independencia de lasmarginales antes y después de truncar.

1

048 0.5 1

x

xydy x

1

Page 17: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Sin duda se trata de la medida más utilizada. También se la conoce comovalor medio o simplemente media. El rendimiento de un basquetbolista se

La función de distribución de probabilidad de una VA describe por completoa la variable. Sin embargo, en muchos casos podemos utilizar ciertasmedidas de la VA para describirla. Si bien dichos valores contienen menosinformación, pueden ser suficientes para resolver un determinado problema.Por otro lado, en situaciones prácticas suele ser mucho más simpleobtenerlos que buscar la función de distribución empírica.

ESPERANZA

valor medio o simplemente media. El rendimiento de un basquetbolista semide por su porcentaje medio de tiro; el diseño de una planta de energía sebasa en la demanda media mensual, etc.

Supongamos que tenemos una bolsa llena de bolillas numeradas.

Podemos definir una VA X que mapee los posibles valores de las bolillas yluego asociarle una distribución de probabilidad.

El valor medio de las bolillas surge de promediar el valor de todas lasbolillas. Ciertos valores aparecen más frecuentemente que otros, y esoestará reflejado en la distribución de probabilidad.

Page 18: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Por ello, en vez de promediar todos los valores que se encuentren en labolsa, podemos ponderar cada uno de los posibles valores por suprobabilidad asociada.Luego, se llega a la definición para VA discreta:

( )X Xx

E X x p x

En el caso de una VA continua, la idea se extiende a:

XE X x f x dx

Xx f x dx

La media no siempre existe. Es necesario que converja la integral:

LA MEDIA ES EL CENTROIDE DE LA DENSIDAD.Es el punto de donde “debe sostenerse” la

densidad para que se mantenga equilibradasin balancearse.

Page 19: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Moneda con probabilidad de cara igual a p

0 ( 0) 1 ( 1) E X P X P X p

Si se define una VA Bernoulli que vale 1 si xA y 0 en otro caso (es decir,

la función indicadora 1{XA}), la esperanza de dicha VA será entonces

p=P(XA).

Cabe destacar que p no pertenece al soporte de la VA, ya que los

EJEMPLOS

Cabe destacar que p no pertenece al soporte de la VA, ya que losposibles resultados son 0 ó 1. Al tratarse de un promedio ponderado porlas probabilidades, el valor de la esperanza no queda limitado a losposibles valores de la VA.

2 2 21 1 1

2 2 2

bb

a a

x b a b aE X x dx

b a b a b a

U(a,b)

Page 20: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Caso continuo

INTERPRETACION GEOMETRICA DE LA MEDIA

0 0

1 X XuF u du f x dxdu

0 0 0

x

X Xf x dudx xf x dx

0 0 u

F u du f x dxdu 0

0

x

u

0 X XF u du f x dxdu

0 0 0

X Xxf x dudx xf x dx

0

01X X XF u du F u du

0

0

x

u

Page 21: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

FX(x

)

0

01X X XF u du F u du

-2 -1 0 1 2 3 40

0.1

0.2

x

Si X>0 (VA positiva) => >0

Page 22: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Caso discreto

0

0

1 X Xn

F u du np n

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5

0.0313

0.1875

0.5

0.8125

0.96871

X

FX(x

)Análogamente

10

X Xn

F u du np n

Caso mixto

1

2 2P X

2 2Xp 1 1Xp 3 3Xp X Xn D

ug u du nP X n

-3 -2 -1 0 1 2 30

1/3

1/2

2/3

x

FX(x

)

2 2P X

2 2P X

0 Xug u du

0

Xug u du

n D

gX(x) es la derivada de la parte absolutamente

continua de FX(x), y D es el conjunto de todos los puntos que tienen probabilidad puntual positiva

Esta forma de cálculo es válida sin importar lanaturaleza de la VA (continua, discreta, mixta)

Page 23: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

m m

i i i iE a X a E Xm

PROPIEDADES

La esperanza es un operadorlineal (sin importar si las VAs

1 2

1 2 1 2

1 2 , , , 1 2 2 1

, , , , , ,

, , , , , ,m

m m

m X X X m m

W X X X E W E X X X

x x x f x x x dx dx dx

Por equivalencia de sucesos

E a a

Esperanza de una función

1 1

i i i ii i

E a X a E X

lineal (sin importar si las VAs

son independientes !!!).

(Monotonía) Si X Y y ambas tienen esperanza finita, entonces E(X) E(Y).

Sea X una VA y A1,A2,…,An una partición de R, con P(XAi)>0, i=1,…,n

1

|n

i ii

E X E X X A P X A

Aplicación de la esperanza de una función (“esperanza total”, versión light)

Page 24: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

i i XE X X A x x A f x dx 1 1Usando la propiedad,

Xi i

i

f xx x A P X A dx

P X A

1

P X A x f x dx |E X X A P X A

Prueba: Notar que 1

n

iiE X E X X A

1 X

Un vehículo debe recorrer una distancia de 500 km. Su velocidad media V(en km. por hr.) a lo largo del trayecto es una VA cuya densidad es:

/ 4000 80 120Vf v v v 1

EJEMPLO

Hallar la duración media del recorrido.

| ii X X AP X A x f x dx | i iE X X A P X A

Page 25: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Se quiere hallar E(T), donde 500=V·T. Luego, por linealidad

500T

V

500 1500E T E E

V V

m m

120

80

1 1 1 40 1

4000 4000 100V

vE f v dv dv

V v v

m

5 .E T hrs

Se desea hallar a de modo de minimizar la función Q(a).

Es interesante observar cómo podemos derivar la esperanza a partir deoptimizar la función de costo denominada error cuadrático medio:

2

Q a E X a

ˆ arg mina

a Q a

Page 26: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

MEDIANA

La mediana de una VA X, meX, es el valor (o los valores) que permiten acumular igual probabilidad a izquierda y a derecha de dicho valor. Es decir:

2 22 Q a E X E aX E a

2 2

dQ aE X a

da ˆ a E X

( ) 1 ( ) 0.5X X X XF me F me 1(0.5)X Xme F

Si la función de densidad/probabilidad es simétrica, la mediana coincide con la media.

Además, puede no existir, como en el caso de una moneda falsa.

MODO

El modo (o la moda) de una VA X, moX, es el valor (o los valores) donde la derivada de la función de distribución (o un salto en una discontinuidad) es máxima. En una VA continua, es donde se maximiza la densidad. En una discreta, es el valor de mayor probabilidad.

Page 27: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Las tres medidas que analizamos hasta ahora son de posición, ya que nosbrindan información sobre en qué parte de la recta real se encuentra ladistribución de la VA.

VARIANZA

La varianza es una medida de variabilidad. En particular, mide la dispersión de los valores de la VA respecto de su media. De allí, se define como:

22

X XVar X E X

Sin embargo, la varianza no tiene las mismas unidades que la VA. Por ello, suele utilizarse el desvío estándar :

2X X

Una varianza pequeña implica que la densidad estará concentrada cerca de la media. La varianza es un número no negativo.

Si la media no existe, la varianza tampoco.

Page 28: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

22 2 22

X X X XE X E X E X

Una expresión equivalente para el cálculo de la varianza es:

Veamos ahora si la varianza es un operador lineal. Para ello, sea Y=aX+b.

2 2 2 X XE X

222

Y Y X XE Y ax b a b f x dx

Momento de segundo orden

2 22 2 2

X X X X Xa x f x dx a x f x dx a

LA VARIANZA NO ES UN OPERADOR LINEAL.En particular, la varianza de X+c es igual a la

varianza de X. Esto tiene sentido ya que si todos

los valores de X son desplazados c, la dispersiónrespecto de la media no cambia.

Page 29: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

2 0 0 1E X P X

PROPIEDAD

COROLARIO 2 0 1 X XP X

PROPIEDAD

Si existe el momento de orden k+1, entonces existen todos los

momentos de orden menor a k+1.momentos de orden menor a k+1.

1 1

( ) ( ) ( )k k k

X X X

x x

x f x dx x f x dx x f x dx

( )k

Xx f x dx

<∞ porque |x|k≤1<∞ si existe el

momento de orden k+1

1

1

( )k

X

x

x f x dx

Page 30: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Moneda con probabilidad de cara igual a p

2 22 0 1 1

1 1 1

X p p p p

p p p p p p

U(a,b)

EJEMPLOS

3 3 3 2 2

2 2 1 1 1

3 3 3

bb

a a

x b a b a abE X x dx

b a b a b a

222 2

2 2 2

3 2 12

m

X X

b ab a ab b aE X

Mixta

1 2 2

22 2 2

12

11 1 1 1 12 2 4 2 4 6

X E X x dx

3 3 3 a a

b a b a b a

0X 1( ) 0.5 0.5

2Xg x x 1 1 1 12 2 4

P X P X

1 1

( ) 0.5 0.5 0.52 2

XF x x x xm

1 1

Page 31: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

BONUS TRACKSBONUS TRACKS

Page 32: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Para la distribución conjunta de X e Y dada por la siguiente tabla, hallar la probabilidad de que X sea positivo e Y no lo sea. Son X e Y independientes?

Y=-1 Y=0 Y=1 Y=2

X=-1 0 1/36 1/6 1/12

X=0 1/18 0 1/18 0

X=1 0 1/36 1/6 1/12

1 0P X Y

19

EJEMPLO

X=2 1/12 0 1/12 1/6

123Xp

1018Yp

, 2,0 0X Yp

NO SON INDEPENDIENTES

Page 33: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

En el caso de la estimación de la densidad mediante un histograma, cada una de las N observaciones de la VA aporta a la estimación de fen un valor x, una cantidad 1/N/li si x está en el i-esimo intervalo de

longitud li y 0 en caso contrario.

HISTOGRAMA O …

Existen otros métodos que plantean un enfoque diferente, en donde cada observación tendrá un aporte a la estimación de f en x que dependerá, por ejemplo, de la forma de una cierta “ventana” o kernel. Sus resultados pueden ser muy superiores a los de un histograma en ciertos casos. Para más detalle, buscar bibliografía sobre método de ventanas de Parzen o kernel density estimation.

Page 34: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Veamos ahora como obtener la mediana a partir de minimizar la siguiente función de costo:

El Teorema Fundamental del Cálculo dice:

J a E X a

a

X X X

a

J a x a f x dx a x f x dx x a f x dx

x

df t dt f x

arg min ea

a J a m X

d

f t dt f xdx

Luego, la derivada de J(a) respecto de a es:

( )( ) ( ) ( ) ( ) ( ) ( )

a

X X X X X X

a

dJ aaf a f x dx af a af a f x dx af a

da

Page 35: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Finalmente, haremos lo propio con la moda. Si optimizamos la siguiente función de costo (con pequeño):

, M a E L x a 0

,1

x aL x a

x a

e

e

1M a P X a

arg min arg maxa a

a M a P X a

oa m X

Esto implica que debemos ubicarnos en un valor de la VA que nos permita tener máxima probabilidad en un pequeño entorno del valor.

Page 36: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Hallar las constantes para que la media sea 0 y la varianza 1/15.

EJEMPLO

1

2

11ax bx c dx

1

2

10x ax bx c dx

1

2 2 115

x ax bx c dx

22 1

3a c

20

3b 0b

2 2 1

5 3 15a c

2 1 1Xf x ax bx c x 1

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1-0.5

0

0.5

1

x

1 15x ax bx c dx

5 3 15

a c

3

2a 1c

NO EXISTEN CONSTANTESQUE SATISFAGAN LO PEDIDO

231 1 1

2Xf x x x

m

1

Page 37: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

• Una urna contiene 5000 bolitas, de las cuales un número X son blancas y el resto rojas. X tiene una cierta distribución sobre los enteros de 0 a 5000. Asuma que conoce su media. Hallar la probabilidad de sacar una bola blanca.

5000

1i

iP X i

5000

1 5000x i

iP B P B x P X x P X i

5000

P B

• Se extraen dos bolas con reposición. Qué condiciones deben cumplirse

EJEMPLO

• Se extraen dos bolas con reposición. Qué condiciones deben cumplirse para que sean independientes, es decir, P(B1,B2)=P(B)2

25000

1 2 2 1 11

, ,5000x i

iP B B P B B x P B x P X x P X i

m

225000 5000

1 15000 5000i i

i iP X i P X i

m m

2

25000X 2

25000

E X

SOLO SERAN INDEPENDIENTES SI LA VARIANZA ES NULA,es decir, el número de blancas debe ser fijo y no aleatorio.

Page 38: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

En la ruleta de Las Vegas hay 38 posible resultados (1:36,0,00). Sólo 18 de esos son rojos. Si se juega muchas veces apostando $1 a rojo, cuál es la ganancia media?Sea X la ganancia en una tirada con una apuesta de $1. Su distribución es:

20 18

1 138 38

Xf x x x 1 1

20 18 1

1 138 38 19

X

Este juego es desfavorable. Si juego n veces, en promedio pierdo n/19 pesos.

EJEMPLO

38 38 19 pierdo n/19 pesos.

Si no estuvieran los ceros, luego la ganancia media de cada tiro es 0, y se considera un juego justo (si lo juego muchas veces, salgo hecho).

Si se juega a pleno y se gana, se devuelve 36 veces la apuesta; si no, pierde la apuesta. Si se apuesta $1, la ganancia se distribuye según:

37 1

1 3538 38

Xf x x x 1 11

19X

EN LAS VEGAS, CASI TODAS LA APUESTASTIENEN LA MISMA GANANCIA MEDIA

Page 39: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

En la ruleta de Monte Carlo sólo hay un 0. Si se juega a color y sale el 0, hay diferentes opciones dependiendo del casino.

a) Se reparten la apuesta a medias con el casino.

b) La apuesta se coloca “en prisión” (P1). Si en el siguiente tiro sale rojo, recupera la apuesta (pero no gana dinero); si no la pierde.

c) La apuesta se coloca “en prisión” (P1). Si en el siguiente tiro sale rojo, recupera la apuesta (pero no gana dinero). Si sale negro, la pierde. Si sale 0, se mueve a otra prisión (P2). Si en el siguiente tiro sale rojo, la apuesta se mueve a P1, y se sigue como en b). Si no, se pierde la apuesta.

EJEMPLO

1 x P perder apuesta en P

6870.0137

49987

se mueve a P1, y se sigue como en b). Si no, se pierde la apuesta.

Calculemos la c). La única forma de ganar la apuesta (digamos de $1) es si sale rojo al principio. Esto sucede con p=18/37. Vemos ahora cuándo se pierde. Definamos:

218 1

37 37x P perder apuesta en P 19 18

37 37x

6851351

x 18 25003137 37 49987

P perder x

Page 40: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Si bien la opción c) parece más romántica quelas otras, la a) tiene un ganancia media de

-1/74 (≈0.0135) y la b) de -19/1369 (≈0.0139).O sea, la a) es mejor que la c).O sea, la a) es mejor que la c).

Page 41: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

En un examen de multiple choice, cada problema tiene 4 opciones y sólo 1 es correcta. El alumno puede elegir un subconjunto de las 4 y si contiene a la opción correcta, recibe 3 puntos, pero pierde 1 punto por cada opción incorrecta dentro del subconjunto. Mostrar que si elige un posible subconjunto al azar, su puntaje esperado es 0.

EJEMPLO

subconjuntos con las 4 opciones (total 1)

(3 3)Puntaje 1 subconjunto tiene la opción correcta

subconjuntos con 3 opciones (total 4)

(3 2)Puntaje (3 2)Puntaje 3 subconjuntos tienen la opción correcta

subconjuntos con 2 opciones (total 6)

(3 1)Puntaje 3 subconjuntos tienen la opción correcta

(0 3)Puntaje 1 subconjunto no tiene la opción correcta

(0 2)Puntaje 3 subconjuntos no tienen la opción correcta

subconjuntos con 1 opción (total 4)

(3 0)Puntaje 1 subconjunto tiene la opción correcta

(0 1)Puntaje 3 subconjuntos no tienen la opción correcta

Page 42: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

1 3 1 33 3 3 2 0 3 3 1

1 4 4 6

3 1 30 2 3 0 0 1 0

3 1 3

0 2 3 0 0 1 06 4 4

Page 43: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

EJEMPLOS

• Hallar la esperanza de X, cuya función de densidad es del tipo Cauchy:

2 2

1( )X

af x

a x

2 2

xadx

a x

NO EXISTE X

• Probar que si la densidad es par, entonces su media es nula.

no converge

• Probar que si la densidad es par, entonces su media es nula.

0

0

X X X Xx f x dx x f x dx x f x dx

u x 0

Xu f u du

0

Xu f u du

Xf u

por ser par0X

Page 44: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Propongo el siguiente juego. Se tienen 6 dados, cada uno con 5 caras en blanco y la sexta con un número del 1 al 6 (cada dado uno distinto). El jugador tira los seis dados y se le paga W=6T, donde T es la suma de todos los números que salen. Cuánto debería cobrar para jugar?

EJERCICIOS

1 2 3 4 5 6T X X X X X X 1

6iE X i

6

1

16 21

6

m

i

E W i

Si bien en promedio pago 21, el mínimo que pago es 0 pero el máximo es 6*21=126. Si cobro más de 21 por jugar, y lo juegan muchas personas muchas veces, en promedio me hago millonario !!!!

Page 45: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

EJERCICIOS

• Sea X una VA discreta entre 1 y n. Hallar media y varianza. Repetir si la uniforme es de 0 a n. Recuerde que: 2

1

1 2 1

6

n

i

n n ni

1

11 1

2

n

Xi

n ni

n n

1

2

X

n

2

21 2 2 1 3 11 2 1 1 1 1

n n nn n n n n

En el caso de la uniforme entre 0 y n.

21 2 2 1 3 11 2 1 1 1 1

6 4 12 12

X

n n nn n n n n

1

11 1

1 1 2

n

Xi

n ni

n n 2 X

n

22

2 2 1 32 1 2

6 4 12 12

X

n n nn n n nn

Page 46: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

EJERCICIOS

• Una compañía tiene una flota de camiones que transportan sus productosdesde la ciudad A hasta la B, que se encuentran a 1000 km. de distancia.Como los camiones son viejos, pueden romperse al azar en cualquier puntodel recorrido. ¿Dónde debería ubicarse una estación de reparaciones paraminimizar la distancia esperada del lugar de la rotura hasta la estación?Para ello, defina la VA X como la distancia (en km.) desde la ciudad Ahasta el lugar de la rotura y b como la distancia desde la ciudad A hastael lugar de la estación. ¿Cuál es la respuesta si en vez de una uniforme, Xsigue una ley fX(x) = 2x/(1000)2?sigue una ley fX(x) = 2x/(1000) ?

El valor b será aquel que minimice:

2

2 20

2

1000 1000

x

X

xF x xdx

E X b ˆeb m X

En el primer caso, X es U(0,1000). Por ser simétrica 500e Xm X

En el segundo caso, Dado que,

0.5X eF m X

21000

500 22

em X

Page 47: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

EJERCICIO

• Un gran número de gente N debe efectuarse un examen de sangre. Esto puede hacerse de dos maneras: (a) cada persona se testea por separado, requiriéndose N tests. (b) se juntan las muestras de sangre de k personas y se analizan en conjunto. Si el análisis es negativo, es suficiente. Si no, las k personas se testean de nuevo por separado. En total se requieren k+1 tests en este caso. Asuma que la probabilidad p de que un examen sea positivo es la misma para todos, que los tests son independientes y que N es divisible por k.

La probabilidad de que un examen de k personas sea positivo es:

1 1 1 1k k

k p p

1 1k

p La probabilidad de que un examen de k personas sea positivo es:

Luego, el número medio de tests para el grupo de k personas es:

Al haber N/k grupos, el total medio es:

1 1 1 1k kN

k p pk

Page 48: 04 - Momentos to print [Modo de compatibilidad]materias.fi.uba.ar/6109R/clases_teoricas/Teorica04.pdf · FUNCION DE DISTRIBUCION EMPIRICA Si se cuenta con n valores de una VA X,

Ahora busquemos el valor de k que minimiza el número medio de tests. Si se asume que p es pequeño, vale la aproximación:

1 1k

p kp

11 1

Nk kp kp N kp

k k

m

Derivando respecto de k:

k k

20

NNp

k

1k

p El óptimo no

depende de N