Modelo Probabilisticos Clase 5 (1)

Embed Size (px)

Citation preview

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    1/34

    Tema 5: Modelos probabilísticos 1

    Bioestadística

    Tema 5: Modelos probabilísticos

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    2/34

    Tema 5: Modelos probabilísticos 2

    Variable aleatoria

    El resultado de un experimento aleatorio puede serdescrito en ocasiones como una cantidad numérica .

    En estos casos aparece la noción de variable aleatoriaFunción ue asi!na a cada suceso un n"mero.

    #as variables aleatorias pueden ser discretas ocontinuas $como en el primer tema del curso%.

    En las si!uientes transparencias vamos a recordarconceptos de temas anteriores& 'unto con su nuevadesi!nación. #os nombres son nuevos. #os conceptosno.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    3/34

    Tema 5: Modelos probabilísticos (

    Función de probabilidad $V. )iscretas%Función de Cuantía

    Asigna a cada posible valor deuna variable discreta suprobabilidad .

    *ecuerda los conceptos de+recuencia relativa , dia!rama debarras.-$x% o&/umatoria p$x%01

    Ejemplo

    "mero de caras al lan3ar ( monedas.

    ∑∈

    =rec x

    x p 1)(∑∈

    =rec x

    x p 1)(∑∈

    =rec x

    x p 1)(∑∈

    =rec x

    x p 1)(

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    4/34

    Tema 5: Modelos probabilísticos 4

    Función de densidad $V. ontinuas%

    )e+iniciónEs una +unción no ne!ativa de inte!ral 1.

    -iénsalo como la !enerali3ación del6isto!rama con +recuencias relativaspara variables continuas.+$x% 7#a inte!ral de +$x%01

    8-ara ué lo vo, a usar9unca lo vas a usar directamente.

    /us valores no representan probabilidades.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    5/34

    Tema 5: Modelos probabilísticos 5

    8-ara ué sirve la +. densidad9Muc6os procesos aleatorios vienen descritos por variables de +orma

    ue son conocidas las probabilidades en intervalos.

    #a inte!ral de+inida de la +unción de densidad en dic6os intervaloscoincide con la probabilidad de los mismos.

    Es decir& identi+icamos la probabilidad de un intervalo con el área ba'ola +unción de densidad.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    6/34

    Tema 5: Modelos probabilísticos

    Función de distribución

    Es la +unción ue asocia a cada valor de unavariable& la probabilidad acumulada de los valores in+eriores o i!uales.

    -iénsalo como la !enerali3ación de las+recuencias acumuladas. )ia!rama inte!ral .

    ; los valores extremadamente ba'os les correspondenvalores de la +unción de distribución cercanos a cero.

    ; los valores extremadamente altos les correspondenvalores de la +unción de distribución cercanos a uno.

    #o encontraremos en los artículos , aplicaciones en +ormade & si!ni+icación&?

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    7/34

    Tema 5: Modelos probabilísticos @

    8-ara ué sirve la +. distribución9ontrastar lo anómalo de una observación concreta.

    /é ue una persona de altura 217cm es < anómala > por ue la +unción dedistribución en 217 es mu, alta ./é ue una persona adulta ue mida menos de 147cm es < anómala > por uela +unción de distribución es mu, ba'a para 147cm.

    /é ue una persona ue mida 1@7cm no posee una altura nada extraAa puessu +unción de distribución es aproximadamente 7&5.

    *elaciónalo con la idea de cuantil .

    En otro contexto $contrastes de 6ipótesis% podremos observar unosresultados experimentales , contrastar lo ue son encon'unto con respecto a una 6ipótesis de terminada.

    ntenta comprender la explicación de clase si puedes. /i no& i!nora estode momento. *evisita este punto cuando 6a,amos visto el tema decontrastes de 6ipótesis.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    8/34

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    9/34

    Tema 5: Modelos probabilísticos I

    ;l!unos modelos de v.a.

    Ja, v.a. ue aparecen con +recuencia en las iencias dela /alud.Experimentos dicotómicos.

    Bernoulli

    ontar éxitos en experimentos dicotómicos repetidos:Binomial-oisson $sucesos raros%

    K en otras muc6as ocasiones?)istribución normal $!aussiana& campana&?%

    El resto del tema estL dedicado a estudiar estasdistribuciones especiales.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    10/34

    Tema 5: Modelos probabilísticos 17

    )istribución de Bernoulli

    Tenemos un experimento de Bernoulli si al reali3ar un

    experimentos sólo son posibles dos resultados:D01 $éxito & con probabilidad p%D07 $fracaso & con probabilidad 01=p%

    #an3ar una moneda , ue sal!a cara.p01 2

    Ele!ir una persona de la población , ue esté en+ermo.p01 1777 0 prevalencia de la en+ermedad

    ;plicar un tratamiento a un en+ermo , ue éste se cure.p0I5N& probabilidad de ue el individuo se cure

    omo se aprecia& en experimentos donde el resultado esdicotómico& la variable ueda per+ectamente determinadaconociendo el parLmetro p .

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    11/34

    Tema 5: Modelos probabilísticos 11

    E'emplo de distribución de Bernoulli.

    /e 6a observado estudiando 2777 accidentes de trL+icocon impacto +rontal , cu,os conductores no teníancinturón de se!uridad & ue (77 individuos uedaron consecuelas. )escriba el experimento usando conceptos dev.a.

    /olución.#a noc. +recuentista de prob. nos permite aproximar la probabilidad detener secuelas mediante (77 277707&15015N

    D0 es variable de Bernoulli

    D01 tiene probabilidad p O 7&15D07 tiene probabilidad O 7&C5

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    12/34

    Tema 5: Modelos probabilísticos 12

    E'emplo de distribución de Bernoulli.

    /e 6a observado estudiando 2777 accidentes de trL+icocon impacto +rontal , cu,os conductores sí teníancinturón de se!uridad & ue 17 individuos uedaron consecuelas. )escriba el experimento usando conceptos dev.a.

    /olución.#a noc. +recuentista de prob. nos permite aproximar la probabilidad de

    uedar con secuelas por 17 277707&77507&5N

    D0 es variable de

    BernoulliD01 tiene probabilidad p O 7&775D07 tiene probabilidad O 7&II5

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    13/34

    Tema 5: Modelos probabilísticos 1(

    PbservaciónEn los dos e'emplos anteriores 6emos visto cómo enunciar losresultados de un experimento en +orma de estimación deparLmetros en distribuciones de Bernoulli.

    /in cinturón: p O 15Non cinturón: p O 7&5N

    En realidad no sabemos en este punto si ambas cantidades sonmu, di+erentes o aproximadamente i!uales& pues en otros estudiossobre accidentes& las cantidades de individuos con secuelas6ubieran sido con se!uridad di+erentes.

    -ara decidir si entre ambas cantidades existen di+erenciasestadísticamente si!ni+icativas necesitamos introducir conceptosde estadística in+erencial $extrapolar resultados de una muestra atoda la población%.

    Es mu, pronto para resolver este cuestionamiento a6ora.Esperemos a las pruebas de D 2 .

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    14/34

    Tema 5: Modelos probabilísticos 14

    )istribución binomial

    Función de probabilidad

    -roblemas de cLlculo si n es !rande , o p cercano a 7 o 1.

    Media: G 0n p

    Varian3a: H 2 0 n p

    nk q pk

    nk X P k nk ≤≤

    == − 0 ,][

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    15/34

    Tema 5: Modelos probabilísticos 15

    )istribución Binomial/i se repite un n"mero +i'o de veces& n & un experimento deBernoulli con parLmetro p & el n"mero de éxitos si!ue unadistribución binomial de parLmetros $n&p%.

    #an3ar una moneda 17 veces , contar las caras.Bin$n017&p01 2%

    #an3ar una moneda 177 veces , contar las caras.Bin$n0177&p01 2%)i+ícil 6acer cLlculos con esas cantidades. El modelo normal serL mLs adecuado.

    El n"mero de personas ue en+ermarL $en una población de 577.777personas% de una en+ermedad ue desarrolla una de cada 2777personas.

    Bin$n0577.777& p01 2777%

    )i+ícil 6acer cLlculos con esas cantidades. El modelo de -oisson serL mLsadecuado.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    16/34

    Tema 5: Modelos probabilísticos 1

    ;"n no conoces la

    distribución normal& ni de-oisson.

    )e cual uier +orma a uítienes la comparación entre

    valores de p no mu, extremos , una normal de misma media, desviación típica& paratamaAos de n !randes $n (7%.

    uando p es mu, pe ueAo esme'or usar la aproximacióndel modelo de -oisson .

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    17/34

    Tema 5: Modelos probabilísticos 1@

    )istribución de -oisson

    También se denomina de sucesos raros ./e obtiene como aproximación de unadistribución binomial con la misma media& paraQn !rande R $n (7% , Qp pe ueAo R $pS7&1%.

    ueda caracteri3ada por un "nico parLmetro G$ ue es a su ve3 su media , varian3a .%Función de probabilidad:

    ,...2,1,0 ,!

    ][ === − k k

    ek X P k

    µ µ

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    18/34

    Tema 5: Modelos probabilísticos 1C

    E'emplos de variables de -oissonEl n"mero de individuos ue serL atendido un día cual uiera en elservicio de ur!encias del 6ospital clínico universitario.

    En MLla!a 6a, 577.777 6abitantes $n !rande%#a probabilidad de ue cual uier persona ten!a un accidente es pe ueAa&pero no nula. /upon!amos ue es 1 17.777Bin $n0577.777&p01 17.777% ≈ oisson $G0np057%

    /ospec6amos ue di+erentes 6ospitales pueden tener servicios detraumatolo!ía de di+erente $al!unos presentan pocos& perocreemos ue a"n demasiados& en+ermos con secuelas tras laintervención%. Es di+icil compararlos pues cada 6ospital atiendepoblaciones de tamaAos di+erentes $ciudades& pueblos&?%

    Tenemos en cada 6ospital n& nU de pacientes atendidos o nU individuos de lapoblación ue cubre el 6ospital.

    Tenemos p pe ueAo calculado como +recuencia relativa de secuelas conrespecto al total de pacientes ue trata el 6ospital& o el tamaAo de lapoblación&?/e puede modelar mediante -oisson $G0np%

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    19/34

    Tema 5: Modelos probabilísticos 1I

    )istribución normal o de auss

    ;parece de manera natural:Errores de medida.)istancia de +renado. ;ltura& peso& propensión al crimen?

    )istribuciones binomiales con n !rande $n (7% , Qp nipe ueAoR $np 5% Qni !randeR $n 5%.

    EstL caracteri3ada por dos parLmetros : #a media & G

    , la desviación típica & H.

    /u +unción de densidad es:

    2

    21

    2

    1)(

    −−

    = σ µ

    π σ

    x

    e x f

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    20/34

    Tema 5: Modelos probabilísticos 27

    $G& H%: nterpretación!eométrica

    -odemos interpretarla media como un+actor de traslación .

    K la desviación típica como un +actor de

    escala & !rado dedispersión&?

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    21/34

    Tema 5: Modelos probabilísticos 21

    $G& H%: nterpretación probabilista

    Entre la media , unadesviación típicatenemos siempre lamisma probabilidad :

    aprox. CN

    Entre la media , dos

    desviaciones típicasaprox. I5N

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    22/34

    Tema 5: Modelos probabilísticos 22

    ;l!unas características#a +unción de densidad es simétrica& mesoc"rtica , unimodal .

    Media& mediana , moda coinciden.

    #os puntos de in+lexión de la +un. de densidad estLn a distancia ! de G.

    /i tomamos intervalos centrados en G& , cu,os extremos estLn?a distancia ! & tenemos probabilidad "#$a distancia % ! & tenemos probabilidad &'$

    a distancia %(' ! tenemos probabilidad &&$

    o es posible calcular la probabilidad de un intervalo simplementeusando la primitiva de la +unción de densidad& ,a ue no tiene primitivaexpresable en términos de +unciones QcomunesR.

    Todas las distribuciones normales $G& H%& pueden ponerse mediante unatraslación G& , un cambio de escala H& como )*+,-. . Esta distribuciónespecial se llama normal tipificada .

    Wusti+ica la técnica de tipi+icación& cuando intentamos comparar individuosdi+erentes obtenidos de sendas poblaciones normales.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    23/34

    Tema 5: Modelos probabilísticos 2(

    Tipi+icación)ada una variable de media G , desviación típica H& se denominavalor tipi+icado &3& de una observación x& a la distancia $con si!no% conrespecto a la media& medido en desviaciones típicas & es decir

    En el caso de variable D normal & la interpretación es clara: ;si!na atodo valor de $G& H%& un valor de $7&1% ue de'a exáctamente lamisma probabilidad por deba'o.

    os permite así comparar entre dos valores de dos distribucionesnormales di+erentes& para saber cuLl de los dos es mLs extremo.

    σ

    µ −= x z

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    24/34

    Tema 5: Modelos probabilísticos 24

    E'emplo/e uiere dar una beca a uno de dos estudiantes de sistemas educativosdi+erentes. /e asi!narL al ue ten!a me'or expediente académico.

    El estudiante ; tiene una cali+icación de C en un sistema donde la cali+icación de los

    alumnos se comporta como $ &1%.El estudiante B tiene una cali+icación de C7 en un sistema donde la cali+icación de losalumnos se comporta como $@7&17%.

    /olucióno podemos comparar directamente C puntos de ; +rente a los C7 de B& pero como

    ambas poblaciones se comportan de modo normal& podemos tipi+icar , observar laspuntuaciones sobre una distribución de re+erencia $7&1%

    omo X ; XB& podemos decir ue el porcenta'e de compaAeros del mismo sistema deestudios ue 6a superado en cali+icación el estudiante ; es ma,or ue el ue 6asuperado B. -odríamos pensar en principio ue ; es me'or candidato para la beca.

    110

    7080

    21

    68

    =−=−=

    =−=−=

    B x

    z

    x z

    B B B

    A

    A A A

    σ

    µ

    σ

    µ

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    25/34

    Tema 5: Modelos probabilísticos 25

    8-or ué es importante la distribución normal9

    #as propiedades ue tiene la distribución normal son

    interesantes& pero todavía no 6emos 6ablado de por uées una distribución especialmente importante .

    #a ra3ón es ue aun ue una v.a. no posea distribuciónnormal & ciertos estadísticos estimadores calculados

    sobre muestras ele!idas al a3ar sí ue poseen unadistribución normal .

    Es decir& ten!an las distribución ue ten!an nuestrosdatos& los Qob'etosR ue resumen la in+ormación de una

    muestra& posiblemente ten!an distribución normal $oasociada%.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    26/34

    Tema 5: Modelos probabilísticos 2

    Veamos aparecer la distribución normal

    omo ilustraciónmostramos una variableue presenta valores

    distribuidos mLs o menosuni+ormemente sobre elintervalo 157=1I7.

    omo es de esperar lamedia es cercana a [email protected] 6isto!rama no separece en nada a una

    distribución normal con lamisma media ,desviación típica.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    27/34

    Tema 5: Modelos probabilísticos 2@

    ; continuación ele!imosaleatoriamente !rupos de 17 observaciones de las anteriores ,calculamos el promedio.

    -ara cada !rupo de 17 obtenemosentonces una nueva medición& uevamos a llamar promedio muestral .

    Pbserva ue las nuevas cantidadesestLn mLs o menos cerca de lamedia de la variable ori!inal.

    *epitamos el proceso un n"meroelevado de veces . En la si!uientetransparencia estudiamos ladistribución de la nueva variable.

    Muestra

    1Y 2Y (Y1C5 1I7 1@I1@4 1 I 1 (

    1 @ 1@7 1 @

    1 7 15I 152

    1@2 1@I 1@C

    1C( 1@5 1C(1CC 15I 155

    1@C 152 1 5

    152 1C5 1C5

    1@5 152 152

    -01 -"& -"# 2

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    28/34

    Tema 5: Modelos probabilísticos 2C

    #a distribución de los promediosmuestrales sí ue tiene distribuciónaproximadamente normal .

    #a media de esta nueva variable$promedio muestral% es mu, parecida a lade la variable ori!inal.

    #as observaciones de la nueva variableestLn menos dispersas . Pbserva elran!o. -ero no sólo eso. #a desviacióntípica es aproximadamente Qrai3 de 17Rveces mLs pe ueAa. #lamamos errorestLndar a la desviación típica de estanueva variable.

    )ada de lo anterior es casualidad .

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    29/34

    Tema 5: Modelos probabilísticos 2I

    Teorema central del límite)ada una v.a. cual3uiera & si extraemos muestras detamaAo n& , calculamos los promedios muestrales & entonces:

    dic6os promedios tienen distribución aproximadamente normal Z

    #a media de los promedios muestrales es la misma ue la de la variableori!inal.

    #a desviación típica de los promedios disminu,e en un +actor < raí3 de n >$error estLndar %.

    #as aproximaciones anteriores se 6acen exactas cuando n tiende a in+inito.

    Este teorema 'usti+ica la importancia de la distribución normal.

    /ea lo ue sea lo ue midamos& cuando se promedie sobre una muestra!rande $ n41+ % nos va a aparecer de manera natural la distribución normal.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    30/34

    Tema 5: Modelos probabilísticos (7

    )istribuciones asociadas a la normaluando ueramos 6acer in+erencia estadística 6emos visto ue la

    distribución normal aparece de +orma casi inevitable.

    )ependiendo del problema& podemos encontrar otras $asociadas%:D2 $c6i cuadrado%t= studentF=/nedecor

    Estas distribuciones resultan directamente de operar con distribucionesnormales. Típicamente aparecen como distribuciones de ciertosestadísticos.

    Veamos al!unas propiedades ue tienen $super+icialmente%.

    /obre todo nos interesa saber ué valores de dic6as distribuciones son./i!ni+icación& p=valores&?

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    31/34

    Tema 5: Modelos probabilísticos (1

    6i cuadrado

    Tiene un sólo parLmetrodenominado !rados de libertad .

    #a +unción de densidad esasimétrica positiva. /ólo tienendensidad los valores positivos.

    #a +unción de densidad se 6acemLs simétrica incluso casi!ausiana cuando aumenta eln"mero de !rados de libertad.

    ormalmente consideraremosanómalos a uellos valores de lavariable de la .

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    32/34

    Tema 5: Modelos probabilísticos (2

    T de student

    Tiene un parLmetro denominado!rados de libertad.

    uando aumentan los !rados delibertad& mLs se acerca a $7&1%.

    Es simétrica con respecto al cero.

    /e consideran valores anómalos losue se ale'an de cero $positivos o

    ne!ativos%.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    33/34

    Tema 5: Modelos probabilísticos ((

    F de /nedecor

    Tiene dos parLmetrosdenominados !rados delibertad.

    /ólo toma valorespositivos. Es asimétrica.

    ormalmente se consideran

    valores anómalos los de lacola de la derec6a.

  • 8/17/2019 Modelo Probabilisticos Clase 5 (1)

    34/34

    Tema 5: Modelos probabilísticos (4

    8 ué 6emos visto9En v.a. 6a, conceptos e uivalentes a los de temasanteriores

    Función de probabilidad Frec. *elativa.Función de densidad 6isto!ramaFunción de distribución dia!r. nte!ral.Valor esperado media& ?

    Ja, modelos de v.a. de especial importancia:BernoulliBinomial-oisson

    ormal-ropiedades !eométricasTipi+icación

    ;parece tanto en problemas con variables cualitativas $dicotómicas&Bernoulli% como numéricas)istribuciones asociadas

    T=studentD2F de /nedecor