7
1 ANALISIS CUALITATIVOS Ejercicios resueltos 1. Para estudiar la asociación entre la raza y la imposición de pena de muerte a individuos culpables de homicidio se llevó a cabo un estudio sobre 326 individuos culpables de homicidio en Florida durante 1976- 1977. Los datos observados para las variables “veredicto de pena de muerte” (si, no) y “raza del acusado” (blanca, negra) figuran en la tabla I: pena de muerte si no raza blanca 19 141 raza negra 17 149 Tabla I. Solución: El cociente de ventajas muestral es: 19 149 ˆ 1,18 17 141 × θ= = × Esta estimación puntual significa que en la muestra la probabilidad estimada de ser condenado a muerte en lugar de no serlo es 1,18 veces mayor para una persona de raza blanca que para una de raza negra. Para poder inferir este resultado a la población se construye un intervalo de confianza sobre θ al nivel 0,95. Para ello se calcula ˆ ln 0,166 θ= cuyo error estándar estimado es: ( ) 1 1 1 1 ˆ ˆ ln 0,354 19 141 17 149 σ θ = + + + = Por lo tanto, un intervalo de confianza al nivel 0.95 para ln θ es: 0,166 1, 96 0,354 ± × de modo que el intervalo: ( ) ( ) 0,527 0,860 , 0,5902 , 2,3633 e e = es un intervalo de confianza aproximado al nivel 0,95 para θ . Dado que este intervalo contiene al valor 1 θ= de independencia, los datos no son significativos para concluir que los acusados de raza blanca y los de raza negra tienen distinta probabilidad de recibir pena de muerte. La Q de Yule muestral se obtiene como: 19 149 141 17 ˆ 0, 00830 19 149 141 17 Q × × = = × + × Para construir un intervalo de confianza sobre Q al nivel 0,95 se estima su error estándar asintótico ( ) ˆ ˆ 0,17578 Q σ = . Entonces el intervalo de confianza es: ( ) 0, 00830 1, 96 0,17578 0, 2615 , 0, 4275 ± × que contiene al valor 0 Q = de independencia.

Analisis Datos Cualitativos Ejercicios Resueltos 03 2007

Embed Size (px)

DESCRIPTION

hola

Citation preview

  • 1ANALISIS CUALITATIVOS

    Ejercicios resueltos

    1. Para estudiar la asociacin entre la raza y la imposicin de pena de muerte a individuos culpables dehomicidio se llev a cabo un estudio sobre 326 individuos culpables de homicidio en Florida durante 1976-1977. Los datos observados para las variables veredicto de pena de muerte (si, no) y raza del acusado(blanca, negra) figuran en la tabla I:

    pena de muertesi no

    raza blanca 19 141raza negra 17 149

    Tabla I.Solucin:El cociente de ventajas muestral es:

    19 149 1,1817 141

    = =Esta estimacin puntual significa que en la muestra la probabilidad estimada de ser condenado a muerte enlugar de no serlo es 1,18 veces mayor para una persona de raza blanca que para una de raza negra.Para poder inferir este resultado a la poblacin se construye un intervalo de confianza sobre al nivel 0,95.Para ello se calcula ln 0,166= cuyo error estndar estimado es:

    ( ) 1 1 1 1 ln 0,35419 141 17 149 = + + + =Por lo tanto, un intervalo de confianza al nivel 0.95 para ln es:

    0,166 1,96 0,354 de modo que el intervalo:

    ( ) ( )0,527 0,860, 0,5902 , 2,3633e e =es un intervalo de confianza aproximado al nivel 0,95 para . Dado que este intervalo contiene al valor1= de independencia, los datos no son significativos para concluir que los acusados de raza blanca y los

    de raza negra tienen distinta probabilidad de recibir pena de muerte.La Q de Yule muestral se obtiene como:

    19 149 141 17 0,0083019 149 141 17

    Q = = + Para construir un intervalo de confianza sobre Q al nivel 0,95 se estima su error estndar asinttico

    ( ) 0,17578Q = . Entonces el intervalo de confianza es:( )0,00830 1,96 0,17578 0,2615 , 0,4275

    que contiene al valor 0Q= de independencia.

  • 22. Con el fin de estudiar la relacin entre la opinin sobre la legalizacin de las drogas y el nivel de estudiosse dispone de los datos de la siguiente tabla. La opinin respecto a la legalizacin de las drogas se clasificaen tres categoras: D (desaprobacin), M (aprobacin moderada) y A (aprobacin general). El nivel deestudios se clasifica tambin en tres niveles: EP (estudios primarios), EM (estudios medios) y EU(estudios universitarios).

    D M A totalEP 209 101 237 547EM 151 126 426 703EU 16 21 138 175

    total 376 248 801 1425Tabla II. Asociacin opinin respecto a las drogas nivel de estudios.

    Solucin:Se propone estudiar la asociacin entre la actitud respecto a legalizar las drogas y el nivel de estudiosmediante los cocientes de ventajas locales que tienen en cuenta su naturaleza ordinal.

    En primer lugar se contrastar la independencia mediante los contrastes 2 y de razn de verosimilitudesque pueden ser aplicados ya que la mnima frecuencia esperada bajo independencia es 30,46. Los valoresobservados de estos estadsticos son:

    2

    2

    93,034

    96,527observada

    observadaG

    ==

    Para ambos sus valores p que corresponden a la probabilidad acumulada a su derecha por una 24 sonexactamente cero. Esto lleva a rechazar la hiptesis nula de independencia con cualquier nivel designificacin.

    Los valores estimados de las medidas de asociacin basadas en 2 son: 0,256 0,248 0,181

    C

    V

    ===

    Obsrvese que el grado de asociacin global estimado con estas medidas es muy pequeo.Como ambas variables son ordinales se procede a estimar la asociacin mediante la medida gamma. Elnmero de pares concordantes es el siguiente:

    ( ) ( ) ( )209 126 426 21 138 101 426 138 151 21 138 126 138246960

    C = + + + + + + + + =

    Anlogamente, el nmero de pares discordantes es:

    ( ) ( ) ( )101 51 16 237 151 126 16 21 126 16 426 16 21109063

    D = + + + + + + + +=

    Como consecuencia el valor muestral de la medida gamma es 0,3873 = . Su error estndar estimado( ) 0,037 = , permite construir el intervalo de confianza al nivel 0,95 dado por (0,31448 , 0,45952).

    Obsrvese que el valor estimado es muy preciso dado que el intervalo de confianza es estrecho de modoque se puede concluir, en base al signo positivo de esta medida, que existe cierto grado de monotonacreciente en la asociacin. Esto significa que la probabilidad de estar a favor de la legalizacin de las drogasaumenta con el nivel de estudios.

  • 33. Se desea comparar los registros que dos observadores han obtenido a lo largo de una sesin. Nosinteresa conocer cul es la fiabilidad entre los registros de estos dos observadores:

    observador 2A B C D

    A 191 97 65 88 441B 83 123 88 73 367C 59 76 161 39 335observador 1

    D 91 78 65 144 378424 374 379 344 1521

    Tabla III.Solucin:

    Se calcula el valor del ndice kappa ( ) a partir de la frmula general:

    1 1

    11

    k k

    i i i ji i

    k

    i ji

    n n n

    n n

    + += =

    + +=

    =

    Se calcula la proporcin de concordancia observada y la proporcin de concordancia aleatoria. En el casode la proporcin de concordancia observada interesan las casillas que tienen los mismos subndices, dondecoinciden los registros de los dos observadores:

    1

    1

    191 123 161 144 0,411521

    k

    i iki

    i ii

    nn

    f=

    = ++

    + + += = =

    Para conocer el efecto de las respuestas aleatorias de los observadores se calcula la proporcin deconcordancia aleatoria utilizando para ello los marginales de la matriz de confusin:

    ( ) ( ) ( ) ( )12 2

    1

    441 424 367 374 335 379 378 3440,25

    1521

    k

    i jki

    i ji

    n nn n

    f

    + +=

    + += + +

    + + + = = =

    Una vez conocidas las dos proporciones se sustituye en la forma general del ndice y se tiene:0,41 0,25 0,211 0,25

    = =

    4. Supngase que en una determinada poblacin se desea averiguar si existen diferencias en la prevalenciade obesidad entre hombres y mujeres o si, por el contrario, el porcentaje de obesos no vara entre sexos.Tras ser observada una muestra de 14 sujetos se obtuvieron los resultados que se muestran en la tabla IV:

    sexo obesidad s obesidad no totalhombres 7 (a) 2 (b) 9 (a+b)mujeres 1 (c) 4 (d) 5 (c+d)

    total 8 (a+c) 6 (b+d) 14 (n)Tabla IV. Tabla de contingencia para estudiar las diferencias en la prevalencia de obesidad entre sexos.

    Estudio de prevalencia sobre 14 sujetos.

  • 4Solucin:En esta tabla, la frecuencia esperada en tres de las cuatro celdas es menor de 5, por lo que no resultaadecuado aplicar el test 2 , aunque s el test exacto de Fisher. Si las variables sexo y obesidad fuesenindependientes, la probabilidad asociada a los datos que han sido observados vendra dada por:

    ( ) ( ) ( ) ( )! ! ! ! 9! 5! 8! 6! 0,0599! ! ! ! ! 14! 7! 2!1! 4!

    a b c d a c b dp

    n a b c d+ + + += = =

    Las siguientes tablas (V a X) muestran todas las posibles combinaciones de frecuencias que se podranobtener con los mismos totales marginales que en la tabla IV. Para cada una de ellas, se ha calculado laprobabilidad exacta de ocurrencia bajo la hiptesis nula, segn la frmula general mencionadaanteriormente. Los resultados obtenidos se muestran en la tabla XI. El valor de la p asociado al test exactode Fisher puede entonces calcularse sumando las probabilidades de las tablas que resultan ser menores oiguales a la probabilidad de la tabla que ha sido observada:

    Tabla V obesidad si obesidad nohombres 8 1 9mujeres 0 5 5

    8 6 14

    Tabla VI obesidad si obesidad nohombres 7 2 9mujeres 1 4 5

    8 6 14

    Tabla VII obesidad si obesidad nohombres 6 3 9mujeres 2 3 5

    8 6 14

    Tabla VIII obesidad si obesidad nohombres 5 4 9mujeres 3 2 5

    8 6 14

    Tabla IX obesidad si obesidad nohombres 4 5 9mujeres 4 1 5

    8 6 14

    Tabla X obesidad si obesidad nohombres 3 6 9mujeres 5 0 5

    8 6 14

    0,0030 0,0599 0,0280 0,0909p = + + = [1]

  • 5a b c d pV 8 1 0 5 0,0030VI 7 2 1 4 0,0599VII 6 3 2 3 0,2797VIII 5 4 3 2 0,4196IX 4 5 4 1 0,2098X 3 6 5 0 0,2080

    Tabla XI. Probabilidad exacta asociada con cada una de las disposiciones de frecuencias de la tabla IX.

    Otro modo de calcular el valor de p correspondiente consistira en sumar las probabilidades asociadas aaquellas tablas que fuesen ms favorables a la hiptesis alternativa que los datos observados. Es decir,aquellas situaciones en las que la diferencia en la prevalencia de obesidad entre hombres y mujeres fuesemayor que la observada en la realidad. En el ejemplo, slo existe una tabla ms extrema que lacorrespondiente a los datos observados (aquella en la que no se observa ninguna mujer obesa), de formaque:

    0,0030 0,0599 0,0629p = + = [2]Este sera el valor de la p correspondiente a un planteamiento unilateral. En este caso la hiptesis acontrastar sera que la prevalencia de obesidad es igual en hombres y mujeres, frente a la alternativa deque fuese mayor en los varones. Cuando el planteamiento se hace con una perspectiva bilateral, lahiptesis alternativa consiste en asumir que existen diferencias en la prevalencia de obesidad entre sexos,pero sin especificar de antemano en qu sentido se producen dichas diferencias. Para obtener el valor de lap correspondiente a la alternativa bilateral se debera multiplicar el valor obtenido en [2] por 2:

    2 0,0629p = [3]Como se puede observar, las dos formas de clculo propuestas no tienen por qu proporcionarnecesariamente los mismos resultados. El primer mtodo siempre resultar en un valor de p menor o igualal del segundo mtodo. Si se recurre a un programa estadstico como el SPSS para el cmputo del test,ste utilizar la primera va para obtener el valor p correspondiente a la alternativa bilateral y el segundomtodo de clculo para el valor de p asociado a un planteamiento unilateral. En cualquier caso, y a la vistade los resultados, no existe evidencia estadstica de asociacin entre el sexo y el hecho de ser obeso en lapoblacin de estudio.

    5. Supngase que se desea estudiar la existencia de una asociacin entre el consumo de tabaco y el hechode sufrir un infarto de miocardio. Para poner en evidencia dicha asociacin y cuantificar su magnitud sedisea un estudio de casos y controles en el que se investigar el consumo de tabaco de una serie depacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos (controles). Secree que alrededor de un 40 % de los controles son fumadores y se considera como diferencia importanteentre ambos grupos un odds ratio de 4. Con estos datos, se puede calcular el tamao de muestra necesarioen cada grupo para detectar un odds ratio de 4 como significativamente diferente de 1 con una seguridaddel 95 % y una potencia del 80 %.Solucin:De acuerdo con lo expuesto con anterioridad, se conocen los siguientes parmetros:

    Frecuencia de exposicin entre los controles: 40 % Odds ratio previsto: 4 Nivel de seguridad: 95 % Potencia estadstica: 80 %

    Por tanto, se estima que la frecuencia de exposicin entre los casos vendr dada por:

    ( ) ( )21 2 24 0,40 1,6 0,73

    1 0,40 4 0,40 0,60 1,61w p

    pp w p

    = = = = + + +

  • 6Esto es, se estima que aproximadamente un 73 % de los casos son fumadores. Aplicando la frmulacorrespondiente, se obtiene:

    ( ) ( ) ( )( )( )

    2

    2

    1,96 2 0,565 1 0,565 0,84 0,73 1 0,73 0,4 1 0,435

    0,73 0,4n

    + + =

    Es decir, se necesitara estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35controles) para detectar como significativo un valor del odds ratio de 4.Si se reduce el tamao del efecto a detectar, asumiendo que el odds ratio es aproximadamente igual a 3, seobtiene:

    ( ) ( )21 2 23 0,40 0,67

    1 0,40 3 0,401w p

    pp w p

    = = = + +y, de acuerdo con la frmula correspondiente, seran necesarios 54n= pacientes por grupo para llevar acabo el estudio.Ocasionalmente, el investigador rene un nmero mayor de controles que de casos con el objeto deincrementar el poder estadstico. Supngase que en el presente ejemplo se planea obtener dos controlespor caso, y se asume que el odds ratio a detectar es aproximadamente igual a 3. Aplicando la frmulacorrespondiente:

    ( ) ( ) ( ) ( )( )( )

    2

    2

    1,96 2 1 0,565 1 0,565 0,84 2 0,73 1 0,73 0,4 1 0,440

    2 0,73 0,4n

    + + + =

    Por tanto, se necesitara un grupo de 40n= casos (pacientes con infarto de miocardio) y 2 40 80m= =controles para llevar a cabo la investigacin.

    6. Supngase que se quiere llevar a cabo un ensayo clnico para comparar la efectividad de un nuevofrmaco con la de otro estndar en el tratamiento de una determinada enfermedad. Al inicio del estudio, sesabe que la eficacia del tratamiento habitual est en torno al 40 %, y se espera que con el nuevo frmaco laeficacia aumente al menos en un 15 %. El estudio se dise para que tuviese un poder del 80 %,asumiendo una seguridad del 95 %. Esto implica que son necesarios 173 pacientes en cada uno de losgrupos para llevar a cabo la investigacin. Tras finalizar el estudio, slo fue posible tratar con cada uno delos frmacos a 130 pacientes en cada grupo en lugar de los 173 pacientes estimados inicialmente. Alrealizar el anlisis estadstico, se objetiv que no hay diferencias significativas en la efectividad de ambostratamientos.Solucin:A partir de la frmula correspondiente (vase Notas), se puede calcular cul ha sido finalmente la potenciadel estudio. Aplicando la frmula para el clculo de la potencia estadstica de comparacin de dosproporciones ante un planteamiento unilateral se obtiene:

    ( )( ) ( )

    ( )( ) ( )

    1

    2 1 2 11

    1 1 2 2

    1

    0, 400,475

    0,55 2 1

    130 1 10,05 1,645

    0,4 0.55 130 1,645 2 0,475 1 0,475

    0,4 1 0,4 0,55 1 0,55

    0,467

    pp

    p p p n z p pz

    n p p p pz

    = = = = == + = = = +

    =

  • 7A partir de la tabla correspondiente (vase Notas), se puede determinar que un valor de 1 0, 467z =corresponde a una potencia en torno al 6570 %. Utilizando las tablas de la distribucin normal, se sabeque la potencia es del 68 %, es decir, el estudio tendra un 68 % de posibilidades de detectar una mejora enla eficacia del tratamiento del 15 %.

    ANALISIS CUALITATIVOSEjercicios resueltos