23
Curso de Bioestadística Parte 14 Análisis de datos binarios pareados Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya-Salvatierra Universidad de Guanajuato México

Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

  • Upload
    niyati

  • View
    32

  • Download
    1

Embed Size (px)

DESCRIPTION

Curso de Bioestadística Parte 14 Análisis de datos binarios pareados. Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya-Salvatierra Universidad de Guanajuato México. Presentación. - PowerPoint PPT Presentation

Citation preview

Page 1: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Curso de BioestadísticaParte 14

Análisis de datos binarios pareados

Dr. en C. Nicolás Padilla RaygozaDepartamento de Enfermería y ObstetriciaDivisión Ciencias de la Salud e Ingenierías

Campus Celaya-SalvatierraUniversidad de Guanajuato México

Page 2: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Presentación

Médico Cirujano por la Universidad Autónoma de Guadalajara. Pediatra por el Consejo Mexicano de Certificación en Pediatría. Diplomado en Epidemiología, Escuela de Higiene y Medicina

Tropical de Londres, Universidad de Londres. Master en Ciencias con enfoque en Epidemiología, Atlantic

International University. Doctorado en Ciencias con enfoque en Epidemiología, Atlantic

International University. Profesor Asociado B, Facultad de Enfermería y Obstetricia de

Celaya, Universidad de Guanajuato. [email protected]

Page 3: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Competencias

Conocerá como mostrar datos binarios pareados.

Aplicará prueba de hipótesis para datos binarios pareados – Chi cuadrada de McNemar.

Calculará el intervalo de confianza para datos binarios pareados.

Obtendrá Razón de Momios e intervalos de confianza para estudios de casos y controles pareados.

Page 4: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Introducción

En las partes 12 y 13 conocimos los métodos para comparar dos proporciones estimadas de muestras independientes.

Si las observaciones en un estudio no son independientes, necesitamos usar métodos diferentes.

Con frecuencia usamos dos tipos de estudios que dan lugar a observaciones que no son independientes: Observaciones repetidas en el mismo individuo  Estudios casos y controles pareados

Page 5: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Ejemplo

Tuberculosis puede ser diagnosticada por sembrar medios de cultivo y observando si Mycobacterium tuberculosis crece.

En un experimento para comparar dos medios de cultivo para el diagnóstico de tuberculosis, muestras de esputo de 100 pacientes con tuberculosis fueron sembrados en los dos medios.

La mitad de la muestra fue sembrada en el medio A y la otra mitad en el medio B.

Page 6: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Ejemplo

En un estudio en Nueva Zelanda, para examinar la relación entre cáncer de mama y el uso de anticonceptivos orales, mujeres con cáncer de mama fueron pareadas a mujeres de edad similar quienes no tenían cáncer de mama, seleccionadas de los registros electorales.  

Esto es un ejemplo de un estudio de casos-controles donde cada individuo con cáncer de mama es pareado con un individuo sin la enfermedad pero de edad similar, para controlar el efecto potencial confusor de edad.

Page 7: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Mostrando datos categóricos pareados Usar las pruebas de z o de Chi cuadrada para datos

pareados sería algo erróneo, ya que no tomaríamos en cuenta la naturaleza pareada de los datos.

Paciente Medio A

Medio B

1 - -

2 - -

3 + +

4 + -

5 + +

6 - -

7 - +

8 - -

9 - -

10 - -

11 + -

12 + +

13 + -

14 + +

15 + -

Paciente Medio A

Medio B

16 + +

17 + +

18 - -

19 - -

20 + -

21 - -

22 + +

23 + +

24 + +

25 + -

26 - -

27 + +

28 - -

29 + +

30 + +

Paciente Medio A

Medio B

31 - -

32 + +

33 + +

34 + -

35 - -

36 + +

37 + +

38 + -

39 + +

40 + -

41 + -

42 + +

43 - -

44 + +

45 + -

Paciente

Medio A

Medio B

46 + +

47 - -

48 + -

49 - -

50 - +

Page 8: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Mostrando datos categóricos pareados

Paciente Medio A

Medio B

51 - -

52 - -

53 + +

54 + -

55 + +

56 - -

57 - +

58 - -

59 - -

60 - -

61 + -

62 + +

63 + -

64 + +

65 + -

Paciente Medio A

Medio B

66 + +

67 + +

68 - -

69 - -

70 + -

71 - -

72 + +

73 + +

74 + +

75 + -

76 - -

77 + +

78 - -

79 + +

80 + +

Paciente Medio A

Medio B

81 - -

82 + +

83 + +

84 + -

85 - -

86 + +

87 + +

88 + -

89 + +

90 + -

91 + -

92 + +

93 - -

94 + +

95 + -

Paciente Medio A

Medio B

96 + +

97 - -

98 + -

99 - -

100 - +

Page 9: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Mostrando datos categóricos pareados El experimento comparó la capacidad de cada medio de cultivo para

detectar Mycobacterium tuberculosis. Los resultados fueron positivos (+) o negativos (-). Estamos interesados en comparar los especimenes encontrados

positivos por los dos medios de cultivo. La tabla resume los resultados.

Medio de cultivo

+ - Total

A 64 36 100

B 44 56 100

Page 10: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Mostrando datos categóricos pareados De esto, ¿piensas que el medio A es mejor que el B para detectar el

bacilo tuberculoso?   Para hacer un análisis adecuado, necesitamos comparar los resultados

con los dos medios en cada sujeto. Hay cuatro combinaciones de resultados que podrían ocurrir en cada

sujeto.

Combinación Medio A Medio B Pares

1 + + k

2 + - r

3 - + s

4 - - m

Page 11: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Mostrando datos categóricos pareados Para comparar los resultados en cada sujeto, necesitamos contar

cuantas veces ocurre cada combinación. Una forma fácil de mostrar los valores es tabular los resultados de una

muestra contra la otra.

Medios B+

B-

A + k r k + r

A - s m s + m

k + s r + m N

Page 12: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Mostrando datos categóricos pareados Los pares que son del mismo resultado son pares concordantes, y

estos no dan información acerca de cual medio es mejor en detectar el bacilo tuberculoso.

De los restantes los resultados fueron diferentes entre los dos medios: 24 fueron positivos para el medio A y negativos para el B.  4 fueron negativos para el A y positivos para el B.

Las pares cuyos resultados fueron diferentes entre ambos medios, se llaman pares discordantes. 

Medios B+

B-

A + 40 24 64

A - 4 32 36

44 56 100

Page 13: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Prueba de hipótesis para datos binarios pareados Si no hubiera diferencia entre los medios, deberíamos esperar número

similares de r y s, o sea r ≈ s Podemos usar una prueba llamada McNemar para evaluar si la

diferencia entre los números de los pares discordantes es mayor de lo que esperaríamos por azar.

Para probar la hipótesis nula de que no hay diferencia entre las dos proporciones , usamos la prueba de McNemar:

(|r-s|-1)2

X2pareada= ---------------

r + s

Restando 1 nos permite una corrección continua.

Page 14: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Prueba de hipótesis para datos binarios pareados Para el estudio de los medios de cultivo del bacilo tuberculoso:

24 fueron positivos para el medio A y negativos para el medio B 4 fueron negativos para el medio A y positivos para el medio B

(|r-s|-1)2 (|24-4|-1)2 361

X2pareada= -------------= --------------- = -------- = 12.81 p<0.05

r + s 24 + 4 28

Rechazamos la hipótesis nula de no diferencia entre los medios de cultivo.

Page 15: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Intervalos de confianza para la diferencia de dos proporciones pareadas Sabemos que la diferencia entre proporciones de datos pareados

puede ser calculada por: r – s / N

Donde:  r y s son los números de pares discordantes N es el total de pares El error estándar de la diferencia entre proporciones pareadas es:

√r +s

ES(p1-p2) = -----------

N

Page 16: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Intervalos de confianza para la diferencia de dos proporciones pareadas La fórmula general para calcular los intervalos de confianza al 95% es:

 Estimado ± 1.96 x ES

De la tabla de las pruebas de esputo con dos medios de cultivo, A y B. Usando los valores de r y s, podemos calcular el intervalo de confianza al 95% para la diferencia en proporciones pareadas:

r-s / N ± √r +s/N = 24-4/100±1.96 √24+4/100 = 0.2±0.10 = 0.1 a 0.3 = 10% a 30%-

El intervalo de confianza de 0.1 a 0.3 significa que el porcentaje de cultivos positivos al bacilo de la tuberculosis podría estar entre 10% y 30% más alto con el medio A que con el medio B.

Page 17: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Razón de momios para datos pareados

En estudios de casos y controles, usualmente queremos evaluar el riesgo asociado con la exposición a un factor de riesgo; para estos estudios necesitamos una medida de efecto en lugar de una medida de cambio.

En estudios de casos y controles usamos la RM, que es la razón de las probabilidades de la exposición entre los casos entre la probabilidad de exposición en los controles.

El cálculo de la RM con datos pareados está basado en los pares discordantes, igual que la diferencia entre proporciones de datos pareados.

Page 18: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Razón de momios para datos pareados

Tabla de exposición en casos contra exposición en controles

Controles

Casos Expuestos No expuestos

Expuestos k r

No expuestos s m 

k = número de parejas donde el caso y el control estuvieron expuestos r = número de parejas donde el caso estuvo expuesto y el control no s = número de parejas donde el caso no estuvo expuesto y el control si. m = número de parejas donde los casos y controles no estuvieron

expuestos.

Page 19: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Razón de momios para datos pareados

La razón de momios (RM) es calculada como la razón de los dos grupos de pares discordantes.

r casos expuestos controles no expuestos

RM = ---- = -------------------------------------------------

s casos no expuestos controles expuestos  

Page 20: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Razón de momios para datos pareados

La tabla muestra los resultados de un estudio de casos-controles pareados, diseñado para investigar la asociación entre el uso de anticonceptivos orales (ACO) y tromboembolismo.

 

Controles

Casos Uso ACO No uso ACO

Uso ACO 10 57

NO uso ACO 13 95

Page 21: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Intervalo de confianza para RM pareada

El cálculo del intervalo de confianza es un poco más complicado.

Se calcula usando la raíz cuadrada del valor de X2 de la prueba de McNemar, en lugar del error estándar.

Intervalo de confianza al 95% para RM de datos pareados es: RM1±1.96/ X

Page 22: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Razón de momios para datos pareados

RM = 4.4 X²pareada = 26.41 

Xpareada = 5.14

Entonces el intervalo de confianza al 95% es: De 4.41-1.96/ 5.14 a 4.41+1.96/ 5.14 4.40.62 a 4.41.38 2.5 a 7.7

Page 23: Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Bibliografía

1.- Last JM. A dictionary of epidemiology. New York, 4ª ed. Oxford University Press, 2001:173.

2.- Kirkwood BR. Essentials of medical ststistics. Oxford, Blackwell Science, 1988: 1-4.

3.- Altman DG. Practical statistics for medical research. Boca Ratón, Chapman & Hall/ CRC; 1991: 1-9.