View
3.564
Download
2
Embed Size (px)
Citation preview
Dr. Cristian Díaz Vélez
Epidemiología Clínica
Escuela de Medicina-USAT
Cristian Díaz Vélez 2
Recuerdo de estadística
Intervalo de confianza
Inferencia estadística
Cristian Díaz Vélez 3
Cristian Díaz Vélez 4
La estimación tiene como finalidad aproximarse al conocimiento de ciertas características de la población: los parámetros.
Un parámetro es un número que resume alguna característica de la población, usualmente designado con letras griegas: :media, :desviación estándar, : proporción
Los parámetros se estiman a partir de las muestras por medio de las estadísticas, éstas son cálculos en base a los datos provenientes de la muestra.
Cristian Díaz Vélez 5
Cristian Díaz Vélez 6
La Función Normal estándar tiene(media)=0 y (desviación estándar) =1
Esto significa que entre -1.96 y 1.96, se tiene al
95 % de la distribución normal estándar
Cristian Díaz Vélez 7
Es el procedimiento que permite llegar aconclusiones acerca de una población a partirde la información que se obtiene de unamuestra seleccionada de esa población.
Se puede inferir a cerca de :
Parámetros poblacionales
Relaciones entre variables
Predicción de resultados
Cristian Díaz Vélez 8
Cristian Díaz Vélez 9
Estimación puntual: Es un solo valor numéricoutilizado para estimar el parámetrocorrespondiente de la población.
Estimación por intervalos : Consta de dos valoresnuméricos que definen un intervalo que, conun grado específico de confianza, incluye alparámetro por estimar.
Cristian Díaz Vélez 10
Se desea conocer los niveles de glicemia de los habitantes de un pueblo
Se tomo una muestra de sangre de cada habitante del pueblo
Se calcula el promedio y la desviación estándar
Cristian Díaz Vélez 11
Cristian Díaz Vélez 12
70
80
90
100
110
75
85
95
195
100
Nivel de glicemia
μ =100
σ = 35.6
Estimación puntual:
La glicemia promedio de
la población es 100 mg/dl
Estimación de intervalo:
El IC es igual a μ ± Z(σ /√n)
El IC: 100 ± 1.96 (35.6/ √100)
: (93 , 107)
Con una confianza de 95% el verdadero
valor de la glicemia promedio de los
habitantes se halla entre 93 a 107 mg/dl.
Es el intervalo que contiene con determinada confianza al valor del parámetro poblacional, que se desea estimar.
Cristian Díaz Vélez 13
XX - (Z(σ /√n) X + (Z(σ /√n)
Cristian Díaz Vélez 14
Cristian Díaz Vélez 15
Se sospecha que el Valor del Sodio sérico de lospacientes con Tuberculosis Miliar es diferente dela población general
Se sustenta esta suposición en la observación de 3 pacientes que tienen la concentración de sodio sérico menos de 140 meq/l.
El valor promedio observado de los tres pacientes fue 137.5 meq/l.
Cristian Díaz Vélez 16
Cristian Díaz Vélez 17
Los pasos solo son referenciales
No absolutos
1.- Establecer la Hipótesis (H0 y H1)
2.- Elección de la prueba estadística
3.- Nivel de significación
4.- Aplicación de la prueba
5.- Valor P
6.- La decisión
Cristian Díaz Vélez 18
Cristian Díaz Vélez 19
Las hipótesis estadísticas son expresadas como relación entre variables
Tradicionalmente se denomina:
Hipótesis Nula (H0), aquella que expresa que no hay diferencia
Hipótesis Alterna (H1), aquella que expresa que hay diferencia o asociación entre variables
Cristian Díaz Vélez 20
Ante la sospecha que el Valor del Sodio sérico de los pacientes con Tuberculosis Miliar es diferente de la población general. La hipótesis a evaluar :
H0: El nivel del sodio sérico en pacientes con tuberculosis miliar no difiere de la población general.
H1: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general.
Cristian Díaz Vélez 21
Eficacia y seguridad del Tramadol
subcutáneo vs
endovenoso en el manejo del dolor
agudo post operatorio
en pacientes traumatológicos
22Cristian Díaz Vélez
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
La Eficacia y seguridad del Tramadol subcutáneo es mayor al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
La Eficacia y seguridad del Tramadol subcutáneo son diferentes
al endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
Contraste Unilateral
Contraste Bilateral
Nivel de significancia: 95%23Cristian Díaz Vélez
Supongamos que en estudio se obtuvo t = 0,03
Entonces es 3%, como se uso nivel de significancia 95% (p<0,05)
Vemos que el 3% (1,5% a cada lado de la cola) es menor de 5% y estaría
en el área sombreada
Conclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna
24Cristian Díaz Vélez
Cuanto más grande sea la diferencia entre lasdos variables, más fácil es demostrar que ladiferencia es significativa.
Cuanto más grande es el tamaño muestral másfácil es detectar diferencias entre los grupos.
25Cristian Díaz Vélez
Cristian Díaz Vélez 26
Existen más de 300 pruebas estadísticas básicas.
Hay dos clases de pruebas estadísticas: Lasparamétricas y las no paramétricas.
Cristian Díaz Vélez 27
Los valores de la variable dependiente sigan ladistribución de la curva normal. La muestra en la quese hizo la investigación.
Las varianzas de los grupos que se comparan en unavariable dependiente sean aproximadamente iguales(homogeneidad de las varianzas).
La variable dependiente esté medida en una escala quesea por lo menos de intervalo, aunque este últimorequisito no es compartido por todos los estadísticos.
Cuando los datos cumplen con los requisitos indicados,especialmente con los dos primeros, las pruebasestadísticas paramétricas exhiben su máximo poder.
Cristian Díaz Vélez 28
Las pruebas estadísticas no paramétricas, encambio, no hacen a los datos ninguna de lasexigencias que les hacen las pruebasestadísticas paramétricas; por eso se lesdenomina "pruebas estadísticas libres dedistribución".
Todas estas pruebas poseen menos poder quelas pruebas paramétricas correspondientes,pero han demostrado ser muy útiles comoalternativas cuando no se considera apropiadoel uso de pruebas paramétricas.
Cristian Díaz Vélez 29
Tipo:Categórica/cualitativaNumérica/cuantitativa
Escala:Categórica/cualitativa
Numérica/cuantitativa
Cristian Díaz Vélez 30
Nominal
Ordinal
Razón
Intervalo
Categóricas nominales
Categóricas ordinales
Numéricas proporción
Numéricas intervalo
Cristian Díaz Vélez 31
Dicotómicas
Nominales ppd
Cuantitativas
Ordinales
Variable Dependiente Variable
Independiente
Prueba
Dicotómica Dicotómica z, Chi-2, Fisher
Dicotómica Nominal z, Chi-2, Metha-Patel
Dicotómica Ordinal Mann-Whitney /
Wilcoxon
Dicotómica Cuantitativa Regresión Logística
Nominal Dicotómica z, Chi-2, Metha-Patel
Nominal Cuantitativa Regresión Discriminante
Ordinal Nominal Kruskal-Wallis
Ordinal Cuantitativa Regresión Odds
Proporcional
Cuantitativa Dicotómica t de Student
Cuantitativa Nominal ANOVA
Cuantitativa Cuantitativa Regresión Lineal,
correlacionesCristian Díaz Vélez 32
Identificar una variable dependiente
Ninguna V. ind. Una V. ind. Más de una V. ind.
V. Dep.
Continua
V. Dep.
Ordinal
V. Dep.
Nominal
V. Dep.
Continua
V. Dep.
Ordinal
V. Dep.
Nominal
V. Dep.
Continua
V. Dep.
Ordinal
V. Dep.
Nominal
1 2 3 4 5 6 7 8 9
Para fines estadísticos una variable nominal solo se refiere a dos categorías de una
Característica. Si la característica tiene K categorías, se necesitan K-1 variables.
Cristian Díaz Vélez 33
V. Dependiente
Continua
1
Interés en la
posiciónInterés en la
dispersión
Media
T studentVarianza, DS
Chi2
Coef. Variación
T student
Cristian Díaz Vélez 34
2
Var. Depend.
Ordinal
Interés en la
posiciónInterés en la
dispersión
Mediana
Prueba de WillcoxonAmplitud
intercuartilica
Cristian Díaz Vélez 35
V. Dependiente
nominal
3
Interés en la
posición
Desenlace
común
Proporción Tasa
Aprox. Normal
Poisson
Desenlace
raro
Binomial Poisson
Si No
Cristian Díaz Vélez 36
V. Dependiente
Continua
4
Dif. Medias
T student
Análisis CorrelaciónRegresión lineal
Var. Indep
intencionada
Var. Indep
aleatoria
Interés en la
posiciónNo Si
T student
Prueba F
T student
Z de Fisher
Cristian Díaz Vélez 37
5
Var. Depend.
Ordinal
Var. Indep.
NominalVar. Indep
Ordinal
Mediana
Mann-Whitney
Coef. Correlación
Prueba Sperman
Cristian Díaz Vélez 38
6
Var. Depend.
Nominal
Var. Indep.
NominalVar. Indep.
Ordinal o continua
Datos
apareadosChi2 para
tendencia
Datos
Indep.
P. McNemar Dif. Medias
Chi2
Test Fisher
Cristian Díaz Vélez 39
7
Var. Depend.
Ordinal
Var. Indep.
NominalVar. Indep
Continua o nominal
ANOVA
Factorial
de una via
ANOVA
Medidas
repetidas
Var. Indep
aleatoria
Var. Indep.
continua
Datos
apareados
Datos
Indep.
Prueba F
Student
Prueba F
Student
Var. Indep
intencionada
Var. Indep
aleatoria
Var. Indep
intencionada
Análisis
Regresión
múltiple
Prueba F
F parcial
Análisis
Correlación
múltiple
Prueba F
F parcial
Análisis
Covarianza
(ANCOVA)
Análisis
Correlación
múltiple
Prueba F
F parcial
Prueba F
F parcial
Cristian Díaz Vélez 40
V. Dependiente
ordinal
8
Var. Indep
Nominal
Prueba
Kruskal-Wallis
Datos
Indep.
Datos
pareados
Prueba
Friedman
Cristian Díaz Vélez 41
9
Var. Depend.
Nominal
Var. Indep.
NominalVar. Indep
Continua o nominal
Análisis de
Tablas de vida
Análisis
estratificado
Dependiente
Del tiempo
No dependiente
Del tiempo.
Log-rank Mantel-Haenszel
chi2
Regresión
De Cox
Razón de
Máxima
probabilidad
Regresión
logística
Análisis
discriminante
Dependiente
Del tiempo
No dependiente
Del tiempo.
Razón de
Máxima
probabilidad
Razón de
Máxima
probabilidad
Cristian Díaz Vélez 42
Cristian Díaz Vélez 43
Cristian Díaz Vélez 44
Los valores críticos de los errores en los estudios del área biomédica:
Alfa () menor al 5%
Beta () menor al 20%
La confianza en 95% o mas
La Potencia 80% o mas.
El tamaño de la muestra influye
Cristian Díaz Vélez 45
Cristian Díaz Vélez 46
2.5%No
esperada
2.5%No
esperada
Población Esperada
Región de no rechazoR. Rechazo R. Rechazo
La confianza es de 95%, el error alfa se fija a lo mas en 5%.
De modo similar se fija la potencia del estudio en 80%, por tal el error beta es a lo mas 20%.
Cristian Díaz Vélez 47
La probabilidad de rechazar la hipótesis nula
cuando en realidad es verdadera y es la “p”,
por lo es un riesgo que asume el investigador
de equivocarse al rechazar la hipótesis nula,
cuando en realidad es cierta. Este riesgo se
establece normalmente en 0.05 ó 0.01
Por lo tanto “p” no es un indicador de fuerza
de la asociación ni de su importancia, sino
una probabilidad.
El error de tipo II consiste en aceptar la
hipótesis nula cuando es falsa y esto se
conoce como el error de tipo II o Beta (β ).
48Cristian Díaz Vélez
Disponer de una teoría que guíe la investigación,evitando el "salir de pesca" con el ordenador buscandoasociaciones entre variables.
Disminuir el número de test estadísticos llevados acabo en el estudio.
Depurar la base de datos para evitar errores de valoresextremos que puedan producir hallazgos significativos.
Utilizar valores de “p” más reducidos (0.01 ó 0.001).
Reproducir el estudio. Si al reproducir el estudio seobtienen resultados similares, estaremos más segurosde no estar cometiendo el error de tipo I.
49Cristian Díaz Vélez
Incrementar el tamaño de la muestra.
Estimar el poder estadístico del estudio.
Incrementar el valor de “p”.
Utilizar test paramétricos (más potentes) enlugar de test no paramétricos.
50Cristian Díaz Vélez
51Cristian Díaz Vélez
52Cristian Díaz Vélez
El término "estadísticamente significativo"invade la literatura médica y se percibe comouna etiqueta que indicase "garantía de calidad".
Los test de hipótesis son test de significaciónestadística.
53Cristian Díaz Vélez
La significancia estadística viene dada por el nivel de Significancia (nivel de seguridad) que nos trazamos inicialmente.
- Una seguridad del 95% lleva implícito una p< de 0.05
- Y una seguridad del 99% lleva implícita una p< 0.01.
En conclusión: cuanto más estadísticamentesignificativo sea, es menos probable de cometerel error tipo I.
Al el error tipo I el error tipo II
54Cristian Díaz Vélez
55Cristian Díaz Vélez
Disponemos de 2 tratamientos (A y B). Eltratamiento A lo reciben 25 pacientes y eltratamiento B otros 25 pacientes. 15 pacientesresponden favorablemente al tratamiento A y20 al tratamiento B. ¿Existe diferenciasignificativa entre ambos tratamientos?
Ho (hipótesis nula) = No hay diferencia entreambos tratamientos.Ha (hipótesis alternativa) = Sí existe diferenciaentre ambos tratamientos.
Nivel de significancia: 95%56Cristian Díaz Vélez
t : 0,20
Si ahora la muestra es de 900 pacientes por grupo, se tiene que:
t : 0,043
Por lo tanto los valores de la "p“ o “t” deben ser considerados solo como una guía
y no como base de conclusiones definitivas e irrevocables.
57Cristian Díaz Vélez
58Cristian Díaz Vélez
Poder estadístico o potencia estadística.
Es el complemento del error tipo II (1-β).
Es la probabilidad de rechazar la hipótesis nula cuando es realmente falsa.
Representa la capacidad de un test paradetectar como estadísticamente significativasdiferencias o asociaciones de una magnituddeterminada.
59Cristian Díaz Vélez
El tamaño del efecto a detectar:
> tamaño del efecto relevancia clínica.
> probabilidad hallazgos significativos
> poder estadístico.
Variabilidad:
> variabilidad
< probabilidad obtener diferencias
< poder estadístico.
60Cristian Díaz Vélez
El tamaño de la muestra:> muestra> potencia estadística.
El nivel de significación estadística.valor α poder estadístico
Es decir, si disminuimos la probabilidad de cometer un errorde tipo I aumentamos simultáneamente la probabilidad de unerror de tipo II, por lo que se trata de encontrar un punto de“equilibrio” entre ambas.
Generalmente, se suele trabajar con un poder en torno al 80% o al 90%.
61Cristian Díaz Vélez
62Cristian Díaz Vélez
63Cristian Díaz Vélez
Cristian Díaz Vélez 64
Cristian Díaz Vélez
Para EVALUAR las hipótesis establecidas se debe realizar un estudio.
Se toma una muestra de 25 pacientes con tuberculosis miliar y se realizará el dosaje de Na+ sérico.
Entonces se comparará una muestra contra una población con parámetros conocidos
65
Cristian Díaz Vélez
n
xz
66
Con los valores obtenidos, se calcula el estadístico de prueba
Se trata de evaluar cuanto se asemejan los datos a lo que teóricamente sería la distribución si la hipótesis nula es verdadera
Cristian Díaz Vélez 67
Si se tomó una muestra de 25 individuos
Se sabe que en la población el sodio tiene una tipo Normal con = 140 meq/l, y = 2.5 meq/l.
¿ Como sería el cálculo de la prueba Z ?
Cristian Díaz Vélez 68
n
xz
Cristian Díaz Vélez 69
138 - 140
Z = ---------------
2.5/ √25
Z = - 4
El valor de la prueba
para este ejercicio es
Z = -4
Cristian Díaz Vélez 70
El valor p , es la probabilidad de que por azar obtengamos un resultado como el tenemos en frente o mas extremo, asumiendo que no hay diferencia entre la población y la muestra estudiada.
Cristian Díaz Vélez 71
Cristian Díaz Vélez 72
-4
La probabilidad de obtener -4 o aun menos por Azar:0.0001
Cristian Díaz Vélez 73
Luego de obtener los resultados se puedecalcular el p, que es la probabilidad de unresultado tanto o mas extremo que el quehemos encontrado a base de nuestros datos.
Usualmente si cae en la región de rechazo o si pes menor que se rechaza H0
Cristian Díaz Vélez 74
Se tomo una muestra de 25 individuos con tuberculosis miliar
El promedio de Sodio de la muestra resultó en 138 meq/l
¿ 138 es diferente al de la población ?
Tenemos que establecer un criterio para decidir si 138 es un valor esperado de la población general o no.
¿ Cuales son los valores esperados ?
Cristian Díaz Vélez 75
Cristian Díaz Vélez 76
Ocurrió que el valor de Z es -4, lo que corresponde a un valor de p = 0.0001
Dado que ese valor es menor que el valor alfa prefijado.
Se rechaza la hipótesis nula.
Cristian Díaz Vélez 77
Relevancia clínica
78Cristian Díaz Vélez
La relevancia clínica de un fenómeno va másallá de cálculos aritméticos y está determinadapor el juicio clínico.
La relevancia depende: magnitud de ladiferencia, la gravedad del problema ainvestigar, morbimortalidad generada por elmismo, su coste y por su frecuencia entre otroselementos.
79Cristian Díaz Vélez
Reducciones del riesgo relativo de 50% casisiempre y de 25% con frecuencia, sonconsideradas como clínicamente relevantesindependientemente de la significaciónestadística.
Ideal: Sea relevante, estadísticamentesignificativo y validez externa.
La práctica de la medicina basada en laevidencia considera el ensayo clínicoaleatorizado como el estándar para valorar laeficacia de las tecnologías sanitarias.
Sackett DL, Haynes RB , Guyatt GH, Tugwell P. Epidemiología clínica. medicina clínica, 2ª ed. Madrid:
Editorial Médica Panamericana; 1994.80Cristian Díaz Vélez
La forma recomendada de presentar losresultados de un ensayo clínico aleatorizado yotros tipos de estudio debe incluir :
La reducción relativa del riesgo (RRR)
La reducción absoluta del riesgo (RAR)
El número necesario de pacientes a tratar parareducir un evento (una muerte, unaenfermedad, etc) (NNT).
Sackett DL, Richarson WS, Rosenberg W, Hynes RB. Evidence-based medicine: how to practice and
teach EBM. 2nd ed. London: Churchill-livingstone; 2000.81Cristian Díaz Vélez
El riesgo relativo, que es el cociente entre losexpuestos al nuevo tratamiento o actividadpreventiva y los no expuestos, es en este caso.
La RRR es el complemento del RR (1-RR)
La reducción absoluta del riesgo (RAR) es laresta de las rptas. a los tratamientos.
82Cristian Díaz Vélez