Clase 02. parametros y estadistica en epidemiologia

Dr. Cristian Díaz Vélez

Epidemiología Clínica

Escuela de Medicina-USAT

Cristian Díaz Vélez 2

Recuerdo de estadística

Intervalo de confianza

Inferencia estadística



La estimación tiene como finalidad aproximarse al conocimiento de ciertas características de la población: los parámetros.

Un parámetro es un número que resume alguna característica de la población, usualmente designado con letras griegas: :media, :desviación estándar, : proporción

Los parámetros se estiman a partir de las muestras por medio de las estadísticas, éstas son cálculos en base a los datos provenientes de la muestra.



La Función Normal estándar tiene(media)=0 y (desviación estándar) =1

Esto significa que entre -1.96 y 1.96, se tiene al

95 % de la distribución normal estándar


Es el procedimiento que permite llegar aconclusiones acerca de una población a partirde la información que se obtiene de unamuestra seleccionada de esa población.

Se puede inferir a cerca de :

Parámetros poblacionales

Relaciones entre variables

Predicción de resultados



Estimación puntual: Es un solo valor numéricoutilizado para estimar el parámetrocorrespondiente de la población.

Estimación por intervalos : Consta de dos valoresnuméricos que definen un intervalo que, conun grado específico de confianza, incluye alparámetro por estimar.


Se desea conocer los niveles de glicemia de los habitantes de un pueblo

Se tomo una muestra de sangre de cada habitante del pueblo

Se calcula el promedio y la desviación estándar



70

80

90

100

110

75

85

95

195

100

Nivel de glicemia

μ =100

σ = 35.6

Estimación puntual:

La glicemia promedio de

la población es 100 mg/dl

Estimación de intervalo:

El IC es igual a μ ± Z(σ /√n)

El IC: 100 ± 1.96 (35.6/ √100)

: (93 , 107)

Con una confianza de 95% el verdadero

valor de la glicemia promedio de los

habitantes se halla entre 93 a 107 mg/dl.

Es el intervalo que contiene con determinada confianza al valor del parámetro poblacional, que se desea estimar.


XX - (Z(σ /√n) X + (Z(σ /√n)



Se sospecha que el Valor del Sodio sérico de lospacientes con Tuberculosis Miliar es diferente dela población general

Se sustenta esta suposición en la observación de 3 pacientes que tienen la concentración de sodio sérico menos de 140 meq/l.

El valor promedio observado de los tres pacientes fue 137.5 meq/l.



Los pasos solo son referenciales

No absolutos

1.- Establecer la Hipótesis (H0 y H1)

2.- Elección de la prueba estadística

3.- Nivel de significación

4.- Aplicación de la prueba

5.- Valor P

6.- La decisión



Las hipótesis estadísticas son expresadas como relación entre variables

Tradicionalmente se denomina:

Hipótesis Nula (H0), aquella que expresa que no hay diferencia

Hipótesis Alterna (H1), aquella que expresa que hay diferencia o asociación entre variables


Ante la sospecha que el Valor del Sodio sérico de los pacientes con Tuberculosis Miliar es diferente de la población general. La hipótesis a evaluar :

H0: El nivel del sodio sérico en pacientes con tuberculosis miliar no difiere de la población general.

H1: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general.


Eficacia y seguridad del Tramadol

subcutáneo vs

endovenoso en el manejo del dolor

agudo post operatorio

en pacientes traumatológicos

22Cristian Díaz Vélez

La Eficacia y seguridad del Tramadol subcutáneo es igual al

endovenoso en el manejo del dolor agudo post operatorio


La Eficacia y seguridad del Tramadol subcutáneo es mayor al



La Eficacia y seguridad del Tramadol subcutáneo es igual al



La Eficacia y seguridad del Tramadol subcutáneo son diferentes

al endovenoso en el manejo del dolor agudo post operatorio


Contraste Unilateral

Contraste Bilateral

Nivel de significancia: 95%23Cristian Díaz Vélez

Supongamos que en estudio se obtuvo t = 0,03

Entonces es 3%, como se uso nivel de significancia 95% (p<0,05)

Vemos que el 3% (1,5% a cada lado de la cola) es menor de 5% y estaría

en el área sombreada

Conclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna


Cuanto más grande sea la diferencia entre lasdos variables, más fácil es demostrar que ladiferencia es significativa.

Cuanto más grande es el tamaño muestral másfácil es detectar diferencias entre los grupos.



Existen más de 300 pruebas estadísticas básicas.

Hay dos clases de pruebas estadísticas: Lasparamétricas y las no paramétricas.


Los valores de la variable dependiente sigan ladistribución de la curva normal. La muestra en la quese hizo la investigación.

Las varianzas de los grupos que se comparan en unavariable dependiente sean aproximadamente iguales(homogeneidad de las varianzas).

La variable dependiente esté medida en una escala quesea por lo menos de intervalo, aunque este últimorequisito no es compartido por todos los estadísticos.

Cuando los datos cumplen con los requisitos indicados,especialmente con los dos primeros, las pruebasestadísticas paramétricas exhiben su máximo poder.


Las pruebas estadísticas no paramétricas, encambio, no hacen a los datos ninguna de lasexigencias que les hacen las pruebasestadísticas paramétricas; por eso se lesdenomina "pruebas estadísticas libres dedistribución".

Todas estas pruebas poseen menos poder quelas pruebas paramétricas correspondientes,pero han demostrado ser muy útiles comoalternativas cuando no se considera apropiadoel uso de pruebas paramétricas.


Tipo:Categórica/cualitativaNumérica/cuantitativa

Escala:Categórica/cualitativa

Numérica/cuantitativa


Nominal

Ordinal

Razón

Intervalo

Categóricas nominales

Categóricas ordinales

Numéricas proporción

Numéricas intervalo


Dicotómicas

Nominales ppd

Cuantitativas

Ordinales

Variable Dependiente Variable

Independiente

Prueba

Dicotómica Dicotómica z, Chi-2, Fisher

Dicotómica Nominal z, Chi-2, Metha-Patel

Dicotómica Ordinal Mann-Whitney /

Wilcoxon

Dicotómica Cuantitativa Regresión Logística

Nominal Dicotómica z, Chi-2, Metha-Patel

Nominal Cuantitativa Regresión Discriminante

Ordinal Nominal Kruskal-Wallis

Ordinal Cuantitativa Regresión Odds

Proporcional

Cuantitativa Dicotómica t de Student

Cuantitativa Nominal ANOVA

Cuantitativa Cuantitativa Regresión Lineal,

correlacionesCristian Díaz Vélez 32

Identificar una variable dependiente

Ninguna V. ind. Una V. ind. Más de una V. ind.

V. Dep.

Continua

V. Dep.

Ordinal

V. Dep.

Nominal

V. Dep.

Continua

V. Dep.

Ordinal

V. Dep.

Nominal

V. Dep.

Continua

V. Dep.

Ordinal

V. Dep.

Nominal

1 2 3 4 5 6 7 8 9

Para fines estadísticos una variable nominal solo se refiere a dos categorías de una

Característica. Si la característica tiene K categorías, se necesitan K-1 variables.


V. Dependiente

Continua

1

Interés en la

posiciónInterés en la

dispersión

Media

T studentVarianza, DS

Chi2

Coef. Variación

T student


2

Var. Depend.

Ordinal

Interés en la

posiciónInterés en la

dispersión

Mediana

Prueba de WillcoxonAmplitud

intercuartilica


V. Dependiente

nominal

3

Interés en la

posición

Desenlace

común

Proporción Tasa

Aprox. Normal

Poisson

Desenlace

raro

Binomial Poisson

Si No


V. Dependiente

Continua

4

Dif. Medias

T student

Análisis CorrelaciónRegresión lineal

Var. Indep

intencionada

Var. Indep

aleatoria

Interés en la

posiciónNo Si

T student

Prueba F

T student

Z de Fisher


5

Var. Depend.

Ordinal

Var. Indep.

NominalVar. Indep

Ordinal

Mediana

Mann-Whitney

Coef. Correlación

Prueba Sperman


6

Var. Depend.

Nominal

Var. Indep.

NominalVar. Indep.

Ordinal o continua

Datos

apareadosChi2 para

tendencia

Datos

Indep.

P. McNemar Dif. Medias

Chi2

Test Fisher


7

Var. Depend.

Ordinal

Var. Indep.

NominalVar. Indep

Continua o nominal

ANOVA

Factorial

de una via

ANOVA

Medidas

repetidas

Var. Indep

aleatoria

Var. Indep.

continua

Datos

apareados

Datos

Indep.

Prueba F

Student

Prueba F

Student

Var. Indep

intencionada

Var. Indep

aleatoria

Var. Indep

intencionada

Análisis

Regresión

múltiple

Prueba F

F parcial

Análisis

Correlación

múltiple

Prueba F

F parcial

Análisis

Covarianza

(ANCOVA)

Análisis

Correlación

múltiple

Prueba F

F parcial

Prueba F

F parcial


V. Dependiente

ordinal

8

Var. Indep

Nominal

Prueba

Kruskal-Wallis

Datos

Indep.

Datos

pareados

Prueba

Friedman


9

Var. Depend.

Nominal

Var. Indep.

NominalVar. Indep

Continua o nominal

Análisis de

Tablas de vida

Análisis

estratificado

Dependiente

Del tiempo

No dependiente

Del tiempo.

Log-rank Mantel-Haenszel

chi2

Regresión

De Cox

Razón de

Máxima

probabilidad

Regresión

logística

Análisis

discriminante

Dependiente

Del tiempo

No dependiente

Del tiempo.

Razón de

Máxima

probabilidad

Razón de

Máxima

probabilidad




Los valores críticos de los errores en los estudios del área biomédica:

Alfa () menor al 5%

Beta () menor al 20%

La confianza en 95% o mas

La Potencia 80% o mas.

El tamaño de la muestra influye



2.5%No

esperada

2.5%No

esperada

Población Esperada

Región de no rechazoR. Rechazo R. Rechazo

La confianza es de 95%, el error alfa se fija a lo mas en 5%.

De modo similar se fija la potencia del estudio en 80%, por tal el error beta es a lo mas 20%.


La probabilidad de rechazar la hipótesis nula

cuando en realidad es verdadera y es la “p”,

por lo es un riesgo que asume el investigador

de equivocarse al rechazar la hipótesis nula,

cuando en realidad es cierta. Este riesgo se

establece normalmente en 0.05 ó 0.01

Por lo tanto “p” no es un indicador de fuerza

de la asociación ni de su importancia, sino

una probabilidad.

El error de tipo II consiste en aceptar la

hipótesis nula cuando es falsa y esto se

conoce como el error de tipo II o Beta (β ).


Disponer de una teoría que guíe la investigación,evitando el "salir de pesca" con el ordenador buscandoasociaciones entre variables.

Disminuir el número de test estadísticos llevados acabo en el estudio.

Depurar la base de datos para evitar errores de valoresextremos que puedan producir hallazgos significativos.

Utilizar valores de “p” más reducidos (0.01 ó 0.001).

Reproducir el estudio. Si al reproducir el estudio seobtienen resultados similares, estaremos más segurosde no estar cometiendo el error de tipo I.


Incrementar el tamaño de la muestra.

Estimar el poder estadístico del estudio.

Incrementar el valor de “p”.

Utilizar test paramétricos (más potentes) enlugar de test no paramétricos.




El término "estadísticamente significativo"invade la literatura médica y se percibe comouna etiqueta que indicase "garantía de calidad".

Los test de hipótesis son test de significaciónestadística.


La significancia estadística viene dada por el nivel de Significancia (nivel de seguridad) que nos trazamos inicialmente.

- Una seguridad del 95% lleva implícito una p< de 0.05

- Y una seguridad del 99% lleva implícita una p< 0.01.

En conclusión: cuanto más estadísticamentesignificativo sea, es menos probable de cometerel error tipo I.

Al el error tipo I el error tipo II



Disponemos de 2 tratamientos (A y B). Eltratamiento A lo reciben 25 pacientes y eltratamiento B otros 25 pacientes. 15 pacientesresponden favorablemente al tratamiento A y20 al tratamiento B. ¿Existe diferenciasignificativa entre ambos tratamientos?

Ho (hipótesis nula) = No hay diferencia entreambos tratamientos.Ha (hipótesis alternativa) = Sí existe diferenciaentre ambos tratamientos.

Nivel de significancia: 95%56Cristian Díaz Vélez

t : 0,20

Si ahora la muestra es de 900 pacientes por grupo, se tiene que:

t : 0,043

Por lo tanto los valores de la "p“ o “t” deben ser considerados solo como una guía

y no como base de conclusiones definitivas e irrevocables.



Poder estadístico o potencia estadística.

Es el complemento del error tipo II (1-β).

Es la probabilidad de rechazar la hipótesis nula cuando es realmente falsa.

Representa la capacidad de un test paradetectar como estadísticamente significativasdiferencias o asociaciones de una magnituddeterminada.


El tamaño del efecto a detectar:

> tamaño del efecto relevancia clínica.

> probabilidad hallazgos significativos

> poder estadístico.

Variabilidad:

> variabilidad

< probabilidad obtener diferencias

< poder estadístico.


El tamaño de la muestra:> muestra> potencia estadística.

El nivel de significación estadística.valor α poder estadístico

Es decir, si disminuimos la probabilidad de cometer un errorde tipo I aumentamos simultáneamente la probabilidad de unerror de tipo II, por lo que se trata de encontrar un punto de“equilibrio” entre ambas.

Generalmente, se suele trabajar con un poder en torno al 80% o al 90%.





Cristian Díaz Vélez

Para EVALUAR las hipótesis establecidas se debe realizar un estudio.

Se toma una muestra de 25 pacientes con tuberculosis miliar y se realizará el dosaje de Na+ sérico.

Entonces se comparará una muestra contra una población con parámetros conocidos

65

Cristian Díaz Vélez

n

xz

66

Con los valores obtenidos, se calcula el estadístico de prueba

Se trata de evaluar cuanto se asemejan los datos a lo que teóricamente sería la distribución si la hipótesis nula es verdadera


Si se tomó una muestra de 25 individuos

Se sabe que en la población el sodio tiene una tipo Normal con = 140 meq/l, y = 2.5 meq/l.

¿ Como sería el cálculo de la prueba Z ?


n

xz


138 - 140

Z = ---------------

2.5/ √25

Z = - 4

El valor de la prueba

para este ejercicio es

Z = -4


El valor p , es la probabilidad de que por azar obtengamos un resultado como el tenemos en frente o mas extremo, asumiendo que no hay diferencia entre la población y la muestra estudiada.



-4

La probabilidad de obtener -4 o aun menos por Azar:0.0001


Luego de obtener los resultados se puedecalcular el p, que es la probabilidad de unresultado tanto o mas extremo que el quehemos encontrado a base de nuestros datos.

Usualmente si cae en la región de rechazo o si pes menor que se rechaza H0


Se tomo una muestra de 25 individuos con tuberculosis miliar

El promedio de Sodio de la muestra resultó en 138 meq/l

¿ 138 es diferente al de la población ?

Tenemos que establecer un criterio para decidir si 138 es un valor esperado de la población general o no.

¿ Cuales son los valores esperados ?



Ocurrió que el valor de Z es -4, lo que corresponde a un valor de p = 0.0001

Dado que ese valor es menor que el valor alfa prefijado.

Se rechaza la hipótesis nula.


Relevancia clínica


La relevancia clínica de un fenómeno va másallá de cálculos aritméticos y está determinadapor el juicio clínico.

La relevancia depende: magnitud de ladiferencia, la gravedad del problema ainvestigar, morbimortalidad generada por elmismo, su coste y por su frecuencia entre otroselementos.


Reducciones del riesgo relativo de 50% casisiempre y de 25% con frecuencia, sonconsideradas como clínicamente relevantesindependientemente de la significaciónestadística.

Ideal: Sea relevante, estadísticamentesignificativo y validez externa.

La práctica de la medicina basada en laevidencia considera el ensayo clínicoaleatorizado como el estándar para valorar laeficacia de las tecnologías sanitarias.

Sackett DL, Haynes RB , Guyatt GH, Tugwell P. Epidemiología clínica. medicina clínica, 2ª ed. Madrid:

Editorial Médica Panamericana; 1994.80Cristian Díaz Vélez

La forma recomendada de presentar losresultados de un ensayo clínico aleatorizado yotros tipos de estudio debe incluir :

La reducción relativa del riesgo (RRR)

La reducción absoluta del riesgo (RAR)

El número necesario de pacientes a tratar parareducir un evento (una muerte, unaenfermedad, etc) (NNT).

Sackett DL, Richarson WS, Rosenberg W, Hynes RB. Evidence-based medicine: how to practice and

teach EBM. 2nd ed. London: Churchill-livingstone; 2000.81Cristian Díaz Vélez

El riesgo relativo, que es el cociente entre losexpuestos al nuevo tratamiento o actividadpreventiva y los no expuestos, es en este caso.

La RRR es el complemento del RR (1-RR)

La reducción absoluta del riesgo (RAR) es laresta de las rptas. a los tratamientos.


Documents

Clase 02. parametros y estadistica en epidemiologia