Técnicas graficas de exploración de datos

TÉCNICAS GRAFICAS DE EXPLORACIÓN DE DATOS

Estadística en el laboratorio

Técnicas graficas de exploración

• Histogramas– Gráfico de barras que representa una distribución

de frecuencia.– La altura de cada una de las barras representa la

frecuencia de la observación identificada en el eje horizontal (x).


• HistogramasHistogram (DATA BN 6v*1043c)

Produccion (cajas/ha) = 938*5*normal(x; 30,1078; 7,0483)

5 10 15 20 25 30 35 40 45 50 55 60 65 70

Produccion (cajas/ha)

0

20

40

60

80

100

120

140

160

180

200

220

240

260

280

No

of

ob

s

Produccion (cajas/ha): N = 938, Mean = 30,1078305, StdDv = 7,04828092, Max = 61,3333333, Min = 14,0166667


• Gráfico de probabilidades– Es un histograma que muestra el número de veces

que un resultado dado estuvo dentro de un rango específico, centrado alrededor de un valor medio.


• Gráfico de probabilidadesHistogram (DATA BN 6v*1043c)

Produccion (cajas/ha) = 938*5*normal(x; 30,1078; 7,0483)

5 10 15 20 25 30 35 40 45 50 55 60 65 70

Produccion (cajas/ha)

0

20

40

60

80

100

120

140

160

180

200

220

240

260

280

No

of

ob

s

Produccion (cajas/ha): N = 938, Mean = 30,1078305, StdDv = 7,04828092, Max = 61,3333333, Min = 14,0166667


• Correlaciones– Nos ayuda a determinar si dos variables aleatorias

son interdependientes.– Resulta de interés el conocer si existen alguna

relación entre nuestra variables.– La herramienta estadística para este tipo de

análisis son las correlaciones.– El método más común se basa en el coeficiente de

Pearson.


• Correlaciones


• Correlaciones

HAGAMOS UN EJERCICIOApliquemos la estadística

Ejercicio 1: Evaluemos un método

• Pensemos en la comparación de un nuevo método de análisis con uno tradicional

• La pregunta es: ¿Cuál es el mejor?• Mejor: menor error, menor límite de

detección, menor tiempo de análisis, etc.• ¿Cómo lo haría?• ¿Por donde partimos?

Ejercicio 1: Evaluemos un método• Resulta claro que es necesario un diseño experimental.

• Sin embargo, en base a su diseño:

– ¿Ha logrado comparar el desempeño de ambos métodos para el análisis de la muestra?

– O– ¿Ha logrado comparar el desempeño del analista para el uso de ambos

métodos? (Dado que es claro que el analista poseía más experiencia en su método que en el tradicional)

• De aquí la importancia de realizar los experimentos con un adecuado diseño.

Química y ciencia

• La ciencia práctica no debe iniciar con la colección de datos, sino con una hipótesis acerca de un problema o técnica.

• La data a ser colectada deber ser relevante para responder al problema o probar la hipótesis.

• Una mala selección de los parámetros a evaluar resultará en un costo innecesario.

• Un experimento correctamente realizado, nos permite identificar parámetros redundantes que serán omitidos en futuros análisis.

Calidad de resultados• La calidad de cualquier resultado es dependiente de la muestra

utilizada.

• No existe técnica estadística que “recupere” un dato mal levantado.

• El resultado de cualquier análisis estadístico es solo tan bueno como la calidad de los datos utilizados.

• De aquí la importancia de contar con una muestra representativa y un adecuado diseño.

• En casos donde el diseño experimental no es aplicable (ej. monitoreo ambiental), la muestra debe ser representativa del sistema.

Calidad de resultados

• Entonces, la pregunta inicial sería:– ¿Cuál es el propósito del experimento, y qué propongo

como resultado?

• Pregunta que deberá ser transformada en una hipótesis.

• Finalmente la hipótesis deberá ser evaluada en base a técnicas estadísticas apropiadas e identificadas a priori.

Calidad de resultados

• Sin embargo, siempre es posible “torturar” sus datos, a fin de “escuchar” lo que desean.

• Sin embargo, resultados obtenidos en base a una “tortura” estadística suelen ser difíciles de defender ante expertos (eg. transformaciones).

• Mucho mejor cuando un correcto diseño y adecuados métodos son utilizados para dejar “hablar” por sí solos a sus datos.

FUENTES DE ERROREvaluación estadística de datos

Fuentes de error

• Una vez realizado el análisis químico, el resultado final será un valor, que predominantemente cuantifica los niveles de un parámetro de interés.

• Sin embargo, ése valor está sujeto a variables que pueden incidir en su magnitud (i.e. fuentes de error).

• Por tal motivo, consientes de la variabilidad en la naturaleza, es necesario contar con una medida de ese error o incertidumbre en la medida.

Fuentes de error

• Es importante también no sólo conformarse con el resultado arrojado por la estadística, sino también confrontar ese resultado con la población de la cual fue obtenido.

– Ej. Se calcula el promedio de la estatura de los estudiantes del presente curso, y se determina una media de 296 cm.

– ¿Lo aceptamos?

– Es necesario confrontar ese valor con lo que nosotros observamos en base a un criterio experto en la población.

Principales tipos de error

• Los científicos generalmente consideran tres tipos de error:– Errores groseros o accidentales– Errores sistemáticos– Errores aleatorios.


• Errores groseros– Causados por un daño en el equipo tales como

fallas de voltaje, daño en la lámpara, contaminación severa de la muestra, soluciones contaminadas, etc.

– Un error de este tipo en el experimento DEBE anular completamente los resultados

– Sin embargo, ¿cómo los detectamos si no contamos con una réplica?


• Errores sistemáticos:– Debidos a imperfecciones en el procedimiento, que

conllevan un bias en la data (ej. datos superiores o inferiores)

– Surgen por pobre calibración de instrumentos o uso incorrecto de la vidriería para medición de volúmenes.

– Este tipo de errores pueden ser constantes o proporcionales.

– Generalmente de fácil detección por medios gráficos (ej. recta de calibración).

– Difíciles de detectar cuando existen errores sistemáticos positivos y negativos !


• Principales tipos de errores sistemáticos:– De muestreo, en cuyo caso la muestra no es

representativa de la población– Error del método, debido a sus limitaciones– Errores de medida, debido a la tolerancia de los

instrumentos utilizados (ej. 25mL +/- 0.03mL)– Errores personales, debido a los sesgos

introducidos por el analista


• Principales tipos de errores sistemáticos:– Error sistemático constante, cuyo valor es igual

en todas las muestras.– Error sistemático proporcional, cuyo valor

depende de la cantidad de muestra analizada


• Errores aleatorios (o ruido):– Generan resultados dispersos alrededor del valor

promedio.– Mientras mayor la aleatoriedad mayor la

dispersión.– Generalmente no tenemos control sobre ellos.– Pudiendo afectar la precisión (Reproductibilidad)

de los resultados experimentales.– Nuestro objetivo: reducirlos.– La precisión es determinada a partir de réplicas.

Algunos términos comunes

• Generalmente referidos en laboratorio:– Exactitud– Precisión– Dentro de rachas (Within-run)– Entre rachas (Between-run)– Repetitividad– Reproducibilidad


• Exactitud:– Decimos que un resultado es exacto cuando las

mediciones realizadas son cercanas al valor real (patrón).

– La ISO define exactitud como el grado de concordancia entre el resultado de un ensayo y el valor de referencia aceptado del analito.

– Esto implica que los errores sistemáticos son mínimos.


• Precisión:– Decimos que un análisis es preciso cuando las

mediciones realizadas poseen una pequeña dispersión de sus valores.

– Por lo tanto, es una medida de la reproducibilidad.

– Es decir que los errores aleatorios son mínimos.


• Within-run:– Conjunto de mediciones realizadas en secuencia

en el mismo laboratorio utilizando el mismo equipo.


• Between-run:– Conjunto de mediciones realizadas en diferentes

ocasiones, posiblemente en diferentes laboratorios y bajo diferentes circunstancias


• Repetitividad:– Una medida de la precisión de dentro de rachas

(within-run).

• Reproducibilidad:– Una medida de la precisión de entre rachas

(between-run).

PRECISIÓN Y EXACTITUDEvaluación estadística de datos

Precisión y exactitud

• Para la química analítica, es vital realizar mediciones analíticas que provean resultados precisos y exactos.

• Incluso, la calidad de la información puede ser evaluada mediante su precisión y exactitud.

• La exactitud puede ser definida como la habilidad del resultado medido de ser igual al valor verdadero en la data [E= - x̄� ].

Midiendo la exactitud y la precisión

• Exactitud:– Evaluada en base al valor promedio.

• Precisión:– Evaluada en base a la desviación estándar.


• Cuatro principales escenarios de precisión y exactitud para los resultados:


• En química analítica, se suele dar prioridad a la precisión más que a la exactitud.

• Los resultados obtenidos con precisión podrían ser corregidos mediante comparación con estándares.

• En cambio, resultados con baja precisión no pueden ser corregidos posteriormente.

Midiendo la exactitud y la precisión• ¿Cómo evaluar la precisión de mis resultados?

• La desviación estándar provee una medición útil de la dispersión de mis resultados alrededor de un valor central (¿y la forma de la distribución?).

• Sin embargo, a fin de evaluar la precisión de los resultados se puede recurrir a las distribuciones de frecuencia.

• Mientras más amplia sea la distribución, menor será la precisión de los resultados.

• Se suele asumir que datos correctamente colectados presentarán una distribución normal, lo cual nos permite el posterior uso de modelos estadísticos basados en esta distribución (normal).



• A fin de graficar un histograma que refleje la distribución de mis resultados, necesitaré una gran cantidad de datos (i.e. 500 observaciones).

• Sin embargo, puedo hacer uso del teorema del límite central:

– Un conjunto de datos (resultados) presentarán la misma distribución que la de la población a la que pertenecen.

– Conforme el tamaño de la muestra se incrementa, los datos se aproximarán más a un distribución normal.

DISTRIBUCIÓN DE PROBABILIDADES

Evaluación estadística de datos

Distribución normal

• Obtenida al graficar una distribución de probabilidad en base a una gran cantidad (infinita) de observaciones.

• Su forma y simetría alrededor de la media es función de la desviación estándar.

• Independientemente de su media y desviación estándar, es siempre cierto que aproximadamente:– 68% de las observaciones recaen entre +/- 1 DS a partir de la

media.– 95% de las observaciones entre +/- 2 DS.– 99.7% entre +/- 3 DS.

Distribución normal

• Responde a la fórmula:

La Distribución normal estándar• Por conveniencia, la distribución normal puede ser transformada

a una distribución normal estándar en términos de z, donde:

• Y considerando:– Media ()= 0– Desviación estándar ()= 1

– Donde:

La Distribución normal estándar

• De esta manera, conociendo y , y asumiendo que dicha variable posee una distribución normal, es posible calcular (z)

• Así, se puede determinar el área bajo la curva de la distribución.



• Ejemplo: – Si las medidas repetidas de una valoración se

distribuyen de forma normal con media de 10.15 mL y desviación estándar de 0.02 mL, encuentre:

• La proporción de medidas que serán inferior a 10.20 mL.

• La proporción de medidas que serán inferiores a 10.12

• La proporción de medidas que estarán entre 10.12 mL y 10.20 mL.

EL PROBLEMA DE LAS MUESTRAS PEQUEÑAS

Evaluación estadística de datos

La distribución t

• La Distribución t– Nunca podremos muestrear a todos los

representantes de la población.

– Necesidad de estimar la y la de la población N en base a una muestra de tamaño n.

– De aquí:• x̄�• s

La distribución t

• Sin embargo, toda estimación conlleva una incertidumbre.

• La incertidumbre en la estimación de y dependerá del tamaño de la muestra.

• Es por esto que la distribución t [o (t)] nos sirve para “ajustar” esa incertidumbre en función de n.

• Cuando n es pequeña (ej. 3 o 5) la incertidumbre es mayor que cuando n es grande (ej. 30 a 50).

La distribución t

• Ahora, el valor de puede ser estimado a partir de x̄� mediante:

• Donde:– sx̄� es la desviación estándar de la muestra

– t/2 es el valor de t para el nivel de confianza deseado (ej. 95%) y con cierto número de grados de libertad (n - 1).

• Obteniéndose un rango de posibles valores de .

La distribución t

• ¿Qué son los grados de libertad?– Número de combinaciones independientes que son

utilizadas para calcular s.– Por ejemplo:

• Una muestra de 5 observaciones permitirían un total de 4 combinaciones posibles independientes (xi - x̄� ):

• Serían cuatro las observaciones posibles de ser seleccionadas aleatoriamente para estimar , mientras x̄�que la quinta sería tomada “obligatoriamente”.

– Con una muestra de n=30 la distribución t se acerca mucho a la distribución normal.

La Distribución t

INTERVALOS DE CONFIANZAEvaluación estadística de datos

Intervalo de confianza

• El intervalo de confianza es el rango dentro del cual podemos asumir que el resultado obtenido es verdadero.

• Los valores ubicados en los extremos de este rango son conocidos como los limites de confianza

Intervalo de confianza• Muestras grandes:

– En el caso de muestras grandes, asumimos una distribución íntegramente normal.

– El rango estará dado por:

– donde


• Muestras grandes:– Ejemplo:

• Calcule los límites de confianza de la media al 95% y al 99% para las mediciones indicadas en la siguiente tabla:

• Considere s = 0.0165 g mL-1



• Muestras pequeñas:– En el caso de muestras pequeñas:

– Donde t corresponde a la t critica con (n-1) grados de libertad y a un determinado nivel de confianza.


• Muestras pequeñas:– El contenido del ion sodio de una muestra de

orina fue determinado mediante un electrodo selectivo al ión. Se obtuvieron los valores de: 102, 97, 99, 98, 101, 107 mM.

– ¿Cuáles serían los límites de confianza al 95% y 99% para la concentración del ión sodio?


• Muestras pequeñas:


Intervalo de confianza• A partir de una determinada desviación

estándar (s), podemos construir un intervalo de confianza alrededor de la media.

• En el caso de una variable con distribución aleatoria:

– 68% de las observaciones recaen entre +/- 1 DS a partir de la media.

– 95% de las observaciones entre +/- 2 DS.– 99.7% entre +/- 3 DS.


• Para el caso de la distribución normal, si definiéramos un intervalo de confianza del 95% tendríamos que:– El 95% de las observaciones se encuentran entre:

• ¿De dónde surgió el “1.96”?


• El 1,96 proviene de la distribución t.

• Recordemos que su forma depende de los grados de libertad (n-1):


• El valor t depende de:– Grados de libertad (n-1)– Grados de confianza (ej. 95%)

• 1.96 corresponde a infinitos grados de libertad y 95% de confianza.

• Con esta premisa:– ¿que ocurrirá si incrementamos el tamaño de la muestra?– ¿Que ocurrirá si alteramos nuestro “nivel” de confianza deseado?– ¿Nuestro “intervalo de confianza” será siempre el mismo?


• Ejercicio:– Imagine que cuenta con un lote de 1000 botellas de agua.– Se procede a tomar una muestra de 100 botellas.– En base a esa muestra, usted determina el valor promedio y

la desviación estándar de un parámetro en particular (ej. conductividad).

– Si vuelve a tomar una muestra de 100 botellas:• ¿esperaría que el parámetro medido presente la misma media y

DS?• ¿Cree que siempre será el mismo?• ¿Es posible que en un momento dado obtenga un valor

completamente diferente?


• De aquí la necesidad de establecer los intervalos de confianza





• A fin de conocer el intervalo de confianza:

• Consideremos una observación a partir de una población de:– x=105– s= 3.2– n=6

• ¿Cuál sería el intervalo de confianza?


• Entonces

Interpretación

• Errónea:– Existe un 95% de probabilidad que la media real

de la población se encuentre dentro de este intervalo

• Correcta– El 95% de las veces que se calcule el intervalo de

confianza de esta manera, éste contendrá el valor verdadero de la media de la población.

Interpretación

• Si repitiéramos un experimento 100 veces, y creáramos 100 intervalos de confianza:– aproximadamente 95 de éstos intervalos

contendrían el valor real de la media– 5 no lo contendrían.

Otras medidas de dispersión

• El rango, que es la diferencia numérica entre los valores mayor y menor de un conjunto de datos.

• La desviación estándar relativa (DER):– sr= s/x̄�

• La DER porcentual– sr x 100 (%)

CONTRASTES DE SIGNIFICACIÓNPruebas de hipótesis

Contrates de significación

• Analicemos un experimento clásico:– Pensemos en un análisis realizado a dos muestras

de agua diferentes (A y B).– Cada análisis es realizado por triplicado.– Al comparar las medias de ambas mediciones,

resulta que el valor medio de A es superior al valor observado en B.

– ¿Podemos decir que la muestra A presenta una mayor concentración del analito que B?


• Analicemos un experimento clásico:– ¿Por qué no puedo decir que A presenta una mayor

concentración del analito que B?– La respuesta:

• La diferencia podría deberse simplemente a errores en el análisis.

• Fuentes de errores aleatorios y sistemáticos.• Errores aleatorios (variabilidad natural)

– Es por esto que necesitamos definir si una diferencia entre observaciones es diferente de manera significativa en términos estadísticos.


• Importancia– Si no llevamos a cabo una prueba estadística,

únicamente podremos decir “no existe diferencia entre las muestras”.

– No hay manera de cuantificar la “fortaleza” de esa diferencia.

– En cambio, en base a un análisis estadístico, diríamos “no existe una diferencia significativa entre las muestras”.

– Las técnicas descriptivas revisadas solo nos permiten llegar a conclusiones empíricas, mas no cuantitativas.


• Recordar:– Un resultado estadístico dependerá del cuidado

que se tenga en:• La selección del método estadístico• El procesamiento de los datos• El diseño experimental adecuado• Reducción de errores en el análisis• Los niveles de significación


• Niveles de significación– 0.05, significativo

• 1/20

– 0.01, muy significativo• 1/100

– 0.001, altamente significativo• 1/1000

ALGUNOS CASOS COMUNESContrastes de significación

Evaluar la exactitud de un método

• Estrategia:– Análisis de una muestra de referencia cuyo valor

medio es conocido ().– Hipótesis nula (H0):

• No existe diferencia significativa entre el valor medido ( ) y el valor real del analito (x̄� ).

– Análisis utilizado• El análisis t del estudiante


• T-test– Calculado en base a:

– Si t calculado es superior al valor t crítico, no existe evidencia suficiente para aceptar H0, siendo por tanto rechazada.

– Por tal motivo, si existe una diferencia significativa entre y x̄� .

s

nXt


• T-test: Ejemplo– En un nuevo método para determinar selenourea en agua

se obtuvieron los siguientes valores:

– 50.4, 50.7, 49.1, 49.0, 51.1 ng/mL

– Conociendo que la muestra contenía 50 ng/mL de selenourea, ¿Existe alguna evidencia de error sistemático?

– Deberemos definir nuestro nivel de significación (p<0.05, 0.01, 0.001).


• T-test: Ejemplo– Determinamos la media (50.06 ng/mL), y la desviación estándar

(0.956 ng/mL).– Procedemos a determinar el valor de t.

– Comparamos el valor t con el valor t crítico (tn-1).– Dado que el valor t es menor que el t critico, la hipótesis nula se

retiene.– No existe diferencia entre y x̄� , por tanto tampoco existe evidencia

suficiente para constatar la presencia de un error sistemático.

s

nXt

Comparación de dos medias experimentales• Estadístico t es calculado mediante:

• Donde s es calculado a partir de:

• Y t posee (n1+ n2-2) grados de libertad• Considerando que ambas poblaciones poseen una s similar.

21

21

11nn

s

XXt

)2(

)1()1(

21

222

2112

nn

snsnS

Comparación de dos medias experimentales• Ejemplo 1:

– Se realiza una comparación de dos métodos para determinar el contenido de Cromo (mg/kg) en muestras de hierba de centeno.

– Al realizar cinco determinaciones para cada método, se obtuvo que:

• Método 1: = 1.48; s= 0.28x̄�• Método 2: = 2.33; s= 0.31x̄�

– Asumiendo que ambos métodos poseen una similar, ¿estos dos métodos proveen medias que difieren significativamente?

Comparación de dos medias experimentales• Ejemplo 2:

– A fin de determinar el contenido de estaño en productos alimenticios, las muestras fueron llevadas a ebullición con HCl a reflujo para diferentes tiempos. Los resultados fueron:

• 30 min: 55, 57, 59, 56, 56, 59• 75 min: 57, 55, 58, 59, 59, 59

– Asumiendo que es similar para ambas poblaciones, ¿Es significativamente diferente el contenido de Sn obtenido mediante ambos tiempos de ebullición?

Comparación de dos medias experimentales• Casos especiales

– ¿Qué ocurre cuando no es posible asumir que las s de ambas poblaciones son similares?– El estadístico t es obtenido mediante:

– Con grados de libertad

– Redondeado a un número entero

Comparación de dos medias experimentales• Ejemplo:

– Los datos de la siguiente tabla proporcionan la concentración de tiol (mM) en el lisado sanguíneo de dos grupos de voluntarios, siendo el primer grupo “normal” y el segundo sufriendo de artritis reumatoide.

– Normal: 1.84; 1.92; 1.94; 1.92; 1.85; 1.91; 2.07– Reumatoide: 2.81; 4.06; 3.62; 3.27; 3.27; 3.76

– ¿Existe evidencia suficiente que indique una diferencia significativa en los niveles de tiol entre los dos grupos?

T-test pareado

• Objetivo:– Necesidad de comparar dos métodos de análisis

en base a varias muestras que contienen diferente cantidad del analito.

T-test pareado

• Estrategia:– Diferencias pueden deberse a:

• Diferencias por errores aleatorios• Diferencias en las concentraciones del analito en cada

muestra• Diferencias en la técnica de análisis.

– Las diferencias que realmente nos interesa son las obtenidas para cada par de mediciones

– Se define así la variable d.

T-test pareado

• Estrategia:– Adicional a la variable d, es necesario definir la s

de los valores de d (sd). – Con esta información se calcula el estadístico t:

– Importante indicar que los valores medidos podrían ser también valores promedios.

T-test pareado

• Algunas asunciones:– Los valores de d se encuentran normalmente

distribuidos– La precisión y el bias en ambos métodos se

mantienen constantes a diferentes concentraciones del analito

– n mediciones deben ser realizadas por el método 1 para cada muestra, y m mediciones por el método 2.

– m y n no necesariamente deben ser iguales.

T-test pareado

• Ejercicio:– Determinar si existe una diferencia significativa

entre los dos métodos de análisis empleados para la determinación de paracetamol (%m/m) en tabletas.

Contrastes de una y dos colas

• Motivos:– Hasta ahora, los contrastes de significación han sido

realizados haciendo uso de las dos colas de la distribución.

– Es decir, damos la oportunidad de que la diferencia entre las poblaciones sea positiva o negativa.

– Sin embargo, en ocasiones es posible con antelación conocer que lo que contrastaremos es un aumento.

– En esos casos, es recomendable hacer uso de un contraste unilateral.


• Estrategia:– Hacer uso del valor de t indicado en la tabla para

el doble del nivel de significación deseado:• Contraste de una cola al nivel P=0.01, se emplea la

columna P=0.02• Contraste de una cola al nivel P=0.05, se emplea la

columna P=0.10


• Ejemplo:– Se sospecha que un método de valoración ácido-base tiene

un error de indicador significativo, y por tanto, tiende a dar resultados sistemáticos positivos (sesgo positivo). Para comprobar esto se utiliza una disolución exactamente 0.1M de ácido para valorar 25.00 mL de otra disolución exactamente 0.1M de una base, con los siguientes resultados (mL):

– 25.06; 25.18; 24.87; 25.51; 25.34; 25.41

– Contrastar la existencia de sesgo positivo en estos resultados.

La prueba F• Objetivo:

– Comparación de la varianza (precisión)

• Estrategia:– Determinación de una relación entre las varianzas de las dos poblaciones– Donde el valor de F 1– Necesidad de ordenar el numerador y denominador adecuadamente.– Se asume que las varianzas de ambas poblaciones son relativamente similares– Comparación del estadístico F con el valor crítico (tablas).

• Posibilidades– Evaluar si existe una diferencia entre la varianza de ambas poblaciones (dos colas).– Evaluar si existe una diferencia positiva o negativa entre las poblaciones (una cola).

22

21

S

SF

La prueba F

• Ejemplo:– Se desea evaluar si dos métodos de síntesis para

un mismo producto poseen una misma precisión:

La prueba F

• Ejemplo:– Se comparó un método propuesto para la

determinación de DQO en aguas residuales con otro método patrón. Los siguientes resultados fueron obtenidos para una misma muestra de aguas residuales:

• Método patrón: x= 72; s= 3.31; n=5• Método propuesto: x= 72; s= 1.51; n=6

– ¿Existe evidencia de que el método propuesto es más preciso que el patrón?

ANOVAPruebas de Hipótesis

ANOVA

• Cuando necesitamos probar diferencias significativas entre dos poblaciones (o métodos) hemos recurrido al test t.

• Sin embargo, cuando se desea probar diferencias significativas entre mas de dos poblaciones se recurre al Análisis de Varianza (ANOVA).

• Importante indicar que el ANOVA únicamente nos indicará si existe o no una diferencia entre las poblaciones evaluadas.

• El ANOVA no me indica las relaciones entre poblaciones.

ANOVA

• Asunciones:– Las poblaciones evaluadas poseen una distribución

normal.– Las varianzas (2) es la misma para todas las

poblaciones.– La única diferencia entre poblaciones radica en sus

valores medios.– ANOVA considera dos potenciales fuentes de variación

de las medias:• Variación entre poblaciones• Variación dentro de cada una de las poblaciones

ANOVA• Ejemplo:

– Un químico desea evaluar cuatro métodos diferentes de extracción a fin de determinar un compuesto orgánico en el agua de mar. Para este fin, el químico prepara una solución en agua de mar del compuesto orgánico a ser evaluado, y lo analiza por triplicado con cada uno de los métodos propuestos. Los resultados obtenidos se muestran a continuación:

Método de extracción

Valor medido(unidades)

Valor promedio (unidades)

A 300, 294, 304 299

B 299, 291, 300 296

C 280, 281, 289 283

D 305, 310, 300 305

296

ANOVA

• Solución:– Es claro que existen potenciales diferencias entre

los métodos (entre poblaciones), así como en las lecturas obtenidas dentro de cada método (dentro de cada población).

ANOVA

• Variación dentro de tratamientos – Cálculo de la varianza (2) para cada uno de los

tratamientos.– Obtención de una varianza promedio.

ANOVA

• Variación dentro de cada tratamiento

ANOVA

• Variación dentro de cada tratamiento

Método de extracción

Valor medido(unidades)

Valor promedio (unidades)

2

A 300, 294, 304 299 25.5

B 299, 291, 300 296 25.0

C 280, 281, 289 283 24.5

D 305, 310, 300 305 25.0

Media global 296 25.0

ANOVA

• Variación entre tratamientos

– Considerando que:• Varianza promedio dentro de los tratamientos= 25 con

8 grados de libertad (g.l.)• Varianza entre los tratamientos= 86 con 3 g.l.

ANOVA• Hipótesis nula:

– No existe diferencia significativa entre los tratamientos• Análisis estadístico utilizado:

– F test

– Comparación del F calculado contra el F crítico.– H0 se acepta si Fcalc es menor que Fcrit

– En este caso Fcrit = 4.006 (p=0.05)– Por tanto: No existe diferencia significativa entre las medias de los

tratamientos

entosen tratami promedio Varianza

tos tratamienentre VarianzacalcF

ANOVA

• ¿Y donde esta la diferencia?– Método de la Mínima Diferencia Significativa (m.d.s.)

– Donde n es el número de replicas, s es la estimada dentro de los tratamientos, y (n-1) son los grados de libertad de esta estimación.

– Si la magnitud de la m.d.s. es inferior a la diferencia entre las medias de los tratamientos ordenados, entonces no hay evidencia de una diferencia significativa.

)1(

2... nhtnssdm

ANOVA• Volviendo a nuestro ejemplo:

• Donde la m.d.s. es inferior a la diferencia de varianza existente entre cualquiera de los tratamientos.

• A= 25.5 B= 25.0 C= 24.5 D=25.0

)1(

2... nhtnssdm

63.936.23

225... sdm

ANOVA

• Ejercicio:– Se evalúa la estabilidad de un reactivo a diferentes

condiciones de almacenamiento, obteniéndose los siguientes resultados:

Condiciones Valores medidos MediaA

recién preparado102, 100, 101 101

B una hora en la oscuridad

101, 101, 104 102

Cuna hora luz tenue

97, 95, 99 97

Dna hora luz brillante

90, 92, 94 92

Media global 98

DATOS ANÓMALOSPruebas de Hipótesis

Datos anómalos

• Frecuentemente nos encontramos con datos extremos, que podrían proceder de:– Un error en la medición– Un error en la calibración– Un dato inusual

• ¿Cómo identificarlos?– Técnicas gráficas de exploración (ej. diagrama de cajas)– Otras técnicas estadísticas

• Contrate de Dixon (o contrates Q)• Contrate de Grubbs

Datos anómalos

• Contraste de Dixon (Q)– Basado en el cálculo de Q:

• Qcalc contrastado con Qcrit.

• Asunciones:– Válido para tamaños de muestra de 3 a 7– La población presenta una distribución normal

*pequeño másvalor -grande másvalor

cercano másvalor -sospechosovalor Q

*Rango considerando el valor sospechoso

Datos anómalos

• Contraste de Dixon (Q)– Ejemplo 1:

• Se obtuvieron los siguientes valores para la concentración de nitrito (mg/L) en una muestra de agua de río:

• 0.403 0.410 0.401 0.308

• ¿Deberíamos rechazar la última medición?

Datos anómalos

• Contraste de Dixon (Q)– Ejemplo 2:

• Al análisis anterior se adicionan tres nuevas mediciones:

• 0.403 0.410 0.401 0.380 0.400 0.413 0.411

• ¿Se debería mantener la observación de 0.380?

Datos anómalos• Contraste de Grubbs

– Basado en el cálculo de G1, G2 y G3:

– donde:• S es la desviación estándar de todos los datos

(incluyendo los datos extremos)• xi es la observación sospechosa

• S2n-2 es la varianza calculada al excluir los valores

extremos

– Si G1, G2 y G3 calculados son mayores que los G críticos, entonces existe evidencia significativa de que son valores anómalos (provenientes de otra población)

s

xxG

i1

s

xxG in 2

2

22

3 1

31

sn

snG n

Datos anómalos

• Contraste de Grubbs

n

Datos anómalos

• Contraste de Grubbs

Datos anómalos

• Ejemplo:– Los resultados obtenidos para la determinación de

Cd (ng/g) en cabello humano mediante TXRF se muestran a continuación:

Documents

Técnicas graficas de exploración de datos