204
1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. [email protected] C IM AT

1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. [email protected]

Embed Size (px)

Citation preview

Page 1: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

1

Módulo 2Segunda Parte

Especialidad en Métodos EstadísticosCentro de Investigación en Matemáticas,

A. [email protected]

C IM AT

Page 2: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

2

1.  Nociones de Probabilidad2. Distribuciones Discretas.3.  Distribuciones Continuas.4.  Distribuciones muestrales.5.  Distribución Normal.6.  La distribución Ji-cuadrada.

Módulo 2C IM AT

1er Parte

2da Parte

Page 3: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

3

1. Nociones de Probabilidad.2. Algunas distribuciones de probabilidad discretas.3. Algunas distribuciones continuas de probabilidad.

4.  Distribuciones muestrales.5.  Distribución Normal.6.  La distribución Ji-cuadrada.

Módulo 2C IM AT

1er Parte

2da Parte

Page 4: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

4

• 4.   Distribuciones muestrales.– 4.1. Muestra Aleatoria Simple – 4.2. Distribución de Muestreo – 4.3. Distribución muestral de promedios en poblaciones.– 4.4. Distribución muestral de proporciones.

• 5.   Distribución Normal.– 5.1.  Importancia de la distribución Normal.– 5.2.  Áreas tabuladas de la distribución de probabilidad normal.– 5.3.  El teorema del límite central.– 5.4.  Distribución binomial.– 5.5.  La aproximación normal para la distribución binomial.– 5.6.  Papel de probabilidad Normal.

• 6.   La distribución Ji-cuadrada.– 6.1.  Importancia de la Ji-cuadrada.– 6.2.  Bondad de ajuste.– 6.3.  Empleo de Ji-Cuadrada en normalidad y estimación de varianzas.– 6.4.  Tablas de contingencia.– 6.5.  Pruebas de significancia en cuadros mayores de 2 x 2.– 6.6.  Restricciones en el empleo de la Ji-Cuadrada.

• 7 Teorema de Chebyshev

Segunda Parte Módulo 2

Page 5: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

5

4.  Distribuciones muestrales.5.  Distribución Normal.6.  La distribución Ji-cuadrada.

Módulo 2

2da Parte

Page 6: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

6

4. Distribuciones Muestrales.

Page 7: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

Objetivo

• Entender el concepto e importancia de distribución de muestreo.

• Aprender a utilizar las distribuciones de muetreo, su uso y aplicaciones. Para que sirven y como aplicarlas en casos prácticos.

7

Page 8: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

8

Muestreo.• El muestreo es una herramienta de la

investigación científica. • Su función básica es determinar que

parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población. (Ejemplo)

4. Distribuciones muestrales.

Page 9: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

9

• La información de los estudios de muestreo es parte de nuestra vida diaria, casi en su totalidad. Tal información determina el rumbo que deberán tomar algunas políticas gubernamentales como, por ejemplo, la promoción de programas sociales o el control de la economía.

Revisión Conceptos de Muestreo

Page 10: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

10

• Las encuestas de opinión son la base de muchas de las noticias proporcionadas en los medios. Los estudios de rating televisivo determinan cuales son los programas que permanecerán al aire en el futuro.

• No se diga los estudios de preferencias electorales, para definir estrategias por parte de los partidos políticos.

Revisión Conceptos de Muestreo

Page 11: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

11

• Las investigaciones de mercado indicaran cuales productos y con que características son los preferidos de los consumidores

• Por otro lado, están los estudios de muestreo en las ciencias biológicas, geológicas, del medio ambiente, marítimas entre otras.

• Muestreo de Aceptación (Industrial)

Revisión Conceptos de Muestreo

Page 12: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

12

• Aún cuando la terminología de las ciencias sociales difiere de las ciencias exactas, los científicos sociales conducen estudios de muestreo y los científicos de las áreas físicas realizan en su mayoria experimentos, ambos tienen el propósito de captar información en torno a los fenómenos naturales.

Revisión Conceptos de Muestreo

Page 13: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

13

• Sin embargo, esas diferencias existen en el campo de la ciencia, debido a la naturaleza de las poblaciones y a la manera en que una muestra puede ser extraída. Por ejemplo, poblaciones de votantes, de cuentas financieras, o de animales de una especie particular pueden contener un número relativamente pequeño de elementos (finito).

Revisión Conceptos de Muestreo

Page 14: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

14

• En contraste, la población conceptual de respuestas generadas por la medición de la producción de un proceso químico, es muy grande (infinito). Las limitaciones del procedimiento de muestreo también varían de un área de la ciencia a otra.

Revisión Conceptos de Muestreo

Page 15: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

15

• El muestreo en las ciencias biológicas y físicas, puede frecuentemente ser realizado bajo condiciones experimentales controladas. Tal control es frecuentemente imposible en las ciencias sociales, negocios, y administración de recursos naturales (observación).

Revisión Conceptos de Muestreo

Page 16: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

16

¿Cómo realizar un inventario?1.- Censo: es un conteo exhaustivo de los

individuos o elementos de la población bajo estudio.– Desventajas:

• Costos elevados.• Estático.• Requiere mucho tiempo.

2.- Muestreo: una parte representativa del recurso.– Ventajas:

• Reduce costos.• Puede ser dinámico.• Reduce tiempos.

Un Ejemplo: Población y Muestra

Page 17: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

17

Se ha manejado que la estadística moderna es la teoría de la información, cuyo objetivo es la inferencia. Nuestro interés se centra en un grupo de mediciones que existen o pueden ser generadas, una población. El medio de la inferencia es la muestra, la cual es un subgrupo de mediciones seleccionadas de la población.

Conceptos de Población y Muestra

Page 18: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

18

Deseamos entonces realizar inferencias sobre la población basándonos en las características que observamos en la muestra, o equivalentemente, en la información contenida en la muestra.

Conceptos de Población y Muestra

Page 19: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

19

Población vs. MuestraN elementos en la población

n - elementos en la muestra

Conceptos de Población y Muestra

Page 20: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

20

• El error que se comete debido al hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observación de sólo una parte de ella, se denomina error de muestreo.

• Obtener una muestra adecuada, significa lograr una versión simplificada de la población, que reproduzca de algún modo sus rasgos y características básicas o de interés.

Conceptos de Población y Muestra

Page 21: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

21

• Elemento: es un objeto o persona en el cual se toman las mediciones.

• Población objetivo: conjunto de individuos de los que se quiere obtener una información.

• Unidades de muestreo: el conjunto de elementos no traslapados de la población que cubren a la población completa. Todo miembro de la población pertenecerá a una y sólo una unidad de muestreo.

Terminología

Page 22: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

22

• Unidades de análisis: objeto o individuo del que hay que obtener la información.

• Marco muestral: lista de unidades o elementos de muestreo.

• Muestra: conjunto de unidades o elementos de análisis seleccionadas de un marco o varios marcos.

Terminología

Page 23: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

23

• Muestreo probabilístico. El planteamiento clásico del problema de estimación estadística requiere que la aleatoriedad esté comprendida en el diseño de muestreo para así poder evaluar probabilísticamente, las propiedades de los estimadores. Al diseño de muestreo que plantea la selección, de unidades de muestreo, basada en la aleatoriedad se le llama muestreo probabilístico.

Terminología

Page 24: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

24

• Límite para el error de estimación. Si q es la característica poblacional de interés y es un estimador (basándose en la información de la muestra) de , debemos especificar un límite para el error de estimación; esto es, debemos especificar que y difieran en valor absoluto a lo más en cierto valor B. Simbólicamente,

Terminología

Bestimacióndeerror ˆ

Page 25: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

25

• puede ser cualquier característica de la población (el promedio, el total, un porcentaje, el valor mediano, el valor mínimo, etcétera) Se le llama parámetro

• es el estadístico obtenido a partir de la información de la muestra. En algunas veces llamado estadístico de prueba. (el promedio de la muestra, el total de la muestra, el mínimo de la muestra, la mediana de la muestra, etcétera)

Terminología

Page 26: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

26

Parámetro poblacional vs.

Estadístico muestral

Parámetrosm = media poblacionalP = proporciónMax = MáximoMediana poblacionals = desviación poblacional

Estadísticos

x = media muestralP = proporciónMax = MáximoMediana muestrals = desviación muestral

Page 27: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

27

• También debemos definir una probabilidad, (1-a) que especifique la fracción de veces en muestreo repetido, que requeriremos que el error de estimación sea menor que B. Esto es

Terminología

1 BestimacióndeerrorP

Page 28: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

28

• Muestreo no probabilístico. El muestreo no probabilístico no involucra ningún elemento aleatorio en el proceso de selección.

Terminología

Page 29: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

29

4.1  Muestras aleatorias.

Definición 1: Si X1, X2, ..., Xn son variables aleatorias independientes e idénticamente distribuidas, decimos que constituyen una muestra aleatoria de la población infinita dada por su distribución común.

Si S es un espacio muestral con una medida de probabilidad y X es una función con valor real definida con respecto a los elementos de S, entonces X se denomina Variable Aleatoria.

Page 30: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

30

4.1  Muestras aleatorias.

Definimos a S un espacio muestral como al conjunto de todos los posibles resultados de un experimento (aleatorio).

Page 31: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

31

4.1.  Muestras aleatorias.

Para un espacio muestral S dado, una Variable Aleatoria es cualquier regla que asocia un número con cada resultado de S.

Sa

b

d g

f

ec

10 Si a o b11 Si c

12 Si e o f

130 Si g

X =

Page 32: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

32

• Unas muestra aleatoria simple de tamaño n, de una población finita de tamaño N, es una muestra seleccionada de tal manera que cada una de las muestras posibles de tamaño n tenga la misma probabilidad de ser seleccionada.

4.1 Muestra Aleatoria Simple (Población Finita)

Page 33: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

33

• Entrando al tema del muestreo probabilístico es importante definir y entender lo que es una distribución de muestreo.

• ¿Qué es una distribución muestral?

4.2 Distribución de Muestreo

Page 34: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

34

¿Qué es una distribución muestral?

•La distribución muestral de un estadístico de prueba proporciona (1) una lista de todos los valores que puede tomar dicho estadístico y (2) la probabilidad de obtener cada valor, suponiendo que éste es producto sólo del azar.

4.2 Distribución de Muestreo

Page 35: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

35

¿Qué es una distribución muestral?

•Definimos Distribución Muestral como la distribución de probabilidad de todos los posibles valores que puede tomar un estadístico, suponiendo que sólo influye el azar (Para un parámetro poblacional dado)

4.2 Distribución de Muestreo

Page 36: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

36

•La distribución muestral de la media proporciona todos los valores que puede tomar la media, junto con la probabilidad de obtener cada valor si el muestreo es aleatorio a partir de la población hipotética. La media muestral posee las siguientes características:

1 mx= es la media de la distribución muestral.

sx = es la desviación estándar de la distribución muestral de la media

4.3 Distribución muestral de la media

Page 37: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

37

2 La media muestral es igual a la media poblacional, mx= m.

3. La media muestral tiene una desviación estándar igual a la desviación estándar poblacional de datos crudos, dividida entre la raíz del número de datos. Es decir:

4. Presenta una forma de campananx

4.3 Distribución muestral de la media

Page 38: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

38

A pesar que la demostración de la distribución muestral de la media va más allá de los alcances del curso, podemos hacer un ejemplo para la mejor comprensión de la distribución muestral de la media. Supongamos una población de solo cinco elementos 2, 3, 4, 5 y 6. La media m de la población es m = 4.0 y la desviación estándar de la población es s = 1.41.

4.3 Distribución muestral de la media

Page 39: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

39

Ahora queremos deducir la distribución muestral de la media para muestras de tamaño 2 de la población. Extraemos todas las distintas muestras de tamaño n = 2. Y observamos cual es el valor de x-barra y su probabilidad.

4.3 Distribución muestral de la media

x

Page 40: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

40

Estadísticos

x = (X1+ X2)/2n = 2

2 2

3 3

4 4

5 5

6 6

N = 10

X1, X2

4.3 Distribución muestral de la media

Page 41: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

41

Muestra Numero Promedio

Muestra número Promedio

1 2 , 2 2.0 14 4 , 5 4.52 2 , 3 2.5 15 4 , 6 5.03 2 , 4 3.0 16 5 , 2 3.54 2 , 5 3.5 17 5 , 3 4.05 2 , 6 4.0 18 5 , 4 4.56 3 , 2 2.5 19 5 , 5 5.07 3 , 3 3.0 20 5 , 6 5.58 3 , 4 3.5 21 6 , 2 4.09 3 , 5 4.0 22 6 , 3 4.5

10 3 , 6 4.5 23 6 , 4 5.011 4 , 2 3.0 24 6 , 5 5.512 4 , 3 3.5 25 6 , 6 6.013 4 , 4 4.0

Datos muestrales

Datos muestrales

4.3 Distribución muestral de la media

Page 42: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

42

Distribución muestral de la media n =2

X-Barra P(X-Barra)

2.0 0.042.5 0.083.0 0.123.5 0.164.0 0.204.5 0.165.0 0.125.5 0.086.0 0.04

P(X-Barra)

0.00

0.05

0.10

0.15

0.20

0.25

2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0

P(X-Barra)

4.3 Distribución muestral de la media

Page 43: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

43

Muestra Numero Promedio

Muestra número Promedio

1 2 , 2 2.0 14 4 , 5 4.52 2 , 3 2.5 15 4 , 6 5.03 2 , 4 3.0 16 5 , 2 3.54 2 , 5 3.5 17 5 , 3 4.05 2 , 6 4.0 18 5 , 4 4.56 3 , 2 2.5 19 5 , 5 5.07 3 , 3 3.0 20 5 , 6 5.58 3 , 4 3.5 21 6 , 2 4.09 3 , 5 4.0 22 6 , 3 4.5

10 3 , 6 4.5 23 6 , 4 5.011 4 , 2 3.0 24 6 , 5 5.512 4 , 3 3.5 25 6 , 6 6.013 4 , 4 4.0

Datos muestrales

Datos muestrales

0.4520

N

X 0.4

25100

n

Xx

Media de la

población

Media de la

muestra

Distribución muestral de la media n =24.3 Distribución muestral de la media

Page 44: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

44

0.12

41.1 nx

Así, y también x

N

x xx

2)(

0.1)46(...)45.2()42( 222

Nx

Distribución muestral de la media n =2

4.3 Distribución muestral de la media

Page 45: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

45

La distribución muestral de la media proporciona todos los valores que puede tomar la media, junto con la probabilidad de obtener cada valor, si el muestreo es aleatorio a partir de la población hipotética.

Distribución muestral de la media n =2

X-Barra P(X-Barra)

2.0 0.042.5 0.083.0 0.123.5 0.164.0 0.204.5 0.165.0 0.125.5 0.086.0 0.04

4.3 Distribución muestral de la media

Page 46: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

46

Estadísticos

x = (X1+ X2)/2n = 2

2 2

3 3

4 4

5 5

6 6

N = ____

m = ____

s = ____

X1, X2Población hipotética

EDM

4.3 Distribución muestral de la media

Page 47: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

47

Estadísticos

x = (X1+ X2)/2n = 2

2 2

3 3

4 4

5 5

6 6

N = _10_

m = _4.0

s = _1.0

X1, X2Población hipotética

EDM

4.3 Distribución muestral de la media

Page 48: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

48

Distribución muestral de la media, para N = 10 población, con media poblacional =4,

varianza poblacional = 1 y tamaño de muestra n =2

X-Barra P(X-Barra)

2.0 0.042.5 0.083.0 0.123.5 0.164.0 0.204.5 0.165.0 0.125.5 0.086.0 0.04

P(X-Barra)

0.00

0.05

0.10

0.15

0.20

0.25

2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0

P(X-Barra)

Page 49: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

49

Distribución muestral de la media para N = 15, con media poblacional = 4 y tamaño de muestra

n =3

X-Barra P(X-Barra)%2.00 0.82.33 2.42.67 4.83.00 8.03.33 12.03.67 14.44.00 15.24.33 14.44.67 12.05.00 8.05.33 4.85.67 2.46.00 0.8

P(X-Barra)%

0.0

2.0

4.0

6.08.0

10.0

12.0

14.0

16.0

X-Bar

ra2.

333.

003.

674.

335.

005.

67

P(X-Barra)%

Page 50: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

50

Distribución muestral aproximada de la media para N = 10000, con media poblacional = 40 y

tamaño de muestra n =300

0

20

40

60

80

100

120

140

0

20

40

60

80

100

120

140

No. de realizaciones = 500

Distribución Muestral de Medias con N= 10000 y n= 300

Page 51: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

51

• Límite para el error de estimación. Si m es la característica poblacional de interés y es un estimador (basándose en la información de la muestra) de m, debemos especificar un límite para el error de estimación; esto es, debemos especificar que tanto difieren en

valor absoluto. Simbólicamente, Bxestimacióndeerror

x

4.3 Distribución muestral de la media

Page 52: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

52

Definición 1: Si X1, X2, ..., Xn son variables aleatorias independientes e idénticamente distribuidas, decimos que constituyen una muestra aleatoria de la población infinita dada por su distribución común.

Definición 2 Si X1, X2, ..., Xn constituyen una muestra aleatoria, entonces:

n

xx

n

ii

1

Se denomina media de la muestra y1

)(1

2

2

n

xxs

n

ii

Se conoce como la varianza de la muestra.

4.3 Distribución muestral de la media

Page 53: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

53

Distribución de la media(población infinita)

Teorema 1 Si X1, X2, ..., Xn constituyen una muestra aleatoria de una población infinita que tiene media y la varianza 2, entonces:

nxVaryxE

2

)()(

Definición de estadísticaUn estadística es cualquier cantidad cuyo valor se pueda calcular a partir de datos muestrales.

Page 54: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

54

Teorema del límite central

Teorema 2 Si X1, X2, ..., Xn constituyen una muestra aleatoria de una población infinita que tiene la media y la varianza 2, entonces la distribución límite de:

nx

z/

Cuando n , es la distribución normal estándar.

),(~n

Nx xx

Page 55: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

55

Teorema del límite central

Una forma sencilla de expresar el teorema del límite central es: “la suma (o promedio) de variables aleatorias independientes e idénticamente distribuidas, sigue una distribución límite normal con media n (ó ) y varianza 2/n.

Page 56: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

56

Ejemplo

Una maquina vendedora de refrescos está programada para que la cantidad de refresco que se sirva sea una variable aleatoria con una media de 200 mililitros y una desviación estándar de 15 mililitros. ¿cuál es la probabilidad de que la cantidad de refresco promedio (media) servida en una muestra tomada al azar de 36, sea cuando menos 204 mililitros.

Page 57: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

57

Ejemplo

Según el teorema 1, la distribución de x-barra tiene la media x = 200 y la desviación estándar x=15/36 = 2.5, de acuerdo con el teorema del límite central, esta distribución es aproximadamente normal. Como z =(204 - 200)/2.5 = 1.6, se deduce de la tabla de la distribución normal estándar que la P(x-barra 204) = P(z 1.6) = 0.0548.

Page 58: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

58

Distribución de la media(población finita)

Si x-barra es la media de una muestra aleatoria de tamaño n tomada de una población finita de tamaño N con media y la varianza , entonces:

1)()(

2

NnN

nxVaryxE

Page 59: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

59

Distribuciones muestralesDistribución Ji Cuadrada

Si x tiene distribución normal estándar, entonces x2 tiene la distribución gama especial a la que nos referimos como la distribución ji cuadrada con = 1 grado de libertad. La ji cuadrada es importante en problemas de muestreo de poblaciones normales.

Una variable aleatoria x tiene una distribución ji cuadrada (2) con (nu) grados de libertad, si su densidad está dada por:

formaotracualquierde

xparaexxf

x

0

0)2/(2

1)(

2/2

2

2/

Page 60: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

60

Teorema 3. Si s2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal cuya varianza es 2, entonces:

2

22 )1(

sn

es el valor de una variable aleatoria que tiene distribución Ji-cuadrada con parámetro = n - 1 grados de libertad

Page 61: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

61

Page 62: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

62

inferencia.(De inferir).1. f. Acción y efecto de inferir.

inferir.(Del lat. inferre, llevar a).2. tr. Sacar una consecuencia o deducir algo

de otra cosa. U. t. c. prnl.3. tr. Llevar consigo, ocasionar, conducir a un

resultado.4. tr. Producir o causar ofensas, agravios,

heridas, etc.

Definiciones

Continuar

Page 63: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

63

4.4 Distribución muestral de proporciones.

Definición 3: Si X1, X2, ..., Xn son variables aleatorias independientes e idénticamente distribuidas que solo toman valores de Xi = 1 ó Xi = 0, dependiendo si poseen o no la característica de interés respectivamente, decimos que constituyen una muestra aleatoria de un experimento binomial de la población infinita dada por su distribución común.

Page 64: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

64

Definición 4 Si X1, X2, ..., Xn constituyen una muestra aleatoria de un experimento binomial, entonces:

n

xp

n

ii

1

Se denomina proporción de la muestra y

)1( pnp es la varianza de la muestra, ya que cumple con los requisitos de un experimento binomial.

4.4 Distribución muestral de proporciones.

Page 65: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

65

Teorema 4 Si X1, X2, ..., Xn constituyen una muestra aleatoria de una población infinita donde Xi constituye un experimento Bernoulli, tal que que P es la proporción de la población con la característica de interés, entonces se cumple que:

npppVaryPpE /)1()()(

4.4 Distribución muestral de proporciones. (para un tamaño de muestra suficientemente grande)

Page 66: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

66

Teorema del límite central(aproximación para proporciones)

De aquí se tiene la aproximación de que si X1, X2, ..., Xn constituyen una muestra aleatoria de una población infinita que tiene la proporción P de un experimento Bernoulli, entonces la distribución límite de:

npp

Ppz

)1(

Cuando n , entonces z tiene una distribución límite normal estándar.

Page 67: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

67

Teorema del límite central (aproximación para proporciones)

También se puede ver este resultado como dada una muestra aleatoria X1, X2, ..., Xn de variables aleatorias Bernoulli, con x = el número de éxitos observados, en n intentos igualmente probables, entonces la distribución límite de:

)1( pnp

npxz

Con p = x/n, para n , z tiene una distribución límite normal estándar.

Page 68: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

68

Teorema del límite central (aproximación para proporciones)

Ejemplo: La proporción de familias de la ciudad de Aguascalientes, que son dueñas, no arrendatarias, de sus casas es de 0.70. Si al azar se entrevistan a 84 familias de esta ciudad y sus respectivas respuestas –a la pregunta de si son dueñas o no de su casa- se consideran valores de variables aleatorias independientes que tienen distribución de Bernoulli idénticas con el parámetro P = 0.70, ¿Con qué probabilidad podemos afirmar que el valor que se obtenga de la muestra p será menor que 0.64

Page 69: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

69

Teorema del límite central (aproximación para proporciones)

Respuesta:P = 0.70, p = 0.64, n = 84, sustituyendo.

1456.1

84)36.0(64.0

70.064.0

)1(

npp

Ppz

%59.121259.0)1456.1( zp

Page 70: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

70

Distribuciones muestrales de la media muestral. Guía para el uso de la distribución t, normal estándar y el Teorema del Límite Central.

* Rigurosamente esn

SX

t

, pero para n 30 podemos aproximar la distribución t por una normal estándar, por el T.L.C.

Nota: La regla n 30 es una buena aproximación en la gran mayoría de los casos, salvo cuando la población tiene una distribución muy asimétrica, o muy distinta de la forma de campana.

Estadístico:

? = Consultar a un experto en estadística

Población

Normal

No Normal

s conocid

a

s desconocida

s desconocida

s conocida

n 30

n 30

n 30

n < 30

n < 30

n < 30

n 30

n < 30

n

XZ

n

SX

t

n

XZ

n

SX

Z

n

SX

Z

n

XZ

?

?

*

T.L.C.

No importa el tamaño de la muestra.

Page 71: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

71

5.0 Distribución Normal o Gaussiana

Page 72: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

72

La distribución de probabilidad más importante en el campo de la probabilidad y la estadística es la distribución de probabilidad normal, que tiene función de densidad de probabilidad (f.d.p.) a

xcon

xxf

,2

exp2

1),;( 2

2

2

2

5.1 Distribución Normal o Gaussiana

Page 73: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

73

Donde y 2 son los parámetros de la distribución.

Si una variable aleatoria (v.a.) X tiene una f.d.p. como la anterior la denotaremos como

XN(,2 )

Distribución Normal o Gaussiana

Page 74: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

74

Distribución Normal o Gaussiana

Page 75: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

75

Distribución Normal o Gaussiana

Page 76: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

76

Distribución Normal o Gaussiana

Page 77: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

77

Propiedades de la Distribución Normal

• La distribución es simétrica con respecto a • E(x)= y VAR(x)= 2 • Aunque la v.a. X puede tomar cualquier valor

entre - y +, se tiene que –Aprox. 68% de la distribución, está en el

intervalo

Page 78: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

78

Propiedades de la Distribución Normal (continuación)

–Aprox. 95% de la dist. está en el intervalo 2

–Aprox. 99% de la dist. está en el intervalo 3

o equivalentementeP[ - < X < + ] = 0.683P[ - 2 < X < + 2 ] = 0.954P[ - 3 < X < + 3 ] = 0.997

Page 79: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

79

Distribución Normal o Gaussiana

Page 80: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

80

La distribución con media =0 y varianza 2 =1 se llama Distribución Normal Estándar

z

zzf - ,

2exp

2

1)(

2

Usualmente se denota la v.a. normal estándar por Z. Entonces lo denotamos como

ZN(0,1)

Distribución Normal Estándar

Page 81: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

81

Distribución Normal Estándar

Page 82: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

82

Para determinar áreas bajo esta curva nos basamos en la tabla que tiene tabulados la función de distribución acumulativa de Z, esto es,

P(Z z)=(z)

(z)

z

5.2.  Áreas tabuladas de la distribución de probabilidad normal.

Page 83: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

83

Usando dicha tabla determinamos probabilidades correspondientes a valores específicos de z.

1) P( Z < 1.96 ) = ( 1.96 ) = 0.975

.975

1.96

2) P( Z > 1.96 ) = 1 - P( Z < 1.96 ) = 1 - (1.96)

= 1 - .975 = 0.025

0.025

1.96

Page 84: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

84

4) P( 1.96 < Z < 2.31 ) = (2.31) - (1.96)

= .9896 - .975 = .0146

3) P( -1.96 < Z < 2.31 ) = (2.31) - (-1.96)

= .9896 - .025 = .9643

-1.96 2.31 2.311.96

.9643

.0146

Page 85: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

85

Por otra parte nos puede interesar determinar z cuando hemos determinado de antemano la probabilidad, por ejemplo:

1) Determine z tal que P(Z>z)=0.2483

Respuesta: Como el área total bajo la curva es uno,

P(Z<z)=1 - P(Z>z)=1-0.2483=0.7517

entonces

(z)=0.7517

El valor de z corresponde a la entrada tabular 0.7517 es

z=0.68

Page 86: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

86

2) Obtener el valor de z > 0 de tal forma que

P(-z<Z<z)=0.90

Respuesta: Por la simetría de la distribución tenemos que

P(Z<z) = P(Z>z) = 0.05

0.90

0.05 0.05

-z=? z=?

Page 87: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

87

De la tabla tenemos que (1.64) = 0.9495 y (1.65) = 0.9505. Entonces z está entre 1.64 y 1.65. Así que z = 1.645 .

0.90

0.05 0.05

z=1.645

Page 88: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

88

Estandarizando una Variable Normal

Si X N(,2) para calcular la probabilidad de algunos valores de X de manera fácil, primero estandarizamos X.

Si especificamos y 2 , entonces

Z = (X - ) / N(0,1)

Page 89: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

89

Ejemplo: Supongamos X N(50,s2=4), entonces determine P( 48 < X < 53 ).

Respuesta: Primero estandarizamos X, para obtener una variable X N(0,1) .

P[48 < X < 53] = P[ (48-50)/2<(X-)/ <(53-50)/2]

= P [ (48-50)/2 < Z < (53-50)/2 ]

= P [ -1 < Z < 1.5 ]

Page 90: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

90

Estandarizando una Variable Normal

Page 91: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

91

Ejemplo:

Determine las probabilidades de que una variable aleatoria que tiene la distribución normal estándar tome un valor de:

a) menor que 1.72

b) menor que -0.88

c) entre 1.30 y 1.175

d entre -0.25 y 4.45

Page 92: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

92

Mean,Std. dev.0,1

Normal Distribution

x

dens

ity

-5 -4 -3 -2 -1 0 1 2 3 4 50

0.1

0.2

0.3

0.4

5.2.  Áreas tabuladas de la distribución de probabilidad normal.

Page 93: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

93

Ejemplo:

Supóngase que durante periodos de meditación la reducción del consumo de oxigeno de una persona es una variable aleatoria que tiene distribución normal con media = 37.6 centímetros cúbicos por minuto y = 4.6 cc por minuto. Determine las probabilidades de que durante un periodo de meditación el consumo de oxígeno de una persona se reduzca en :

a) Cuando menos 44.5 cc por minutob) Cuando mucho 35.0 cc por minutoc) entre 30.0 y 40. Cc por minuto

Page 94: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

94

5.3 Teorema del Límite CentralAlgunas veces, el este teorema se interpreta incorrectamente, como aquel que implica que la distribución de x-barra tiende a una distribución normal cuando n tiende a infinito. Esto es incorrecto porque var(x-barra) tiende cero, cuando n tiende a infinito; por otra parte, el teorema del límite central justifica la aproximación de la x-barra con una distribución normal que tiene media m y la varianza s2/n cuando n es grande. En la práctica, esta aproximación se utiliza cuando n 30 sin importar la forma de la población que se muestrea

Page 95: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

95

5.3 Teorema del Límite Central

Para valores menores de 30, la aproximación es cuestionable, sin embargo, es interesante observar que cuando la población que se muestrea es normal, la distribución de x-barra es una distribución normal sin importar el tamaño de n.

Page 96: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

96

Distribuciones muestrales de la media muestral. Guía para el uso de la distribución t, normal estándar y el Teorema del Límite Central.

* Rigurosamente esn

SX

t

, pero para n 30 podemos aproximar la distribución t por una normal estándar, por el T.L.C.

Nota: La regla n 30 es una buena aproximación en la gran mayoría de los casos, salvo cuando la población tiene una distribución muy asimétrica, o muy distinta de la forma de campana.

Estadístico:

? = Consultar a un experto en estadística

Población

Normal

No Normal

s conocid

a

s desconocida

s desconocida

s conocida

n 30

n 30

n 30

n < 30

n < 30

n < 30

n 30

n < 30

n

XZ

n

SX

t

n

XZ

n

SX

Z

n

SX

Z

n

XZ

?

?

*

T.L.C.

No importa el tamaño de la muestra.

Page 97: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

97

Distribución t-Student

Si x-barra y s2 son la media y la varianza de una muestra aleatoria de tamaño n tomada de una población normal con media m y la varianza s2, entonces

tiene una distribución t-student con n-1 grados de libertad.

ns

xt

/

Page 98: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

98

Distribución t-Student

Para usar la distribución normal es necesario conocer el valor de la desviación estandar poblacional s (distribución estándar poblacional). Como es más común el desconocimiento, entonces se estima s a través de s (desviación estándar muestral) y se usa la distribución t.

n

xz

/

ns

xt

/

Page 99: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

99

Ditribución t-StudentComparación de una ditribución normal estándar con una distribución t con 1 grado de libertad

Page 100: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

100

Ditribución t-StudentComparación de una ditribución normal estándar con una distribución t con 1 y 3 grados de libertad.

Page 101: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

101

Ejemplo

Suponga que usted tiene una técnica que puede modificar la edad a la cual los niños empiezan a hablar. En su localidad, el promedio de edad, en la cual un niño emite su primera palabra, es 13 meses. No conoce la desviación estandar poblacional. Usted aplica dicha técnica a una muestra de 15 niños. Los resultados son los siguientes:8, 9, 10, 15, 18, 17, 12, 11, 7, 8, 10, 11, 8, 9, 12. n = 15, x-barra = 11.0, desviación estándar s = 3.34. Si la media poblacional (verdadera) es 13 meses, ¿cuál es la probabilidad de encontrar un valor igual o menor de x-barra de 11 meses?

Page 102: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

102

Ditribución t-StudentSe tiene que m = 13, s = 3.34, x-barra = 11 y n = 15. Sustituyendo se obtiene:

32.215/34.3

1311

/

ns

xt

Page 103: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

103

Ditribución t-Student

Page 104: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

104

5.4 Distribución binomial

Un experimento binomial tiene las siguientes características:

1. El experimento consiste de n ensayos idénticos

2.Cada ensayo produce uno de dos resultados posibles (éxito o fracaso)

3.La probabilidad de éxito en un sólo ensayo es p, y es constante para todos los ensayos (la probabilidad de fracaso es q = 1 - p).

Page 105: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

105

5.4 Distribución binomial

Un experimento binomial tiene las siguientes características:

4. Los ensayos son independientes entre si.

5. El experimentador está interesado en la variable y, que representa el número de aciertos observados en los n ensayos.

Page 106: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

106

5.4 Distribución binomial

Ejemplo de lanzar una moneda:

Para n = 1 ensayo, como se tienen dos puntos muestrales, E1 representado por A = águila

(éxito), y E2 representado por S = sol (fracaso),

con probabilidades p y q respectivamente.

Dado que y es el número de aciertos en n los posibles resultados en un ensayo son y = 1 cuando ocurre águila y y = 0 cuando es sol.

Page 107: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

107

5.4 Distribución binomial

Ejemplo de lanzar una moneda:

Para n = 2 ensayos, las probabilidades de los puntos muestrales se calculan fácilmente debido a que cada punto es una intersección de dos eventos independientes, que son los resultados del primer y segundo ensayos. Por lo tanto la probabilidad de los eventos se calcula por la ley multiplicativa de la probabilidad, esto es:

Page 108: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

108

5.4 Distribución binomial

Ejemplo de lanzar una moneda:

P(E1) = P(AA) = P(A)P(A) = p2 y = 2

P(E2) = P(AS) = P(A)P(S) = pq y = 1

P(E3) = P(SA) = P(S)P(A) = pq y = 1

P(E4) = P(SS) = P(S)P(S) = q2 y = 0

Page 109: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

109

5.4 Distribución binomial

Ejemplo de lanzar una moneda:

De esta forma, las probabilidades se representan como:

y p(y )

0 p2

1 2 pq

2 q2

Page 110: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

110

5.4 Distribución binomial

Ejemplo de lanzar una moneda:

Si la moneda es legal, entonces p = 0.50, se tiene que:

y p(y ) Si p = 0.5

0 p20.25

1 2 pq 0.50

2 q20.25

Page 111: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

111

5.4 Distribución binomial

Ejemplo de lanzar una moneda:

La distribución de probabilidad se obtiene de la expansión de (p + q)n; que para n = 2 es:

p y p q p pq qy

( ) ( ) 2 2 2

0

2

2 1

Page 112: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

112

Si X es una v.a. Binomial que denota el número de éxitos en “n” experimentos independientes, entonces su función distribución de probabilidad está dada como:

donde x = 0,1,2,...,n.Además Media: = np Varianza: 2 = npq

xnxxn qpCpnxbxf ),;()(

5.4 Distribución binomial

Page 113: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

113

5.5 Distribución Normal y las poblaciones discretas

Binomial

Page 114: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

114

Aplicaciones.La distribución de normal se emplea muchas veces como una aproximación de valores en una población discreta. En situaciones, debe tenrse especial cuidado para asegurar que las probabilidades se calculan de manera precisa.

Page 115: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

115

Aplicaciones.

Considérese el siguiente ejemplo: Se sabe que el CI de una población está distribuido normalmente en forma aproximada con =100 y = 15. ¿Cuál es la probabilidad de que un individuo seleccionado al azar tenga un CI de por lo menos 125? Si se hace X = IC de una persona elegida al azar, deseamos P(X 125).

Page 116: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

116

Aplicaciones. (cont.)

La tentación aquí es estandarizar como en los ejemplos anteriores. Sin embargo, la población del CI es discreta en realidad, ya que los CI son de valor entero, y la curva normal es una aproximación a un histograma de probabilidad discreta.

Page 117: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

117

Aplicaciones. (cont.)

Los rectángulos del histograma están centrados como enteros, y los CI de por lo menos 125 corresponden a rectángulos que se inician en 124.5. En realidad deseamos P(X 124.5), que ahora se puede estandarizar para obtener P(Z 1.63) = 0.0516.

Page 118: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

118

Aplicaciones. (cont.)

Si hubieramos estandarizado X 125, habríamos obtenido P(Z 1.67) = 0.0475. La diferencia no es grande, pero la respuesta 0.0516 es más precisa. Análogamente, P(X = 125) sería más apropiado por el área entre 124.5 y 125.5. Ya que el área bajo la curva normal arriba del valor único de 125 es cero.

Page 119: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

119

Aplicaciones. (cont.)

La corrección para la discretización de la distribución subyacente se llama con frecuencia corrección de continuidad. Es útil en la siguiente aplicación de la distribución normal

Page 120: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

120

Aproximación normal a la distribución binomialRecordemos que el valor medio y la desviación estándar de una variable aleatoria X binomial son x = np x = (npq), respectivamente. El siguiente histograma muestra una distribución binomial con n = 20, p = 0.6 [así que = 12, = [20(0.6)(0.4)]1/2 = 2.19.

Page 121: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

121

Aproximación normal a la binomialUna curva normal con valor medio y desviación estándar igual a los valores correspondientes para la distribución binomial se ha sobrepuesto en el histograma de probabilidad. Aun cuando el histograma esta un poco sesgado (porque p 0.5), la curva normal da una buena aproximación, en especial en la parte media de la figura.

Page 122: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

122

Aproximación normal a la binomial

Page 123: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

123

Aproximación normal a la distribución binomial

El área de cualquier rectángulo (probabilidad de cualquier valor de X particular), excepto los de las colas de los extremos, se puede aproximar con presición mediante el área de la curva normal correspondiente. Por ejemplo, P(X = 10) = b(X=10; n =20, p = 0.6) = 0.117, mientras que el área bajo la curva normal entre 9.5 y 10.5 es P(-1.14 < Z < -0.68) = 0.1212.

Page 124: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

124

Aproximación normal a la distribución binomial

Más generalmente, mientras el histograma de probabilidad binomial no esté demasiado sesgado, las probabilidades binomiales se pueden aproximar bien por áres de curva normal. Se dice entonces que X tiene aproximadamente una distribución normal.

Page 125: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

125

PROPOSICION.

Sea X una V.A. Binomial basada en n intentos con probabilidad de éxito p. Entonces, si el histograma de probabilidad binomial no está demasiado sesgado, X tiene aproximadamente una distribución normal con = np = (npq).

Page 126: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

126

PROPOSICION.

En particular, para x = un valor posible de X, P(X x) = B(x;n,p) (área bajo la curva normal a la izquierda de x + 0.5)

En la práctica la aproximación es adecuada si np 5 y nq 5

npq

npx 5.0

Page 127: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

127

5.6 Papel De Probabilidad Normal

La gráfica de papel de Probabilidad Normal, o simplemente gráfica de probabilidad normal, es un procedimiento útil para verificar si un conjunto de datos puede ser adecuadamente modelado por una distribución normal (Bondad de Ajuste). Este procedimiento consiste en construir una gráfica en el plano cartesiano, en donde, en el eje horizontal se grafican los datos y en el eje vertical la probabilidad empírica (acumulada) de los datos sobre una escala de probabilidad normal.

Page 128: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

128

Es decir, es una gráfica que representa la distribución normal acumulada de los datos sobre una escala de probabilidad normal. Para construir la gráfica de probabilidad normal, deben disponerse los datos en orden ascendente y dibujar el k-ésimo de estos datos ordenados contra su punto de probabilidad acumulada Pk = (k - 1/2)/N sobre papel de probabilidad normal. Si la distribución de los datos es normal, esta gráfica deberá parecer una línea recta.

Papel De Probabilidad Normal

Page 129: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

129

X X X X X-2.8 -3.4 -3.6 -2.6 -3.8-2.8 1.6 0.4 3.4 -0.85.2 -3.4 0.4 0.4 0.21.2 2.6 1.4 -2.6 4.2

-0.8 2.6 1.4 1.4 0.2

Ejemplo

Papel De Probabilidad Normal

Page 130: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

130

EjemploOrden

K Xi

Pk = (k - 1/2)/25 Orden K Xi

Pk = (k - 1/2)/25

1 -3.8 0.02 14 0.4 0.542 -3.6 0.06 15 0.4 0.583 -3.4 0.10 16 1.2 0.624 -3.4 0.14 17 1.4 0.665 -2.8 0.18 18 1.4 0.706 -2.8 0.22 19 1.4 0.747 -2.6 0.26 20 1.6 0.788 -2.6 0.30 21 2.6 0.829 -0.8 0.34 22 2.6 0.86

10 -0.8 0.38 23 3.4 0.9011 0.2 0.42 24 4.2 0.9412 0.2 0.46 25 5.2 0.9813 0.4 0.50

Papel De Probabilidad Normal

Page 131: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

131

Ejemplo

Papel De Probabilidad Normal

Page 132: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

132

6543210-1-2-3-4

2

1

0

-1

-2

Nor

mal

Sco

re

Residual

Normal Probability Plot of the Residuals(response is respuest)

Papel De Probabilidad Normal

Page 133: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

133

-

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

0 1 2 3 4 5 6 7 8

densidad Acumulada

Distribución NormalMedia 4, Desviación Estandar 1.5

Page 134: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

134

-

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

0 1 2 3 4 5 6 7 8

densidad Acumulada

Distribución NormalMedia 4, varianza 1.5

Page 135: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

135

Distribución NormalMedia 4, varianza 1.5

Acumulada

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6 7 8

Acumulada

Page 136: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

136

Distribución NormalMedia 4, varianza 1.5

Acumulada

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6 7 8

Acumulada

Page 137: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

137

EjemploOrden

K Xi

Pk = (k - 1/2)/25 Orden K Xi

Pk = (k - 1/2)/25

1 -3.8 0.02 14 0.4 0.542 -3.6 0.06 15 0.4 0.583 -3.4 0.10 16 1.2 0.624 -3.4 0.14 17 1.4 0.665 -2.8 0.18 18 1.4 0.706 -2.8 0.22 19 1.4 0.747 -2.6 0.26 20 1.6 0.788 -2.6 0.30 21 2.6 0.829 -0.8 0.34 22 2.6 0.86

10 -0.8 0.38 23 3.4 0.9011 0.2 0.42 24 4.2 0.9412 0.2 0.46 25 5.2 0.9813 0.4 0.50

Papel De Probabilidad Normal

Page 138: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

138

A Pk = (k - 1/2)/N se le conoce como función empírica de distribución. Es muy utilizada en estimaciones no paramétricas, así como en estimaciones de datos de tiempos de vida y datos de confiabilidad.

NOTA: Así como se tiene papel de probabilidad normal, también existe otros tipos de gráficos de probabilidad para otras distribuciones.

Papel De Probabilidad Normal

Page 139: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

139

Papel De Probabilidad Normal

Pk = (k - 1/2)/25

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6

Page 140: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

140

Papel De Probabilidad Normal

Pk = (k - 1/2)/25

-6.0000

-4.0000

-2.0000

0.0000

2.0000

4.0000

6.0000

-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6

Page 141: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

141

•  Ejercicio de Papel de probabilidad Normal.

Se prueba la duración de un componente electrónico bajo condiciones de temperatura alta para acelerar el mecanismo de falla. A continuación se proporciona el tiempo de falla (en horas) de 20 componentes seleccionados al azar. Haga una gráfica de los datos sobre papel de probabilidad normal. ¿El tiempo de falla parece tener una distribución normal?

Papel De Probabilidad Normal

Page 142: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

142

• Tiempos de falla

Papel De Probabilidad Normal

176.1 76.6 150.4 197.635.3 24.7 55.0 73.0

124.5 155.7 34.9 122.890.6 2.4 46.0 133.899.6 131.5 40.4 40.4

Page 143: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

143

Papel De Probabilidad Normal

j Xj (j-0.5)/20 j Xj (j-0.5)/201 2.4 11 90.6 52.50%2 24.7 12 99.6 57.50%3 34.9 13 122.8 62.50%4 35.3 17.50% 14 124.5 67.50%5 40.4 22.50% 15 131.5 72.50%6 40.4 27.50% 16 133.8 77.50%7 46 32.50% 17 150.4 82.50%8 55 37.50% 18 155.7 87.50%9 73 42.50% 19 176.1 92.50%

10 76.6 47.50% 20 197.6

Page 144: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

144

Papel De Probabilidad Normal

j Xj (j-0.5)/20 j Xj (j-0.5)/201 2.4 2.5% 11 90.6 52.5%2 24.7 7.5% 12 99.6 57.5%3 34.9 12.5% 13 122.8 62.5%4 35.3 17.5% 14 124.5 67.5%5 40.4 22.5% 15 131.5 72.5%6 40.4 27.5% 16 133.8 77.5%7 46 32.5% 17 150.4 82.5%8 55 37.5% 18 155.7 87.5%9 73 42.5% 19 176.1 92.5%

10 76.6 47.5% 20 197.6 97.5%

Page 145: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

145

Page 146: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

1460 30 60 90 120 150 180 210

j Xj (j-0.5)/20 j Xj (j-0.5)/201 2.4 2.5% 11 90.6 52.5%2 24.7 7.5% 12 99.6 57.5%3 34.9 12.5% 13 122.8 62.5%4 35.3 17.5% 14 124.5 67.5%5 40.4 22.5% 15 131.5 72.5%6 40.4 27.5% 16 133.8 77.5%7 46 32.5% 17 150.4 82.5%8 55 37.5% 18 155.7 87.5%9 73 42.5% 19 176.1 92.5%

10 76.6 47.5% 20 197.6 97.5%

Page 147: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

147

Normal Probability Plot

0 40 80 120 160 200

Tiempos

0.1

1

5

20

50

80

95

99

99.9

perc

enta

gePapel De Probabilidad Normal

Page 148: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

148

Normal Probability Plot

0 40 80 120 160 200

Tiempos

0.1

1

5

20

50

80

95

99

99.9

perc

enta

ge

Page 149: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

149

6. Distribución Ji Cuadrada

Modulo I

Especialidad en Métodos Estadísticos

CIMAT – Unidad Aguascalientes

Page 150: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

150

6.1 Importancia De La Distribución Ji Cuadrada

Hemos visto que el estimar (conocer) la varianza s2 resulta fundamental para procedimientos de distribución muestral de la media, así como para procedimientos de inferencia estadística, como se vera más adelante en la especialidad. Existen muchas aplicaciones prácticas en donde s2 es el objetivo primario de la investigación experimental. (Precisión en el llenado de bolsas). En estos casos s2 adquiere una mayor importancia que la media de la población.

Page 151: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

151

Distribución Ji Cuadrada

Las partes producidas por un proceso de manufactura deben ser producidas con un mínimo de variabilidad para reducir el número de productos fuera del rango aceptable (defectuosos). En general se desea mantener una varianza mínima en las características de calidad de un producto industrial para alcanzar el control del proceso y minimizar el porcentaje de productos de baja calidad.

Page 152: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

152

Distribución Ji Cuadrada

La varianza muestral

Es un estimador insesgado de la varianza de la población s2. La distribución muestral de s2, generada mediante muestras repetidas, es una distribución de probabilidad que empieza en s2 = 0 (ya que no puede ser negativa) con media igual a s2. La distribución no es simétrica.

1

)(1

2

2

n

xxs

n

ii

Page 153: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

153

Distribución Ji Cuadrada

La forma de la distribución depende del número de datos, así como de la forma de la distribución de origen. Si la población de origen de las muestras es normal, entonces la distribución estandarizada que se obtiene es la Ji- cuadrada, calculada como en la siguiente expresión:

2

22 )1(

sn

Page 154: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

154

Distribución Ji Cuadrada(Relación con la distribución normal)

Si X tiene distribución normal estándar, entonces X2 tiene la distribución gama especial a la que nos referimos como la distribución ji cuadrada con = 1 grado de libertad. La Ji cuadrada es importante en problemas de muestreo de poblaciones normales.

Page 155: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

155

Distribución Ji Cuadrada

Una variable aleatoria x tiene una distribución ji cuadrada (2) con (nu) grados de libertad, si su densidad está dada por:

formaotracualquierde

xparaexxf

x

0

0)2/(2

1)(

2/2

2

2/

Page 156: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

156

Distribución Ji Cuadrada

Función gama = ?

para > 0a

casos importantes:

para k entero.

0

1)( dyey y

)2/1(

)!1()( kk

Page 157: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

157

Teorema 3. Si s2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal cuya varianza es 2, entonces:

2

22 )1(

sn

es el valor de una variable aleatoria que tiene distribución Ji-cuadrada con parámetro = n - 1 grados de libertad

Distribución Ji Cuadrada(6.3 Estimación de Varianzas)

Page 158: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

158

Distribución Ji Cuadrada

• Ejemplo 8.2 libro Estadística Matemática (Freund & Walpole).

• Supóngase que el espesor de una parte utilizada en un semiconductor es la dimensión crítica y que el proceso de manufactura de estas partes se considera bajo control si la variación real o verdadera, entre los espesores de las partes, está dada por una desviación estándar no mayor que = 0,0006 pulgadas.

Page 159: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

159

Distribución Ji Cuadrada

• Para mantener controlado el proceso se toman muestras aleatorias de tamaño n = 20 en forma periódica y se considera fuera de control” si la probabilidad es 0.01 o menor, de que S2 tome un valor mayor que o igual al valor al de la muestra observada. ¿Qué se puede concluir acerca del proceso si la desviación estándar de esta muestra aleatoria periódica es s = 0.84 milésimas de pulgada?

Page 160: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

160

Distribución Ji Cuadrada

P(S2 > 0.842 | que = 0.60) 0.01

 Solución:

El proceso se declara “fuera de control” si con n = 20 y = 0.60 excede .

191.36219,01.

Page 161: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

161

Distribución Ji Cuadrada

Como

es mayor que 36.191, el proceso se declara fuera de control.

24.37)60.0(

)84.0)(120()1(2

2

2

22

sn

0074.0)24.37()84.0( 222 PSP

Page 162: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

162

6.2 Uso de Chi-Cuadrada en pruebas de Bondad de Ajuste

Page 163: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

163

Uso De Ji-cuadrada

• Prueba de Bondad de Ajuste: Es una

prueba que se aplica a situaciones en las

cuales se desea determinar si un conjunto de

datos tomados al azar puede considerarse

como una muestra de una población con

cierta distribución dada.

Page 164: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

164

Uso de Ji-cuadrada• Procedimiento: El procedimiento consiste en

comparar una muestra aleatoria, con una distribución propuesta teórica. Se requiere de una muestra aleatoria de tamaño n proveniente de la población cuya distribución de probabilidad es desconocida. Estas observaciones se acomodan en un histograma de frecuencia, el cual tienen k intervalos de clase.

Page 165: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

165

Uso de Ji-cuadrada

• Procedimiento: Sea Oi la frecuencia

observada en el i-ésimo intervalo de clase. Por

otro lado, de la distribución de probabilidad

propuesta se calcula la frecuencia esperada en

el i-ésimo intervalo de clase, la cual se denota

por Ei. Entonces el estadístico de prueba es:

Page 166: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

166

Uso de Ji-cuadrada

k

i i

ii

E

EO

1

220

)(

c2 tiene una distribución aproximada Ji-cuadrada con k-p-1 grados de libertad, donde p representa el número de parámetros de la distribución propuesta estimada por los estadísticos muestrales k el número de intervalos.

Page 167: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

167

Uso de Ji-cuadrada

Esta aproximación mejora a medida que n aumenta. Debe rechazarse la hipótesis de que la distribución de la población es la distribución propuesta, si el valor calculado del estadístico de prueba es

Pruebas de hipótesis.....

21,

20 pk

Page 168: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

168

Uso de Ji-cuadradaDistribución especificada de manera completa

Ejemplo: un científico desarrolla un algoritmo para generar enteros seudoaleatorios en el intervalo 0 a 9. El científico codifica el algoritmo y genera 1000 dígitos seudoaleatorios. La siguiente tabla contiene los datos como frecuencias observadas. ¿Existe evidencia de que el generador de números aleatorios funciona de manera correcta?. Utilice un a = 0.05

Page 169: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

169

Datos:

0 1 2 3 4 5 6 7 8 9 nFrecuencias observadas Oi 94 93 112 101 104 95 100 99 108 94 1000Frecuencias esperadas Ei 100 100 100 100 100 100 100 100 100 100 1000

Uso de Ji-cuadradaDistribución especificada de manera completa

Page 170: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

170

Uso de Ji-cuadradaDistribución especificada de manera completa

Si el generador de números aleatorios trabaja correctamente, entonces los valores 0-9 deben tener una distribución uniforme discreta, lo que implica que cada uno de los enteros debe presentarse exactamente 100 veces. Por tanto las frecuencias esperadas son Ei = 100 para cada i = 0,1, . . ., 9.

Page 171: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

171

Uso de Ji-cuadradaDistribución especificada de manera completa

Estas frecuencias esperadas también aparecieron en la tabla anterior. Puesto que las frecuencias esperadas pueden calcularse sin estimar ningún parámetro a partir de los datos muestrales, el estadístico de prueba Ji-cuadrada de bondad de ajuste tendrá k - p - 1 = 9 grados de libertad.

Page 172: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

172

Uso de Ji-cuadradaDistribución especificada de manera completa

Aplicamos el procedimiento siguiendo los siguientes pasos:

1. La variable de interés es de la forma de la distribución de los enteros seudoaleatorios sobre el intervalos 0 a 9.

2. Ho: La distribución es uniforme discreta.

3. Ha: La forma de la distribución no es uniforme discreta.

4. a = 0.05

Page 173: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

173

Uso de Ji-cuadradaDistribución especificada de manera completa

5. El estadístico de prueba es:

6. Rechazar Ho si:

k

i i

ii

E

EO

1

220

)(

92.1629,05.0

20

Page 174: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

174

Uso de Ji-cuadradaDistribución especificada de manera completa

7. Calcular estadístico de prueba en base a valores esperados y observados.

8. Concluir: Puesto que

no es posible rechazar la hipótesis Ho. Por consiguiente parece ser que el generador de números aleatorios trabaja de forma consistente.

72.3100

)10094(...

100)10093(

100)10094()( 222

1

2

k

i i

ii

EEO

92.1672.3 29,05.0

20

Page 175: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

175

6.3 Empleo de Chi-Cuadrada en pruebas de Bondad de Ajuste de

Normalidad

Page 176: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

176

Uso de Ji-cuadradaDistribución continua

Ejemplo: un ingeniero del departamento de manufactura prueba una fuente de alimentación utilizada en una computadora portatil. Con un a = 0.05, desea determinar si el voltaje de salida está descrito de manera adecuada por una distribución normal. A partir de una muestra aleatoria de n = 100 unidades, obtiene las estimaciones muestrales de la media y la desviación estándar voltssyvoltsx 08.004.5

Page 177: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

177

Uso de Ji-cuadradaDistribución continua

Una practica común en la construcción de intervalos de clase para la distribución de frecuencia empleada en la prueba ji-cuadrada de bondad de ajuste, es seleccionar los límites de las clases de modo que las frecuencias esperadas Ei = npi sean iguales para todas las celdas. Para utilizar este método, se desea escoger las fronteras de las celdas a0, a1, ..., ak para las k clases, de modo que las probabilidades pi sean iguales. Donde

i

i

a

a

iii dxxfaXaPp1

)()( 1

Page 178: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

178

Uso de Ji-cuadradaDistribución continua

Supóngase que se desea utilizar k = 8 celdas. Para la distribución normal estándar, los intervalos que dividen la escala en ocho segmentos igualmente probables son [0, 0.32), [0.32, 0.675), [0.675, 1.15) y [1.15, ) junto con sus cuatro imágenes que están del otro lado del cero. Para cada intervalo pi = 1/8 = 0.125, de modo que las frecuencias esperadas de las celdas son Ei = npi = 100 (0.125) = 12.5. La tabla completa de frecuencias observadas y esperadas es la siguiente .

Page 179: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

179

Uso de Ji-cuadradaDistribución continua

Intervalo de Clase

Frecuencia

observada Oi

Frecuencia

esperada Ei

X < 4.948 12 12.5

4.948 <= X < 4.986 14 12.5

4.986 <= X < 5.014 12 12.5

5.014 <= X < 5.04 13 12.5

5.04 <= X < 5.066 12 12.5

5.066 <= X < 5.094 11 12.5

5.094 <= X < 5.132 12 12.5

5.132 <= X 14 12.5

Page 180: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

180

Uso de Ji-cuadradaDistribución continua

1. La variable de interés es la distribución del voltaje de la fuente de alimentación.

2. H0: La forma de la distribución es normal

3. H1: La forma de la distribución no es normal4. a = 0.055. El estadístico de prueba es

6. Como se han estimado los parámetros de la distribución, el estadístico de prueba tiene k - p - 1 = 8 - 2 - 1 = 5 grados de libertad.

k

i i

ii

E

EO

1

220

)(

Page 181: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

181

Uso de Ji-cuadradaDistribución continua

7. Cálculos

8. Conclusiones: Como

no se rechaza H0, por lo que no hay evidencia fuerte que indique que el voltaje de salida no esté distribuido de manera normal. El valor P para el estadístico ji-cuadrada es P = 0.9861

64.05.12

)5.1214(...

5.12)5.1214(

5.12)5.1212()( 222

1

2

k

i i

ii

EEO

07.1164.0 25,05.0

20

64.020

Page 182: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

182

6.4 Empleo De Chi-cuadrada En Tablas De Contingencia.

Page 183: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

183

Uso de Ji-cuadrada

Otra aplicación de la distribución Ji-cuadrada es en tablas de contingencia. Una tabla de contingencia es una tabla de frecuencias en dos direcciones.

La tabla de contingencia más simple está compuesta por dos columnas y dos renglones; se denomina tabla de 2 x 2.

Page 184: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

184

6.5 Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

El siguiente ejemplo contiene los datos de una muestra de 917 delincuentes hombres, sentenciados en el Distrito Federal; considerando las variables estado civil (soltero y casado) y el tipo de delito cometido (contra las personas o contra la propiedad)

Page 185: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

185

Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

Delincuentes sentenciados en el D.F. por tipo de delito y Edo civil

Estad civilDelitos contra la

propiedadContra las Personas Suma

Soltero 213 267 480Casado 137 300 437Suma 350 567 917

Lo que se quiere determinar es la existencia o no de asociación entre el estado civil y el tipo de delito.

Page 186: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

186

Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

Para esta determinación se calculan las frecuencias que deberían esperarse de no existir ninguna relación entre las dos variables, esto es, en caso de que fueran independientes. Este cálculo lo hacemos con el siguiente razonamiento: Debería de haber igual proporción de solteros en las dos muestras, esto es, entre los delincuentes contra la propiedad y contra las personas.

Page 187: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

187

Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

La proporción de solteros en las dos muestras es de 480/917 = 0.523; igual proporción debería existir entre las dos muestras que calculamos multiplicando 567 x 0.523 = 296.54 solteros en delitos contra las personas. Y 350 x 0.523 = 182.3 solteros en delitos contra la propiedad.

Page 188: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

188

Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

OBSERVADOS

Estad civilDelitos contra la

propiedadContra las Personas Suma

Soltero 213 267 480Casado 137 300 437Suma 350 567 917

ESPERADOS

Estad civilDelitos contra la

propiedadContra las Personas Suma

Soltero 183.2 296.8 480Casado 166.8 270.2 437Suma 350 567 917

Page 189: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

189

Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

Pasos a seguir:

1) Se desea probar si existe una asociación entre el estado civil y el tipo de delito cometido (Ho: No existe asociación).

2) Se calcula la Estadística de prueba

k

i i

ii

E

EO

1

220

)(

Page 190: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

190

Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

Pasos a seguir:

3) Se compara con la Ji-cuadrada de tablas de un grado de libertad n = (r-1) (c-1) = 1. Donde r = número de renglones y c = número de columnas.

4) Si si c2 calculada > c2,a n entonces se rechaza

Ho y se concluye que si existe asociación, de lo contrario se concluye que no se tiene evidencia de asociación.

Page 191: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

191

Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

En este ejemplo:

1) Ho: No existe asociación entre Edo. Civil y Tipo de Delito.

2) Se calcula la Estadística de prueba

k

i i

ii

EEO

1

220

)(

44.162.270

)2.270300(8.166

)8.166137(8.296

)8.296267(2.183

)2.183213( 2222

Page 192: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

192

Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

En este ejemplo:

3) Se compara contra c0.01,1 = 6.63.

4) Como 16.44 es mayor que 6.63, se rechaza Ho y se concluye que si existe una asociación entre el estado civil del delincuente y el tipo de delito que comete.

Page 193: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

193

Uso de Ji-cuadradaUso en tablas de contingencia 2 x 2

Page 194: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

194

6.6 Restricciones en el uso de Ji-cuadradaDebe tenerse especial cuidado de emplear c2 de manera apropiada, ya que existen algunas restricciones en su empleo. Algunas de las restricciones se deben a que la formula empleada constituye una aproximación.

Restricciones:

1) Sólo deben emplearse datos expresados en sus frecuencias absolutas (No deben emplearse porcentajes o puntajes de escalas)

2) Los valores observados o esperados por celda, no deben ser inferior a 5

Page 195: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

195

Uso de Ji-cuadradaRestricciones en el uso de Ji-cuadrada

3) La suma de las frecuencias esperadas debe ser igual a la suma de los frecuencias observadas.

4) Las unidades deben ser excluyentes, es decir sólo pueden asignarse en una sola casilla.

Page 196: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

196

6.7 Teorema de Chebyshev

Page 197: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

197

Áreas bajo la distribución Normal a más menos k desviaciones estándar

Page 198: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

198

Áreas bajo la distribución Normal a más menos k desviaciones estándar estándar

Page 199: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

199

Teorema de Chebyshev

Si m y s son, respectivamente, la media y la desviación estándar de la variable aleatoria X, entonces para una constante positiva k cualquiera la probabilidad es cuando menos 1 - 1/k2 de que X tomará un valor contenido en k desviaciones estándar de la media; en forma simbólica se tiene,

2

11)|(|

kkXP

Page 200: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

200

Teorema de Chebyshev

2

11)|(|

kkXP

m - ks

m + ks m

menosal2

11

k

Page 201: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

201

Teorema de Chebyshev

Por ejemplo, 3/4 es la probabilidad por lo menos, de que X tomará un valor contenido en dos desviaciones estándar; 8/9 es la probabilidad es cuando menos, de que X tomará un valor contenido en tres desviaciones estándar y 24/25 es por lo menos la probabilidad, de que X tomará un valor contenido en cinco desviaciones estándar de la media. En este sentido la s controla la diseminación o dispersión de la distribución de una variable aleatoria.

Page 202: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

202

Teorema de Chebyshev

La probabilidad del teorema de Chebyshev es, claramente sólo un límite inferior; si la probabilidad de que una variable aleatoria dada tome un valor contenido en k desviaciones estándar de la media es mayor que 1 - 1/k2, esta bien, pero esta es solo una cota inferior. Sólo cuando se conoce la distribución de una variable aleatoria puede determinarse exactamente la probabilidad

Page 203: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

203

Áreas bajo la distribución Normal a más menos k desviaciones estándar estándar

3/4 =75%

8/9=89%

15/16=93.7%

0%

1-1/k porcentaje del áreas debajo de la distribución F a k desviaciones estándares

Page 204: 1 Módulo 2 Segunda Parte Especialidad en Métodos Estadísticos Centro de Investigación en Matemáticas, A. C. rabreu@cimat.mx

204

Distribuciones muestrales de la media muestral. Guía para el uso de la distribución t, normal estándar y el Teorema del Límite Central.

* Rigurosamente esn

SX

t

, pero para n 30 podemos aproximar la distribución t por una normal estándar, por el T.L.C.

Nota: La regla n 30 es una buena aproximación en la gran mayoría de los casos, salvo cuando la población tiene una distribución muy asimétrica, o muy distinta de la forma de campana.

Estadístico:

? = Consultar a un experto en estadística

Población

Normal

No Normal

s conocid

a

s desconocida

s desconocida

s conocida

n 30

n 30

n 30

n < 30

n < 30

n < 30

n 30

n < 30

n

XZ

n

SX

t

n

XZ

n

SX

Z

n

SX

Z

n

XZ

?

?

*

T.L.C.

No importa el tamaño de la muestra.