20
IES Padre Poveda (Guadix) Estadística Departamento de Matemáticas 1 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística población que se va a investigar. nos indica el número de unidades que hay en la población por cada elemento de la muestra. UNIDAD 7 MUESTREO E INFERENCIA ESTADÍSTICA 1. INTRODUCCIÓN. DEFINICIONES BÁSICAS Cada 10 años se realiza en España un estudio exhaustivo de todos sus habitantes mediante la realización del censo de la población, obteniendo información de todas las personas del país. Sin embargo, la inversión económica, temporal, de medios materiales y humanos que se realiza es muy cuantiosa. El padrón continuo o registro de población, permanentemente actualizado, permite que se puedan proporcionar cifras de población con mucha frecuencia así que el objetivo original del censo, actualizar el número de habitantes de nuestro país, se ha convertido en secundario. Si una persona no está inscrita en el Censo Electoral no podrá ejercer su derecho al voto. También son necesarias estas Investigaciones completas (se estudia la población entera) en estadísticas oficiales de nacimientos, muertes así como en Industria cuando se inspeccionan productos muy costosos o peligrosos. Pero en muchos casos por razones económicas, de tiempo, humanas...., puede no ser posible o conveniente obtener información de todas las unidades de la población, por lo que el estudio se reducirá a una muestra o parte de la misma (Investigación muestral). El estudio de modelos reducidos de la población tiene como finalidad obtener información precisa sobre la población considerada observando solo una parte de ella, es decir, que los resultados obtenidos en la muestra son extrapolables a la población. Ejemplos de este tipo son los sondeos de opinión, experimentos y control estadístico de calidad… Definiciones básicas: Estadística: Ciencia que recoge y ordena los datos referidos a una o varias características para su posterior análisis e interpretación. Población: Colección o conjunto de elementos/individuos/unidades objeto de estudio de alguna de sus características en una investigación estadística. Tamaño de la población (N): Número de elementos/individuos/unidades que la componen. Puede ser finita o infinita. Censo: Enumeración y anotación de ciertas características de TODOS los elementos de la población. En muchos casos puede no ser posible o conveniente obtener información de todas las unidades de la población, por lo que el estudio se reducirá a una parte de la misma. Muestra: Subconjunto de la población que se observa para extraer información sobre la población completa. Se procurará, por tanto, que la muestra sea lo más representativa posible de los elementos de la población en el sentido de que proporcione buena información sobre ésta. Tamaño de la muestra (n): Número de elementos/individuos/unidades que la componen. Muestreo: Procedimiento que se utiliza para extraer una muestra representativa de la población. Estimación: Procedimiento que nos proporciona información sobre un parámetro desconocido de la población a partir de la información que nos aporta la muestra. Parámetro poblacional: Característica numérica de la población (media poblacional, varianza poblacional, desviación típica poblacional…). Estadístico o parámetro muestral: Característica numérica de la muestra (media muestral, varianza muestral, cuasivarianza muestral…). Estimador de un parámetro poblacional: Estadístico que se utiliza para estimar ese parámetro poblacional. Estimación puntual: Valor numérico que toma un estimador para una muestra concreta. Estimación por intervalos: Se obtiene un intervalo que contendrá al verdadero valor del parámetro desconocido con una determinada probabilidad. Inferencia estadística: Trata de obtener conclusiones sobre la población a partir de la información proporcionada por una muestra aleatoria. Los resultados obtenidos de la muestra se extrapolan a la población. Si N es el tamaño de la población y n el tamaño muestral se define: Fracción de muestreo N n f = : Indica (al multiplicar por 100) el porcentaje de la Factor o coeficiente de elevación: n N e f = Ejemplo: En una población de 1000 personas se desea obtener una muestra de 125 personas. Se va a investigar el 12.5% de la población. = = 125 . 0 1000 / 125 f población. la de 8 a representa muestra la de persona Cada f e = = 8 125 / 1000

U7.Muestreo e inferencia estadística...aleatorio estratificado y muestreo aleatorio por conglomerados o áreas. B. Muestreos no aleatorios (no probabilísticos): En este caso no todos

  • Upload
    others

  • View
    35

  • Download
    1

Embed Size (px)

Citation preview

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 1 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    población que se va a investigar. nos indica el número de unidades que hay en la población por cada elemento de la muestra.

    UNIDAD 7 MUESTREO E INFERENCIA ESTADÍSTICA

    1. INTRODUCCIÓN. DEFINICIONES BÁSICAS Cada 10 años se realiza en España un estudio exhaustivo de todos sus habitantes mediante la realización del censo de la población, obteniendo información de todas las personas del país. Sin embargo, la inversión económica, temporal, de medios materiales y humanos que se realiza es muy cuantiosa. El padrón continuo o registro de población, permanentemente actualizado, permite que se puedan proporcionar cifras de población con mucha frecuencia así que el objetivo original del censo, actualizar el número de habitantes de nuestro país, se ha convertido en secundario. Si una persona no está inscrita en el Censo Electoral no podrá ejercer su derecho al voto. También son necesarias estas Investigaciones completas (se estudia la población entera) en estadísticas oficiales de nacimientos, muertes así como en Industria cuando se inspeccionan productos muy costosos o peligrosos. Pero en muchos casos por razones económicas, de tiempo, humanas...., puede no ser posible o conveniente obtener información de todas las unidades de la población, por lo que el estudio se reducirá a una muestra o parte de la misma (Investigación muestral). El estudio de modelos reducidos de la población tiene como finalidad obtener información precisa sobre la población considerada observando solo una parte de ella, es decir, que los resultados obtenidos en la muestra son extrapolables a la población. Ejemplos de este tipo son los sondeos de opinión, experimentos y control estadístico de calidad…

    Definiciones básicas: Estadística: Ciencia que recoge y ordena los datos referidos a una o varias características para su posterior análisis e interpretación. Población: Colección o conjunto de elementos/individuos/unidades objeto de estudio de alguna de sus características en una investigación estadística. Tamaño de la población (N): Número de elementos/individuos/unidades que la componen. Puede ser finita o infinita. Censo: Enumeración y anotación de ciertas características de TODOS los elementos de la población. En muchos casos puede no ser posible o conveniente obtener información de todas las unidades de la población, por lo que el estudio se reducirá a una parte de la misma. Muestra: Subconjunto de la población que se observa para extraer información sobre la población completa. Se procurará, por tanto, que la muestra sea lo más representativa posible de los elementos de la población en el sentido de que proporcione buena información sobre ésta. Tamaño de la muestra (n): Número de elementos/individuos/unidades que la componen. Muestreo: Procedimiento que se utiliza para extraer una muestra representativa de la población. Estimación: Procedimiento que nos proporciona información sobre un parámetro desconocido de la población a partir de la información que nos aporta la muestra. Parámetro poblacional: Característica numérica de la población (media poblacional, varianza poblacional, desviación típica poblacional…). Estadístico o parámetro muestral: Característica numérica de la muestra (media muestral, varianza muestral, cuasivarianza muestral…). Estimador de un parámetro poblacional: Estadístico que se utiliza para estimar ese parámetro poblacional. Estimación puntual: Valor numérico que toma un estimador para una muestra concreta. Estimación por intervalos: Se obtiene un intervalo que contendrá al verdadero valor del parámetro desconocido con una determinada probabilidad. Inferencia estadística: Trata de obtener conclusiones sobre la población a partir de la información proporcionada por una muestra aleatoria. Los resultados obtenidos de la muestra se extrapolan a la población. Si N es el tamaño de la población y n el tamaño muestral se define:

    Fracción de muestreo Nnf = : Indica (al multiplicar por 100) el porcentaje de la

    Factor o coeficiente de elevación: nN

    ef =

    Ejemplo: En una población de 1000 personas se desea obtener una muestra de 125 personas. Se va a investigar el 12.5% de la población.

    ⇒== 125.01000/125fpoblación. la de 8 a representa muestra la de persona Cadafe ⇒== 8125/1000

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 2 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    2. CONVENIENCIAS DE ELEGIR UNA MUESTRA. PROBLEMAS ASOCIADOS AL USO DE MUESTRAS El objetivo del muestreo es la inferencia (inducción) de las conclusiones obtenidas en la muestra, a la población completa. Es decir, tratamos de predecir las características de una población a través de las conclusiones obtenidas para una muestra. Puesto que la inferencia (predicción) siempre supone un riesgo, es útil indicar algunos de los casos en los que conviene obtener muestras en lugar de hacer un estudio exhaustivo de la población:

    a) Cuando la población sea tan grande que el censo exceda de las posibilidades del investigador.

    b) Cuando la población sea suficientemente uniforme para que cualquier muestra dé una buena representación.

    c) Cuando el proceso de medida o investigación sea destructivo, como ocurre al comprobar la calidad de una partida de naranjas para la exportación. Analizar sus características supone cortar las naranjas para extraer su zumo. Si las analizamos todas, las destruimos todas.

    d) Razones de tiempo, economía, recursos humanos…

    Si en la selección de la muestra se cometen errores ésta puede no ser representativa y las conclusiones obtenidas a partir de la muestra no ser fiables. Por tanto, se producirán errores imprevistos e incontrolables denominados sesgos. Existen distintos tipos de sesgos:

    • Sesgo de muestreo: La incertidumbre sobre la representatividad de la muestra, propia del muestreo, que siempre se va a tener. Se reduce mejorando la selección de la muestra.

    • Sesgo de no respuesta: No responden a la encuesta aquellos que tienen un comportamiento diferenciado respecto al resto. Ejemplo: Preguntar sobre la evolución política de un país y que no den su opinión los votantes del partido de la oposición.

    • Sesgo de selección: No todas las unidades de la población tiene la misma probabilidad de formar parte de la muestra presentando además características diferentes. Ejemplo: Preguntar a la salida de un centro comercial sobre la preferencia de comprar en pequeños comercios o en grandes superficies.

    La idea de que a partir de conjuntos de datos muy grandes se obtienen conclusiones dignas de confianza NO siempre es correcta; a veces una muestra pequeña puede producir información suficiente. En cambio si esa muestra tiene el mayor tamaño posible puede ocurrir que la propia fatiga en las personas que la analizan de lugar a malos resultados debido a errores o sesgos.

    3. ALGUNOS TIPOS DE MUESTREO Existen distintas formas de seleccionar los elementos que conforman una muestra. Distinguimos entre:

    A. Muestreos aleatorios (o probabilísticos): Se basan en el principio aleatorio mediante el cual todos y cada uno de los elementos de la población tengan la misma probabilidad de ser elegidos y formar parte de la muestra. Es posible estimar el error cometido debido al muestreo y minimizarlo aumentando el tamaño de la muestra. Distinguimos cuatro tipos: muestreo aleatorio simple, muestreo aleatorio sistemático, muestreo aleatorio estratificado y muestreo aleatorio por conglomerados o áreas.

    B. Muestreos no aleatorios (no probabilísticos): En este caso no todos los elementos de la población tienen la misma probabilidad de ser elegidos para formar parte de la muestra. La elección puede hacerse según la opinión de una persona con lo cual la representatividad es totalmente subjetiva, o simplemente tomar la muestra de cualquier manera por razones de comodidad o capricho. Distinguimos varios tipos de muestreos no aleatorios: muestreo por cuotas (típico de las investigaciones de mercado), muestreo causal y muestreo intencional.

    Solo nos vamos a ocupar del estudio de muestreos aleatorios:

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 3 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    a) Muestreo aleatorio simple (m.a.s.) Se toman al azar los n elementos que han de formar parte de la muestra uno a uno y CON reemplazamiento. En este tipo de muestreo todas las posibles muestras de tamaño n tiene la misma oportunidad de ser escogidas. El m.a.s. es adecuado cuando la población es homogénea respecto a la característica que se estudia. Fíjate: Al ser muestreo con reemplazamiento, una vez elegido un elemento éste se devuelve a la población por lo que más adelante puede volver a aparecer en la muestra (muestra infinita). Para obtener una muestra por m.a.s.:

    1º) Enumeramos los elementos de la población (desde 1 a N). 2º) Se elige el tamaño n de la muestra y se seleccionan los elementos de la población, bien

    mediante una tabla de números aleatorios, bien mediante una extracción de bolas numeradas de una urna...

    Ejemplo: Dada la población { }3,2,1 formada por 3=N elementos, obtén todas las posibles muestras obtenidas por m.a.s. de tamaño 2=n . Calcula la media de cada muestra, la media de las medias muestrales y la media poblacional. ¿Qué observas?

    { } { } { } { } { } { } { } { } { }

    siempre?pasar a ¿Va Coinciden!¡ 26/33)/321(lpoblaciona Media29/189/)35.225.225.125.11( muestras las todasde Media

    3 2.5 2 2.5 2 1.5 2 1.5 1 muestra cada de Media

    3,3,2,3,1,3,3,2,2,2,1,2,3,1,2,1,1,12 tamañode Muestras

    ==++→

    ==++++++++→

    Nota: Aunque nosotros vamos a entender siempre el m.a.s. CON REPOSICIÓN, también puede darse la situación de que el muestreo fuese sin reposición, es decir, elegido un elemento de la muestra no se devuelve a la población, por lo que no puede volver a aparecer en esa muestra. Por tanto, la probabilidad de selección de la siguiente unidad de la muestra se ve afectada por el resultado de la extracción anterior.

    Ejemplo: Se quiere conocer la opinión de los 1300 estudiantes de un curso en una universidad sobre una cuestión académica. En el muestreo aleatorio simple todos deben tener la misma probabilidad de pertenecer a la muestra. Para generar una muestra de tamaño 20 se dispone de una lista numerada de los estudiantes. Un procedimiento adecuado sería disponer de una urna con bolas numeradas de 1 a 1300 y elegir sin reemplazamiento 20 bolas que serán los números de los estudiantes que van a ser encuestados.

    Ejemplo: Dada la población { }3,2,1 formada por 3=N elementos, todas las posibles muestras obtenidas sin reemplazamiento de tamaño 2=n son las siguientes:

    { } { } { } { } { } { }2,3,1,3,3,2,1,2,3,1,2,1

    Una tabla de números aleatorios está formada por grupos de dígitos obtenidos al azar y ordenados por filas y columnas. Se usan para seleccionar las unidades que deben formar parte de una muestra. La que damos al final de la unidad pertenece a Fisher y Yates. Para utilizarla se puede empezar por cualquier número y continuar hacia arriba, hacia abajo, a la derecha o a la izquierda.

    Ejemplo: Queremos seleccionar en una población de 240=N personas una muestra de 10=n mediante una tabla de números aleatorios. Para ello, asignamos un número

    entre 1 y 240 a cada persona, y elegimos al azar una de las 10 columnas de números, por ejemplo la 3ª, y como se trata de números entre 1 y 240, tomamos, por ejemplo, los 3 primeros dígitos de los números de dicha columna:

    ,357,020,504,607,173,536,605,271,804,232 ,040,383,323,416,849,893,981,424,079,975 ,524,236,391,478,214,566,616,896,076,481 ,307,273,883,835,455,840,071,374,518,507

    905,254,774,471,049,243,762,101,226,700

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 4 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    Ahora elegimos los 10 números menores o iguales que 240, y obtenemos la muestra de 10 personas.

    226,071,236,214,076,040,079,020,173,232 Si la ordenamos: .236,232,226,214,173,79,76,71,40,20

    b) Muestreo aleatorio sistemático (m.a.sis.)

    Para obtener una muestra por m.a.sis.:

    1º) Se enumeran desde 1 a N los elementos de la población, se fija el tamaño de la muestra

    n y se elige al azar uno de ellos entre 1 y nNh = (coeficiente de elevación de la

    muestra ef ). 2º) A continuación se eligen elementos igualmente espaciados a partir del primero (saltos

    numéricos iguales) del siguiente modo: 1a

    haa

    haahaa

    nn +=

    +=+=

    −1

    23

    12

    K

    Ejemplo: De una población de 1000=N edificios quiere obtenerse un m.a.sis. con tamaño

    muestral .5=n

    Solución:

    2005

    1000==h (Coeficiente de elevación de la muestra ef )

    Elegimos al azar (por ejemplo, con una tabla de números aleatorios) un número entre 1 y 200. Supongamos que ha salido 1371 =a .

    ⇒⎭⎬⎫

    =+==+==+==+=

    937200737737200537537200337337200137

    54

    32

    aaaa

    937,737,537,337,137

    c) Muestreo aleatorio estratificado (m.a.e.)

    En ocasiones la característica que se quiere estudiar no es homogénea en toda la población, sino que varía según diferentes grupos o estratos. En este caso se utiliza el m.a.e. para obtener muestras en poblaciones no homogéneas consiguiéndose así una mayor precisión y un menor error. El m.a.e. se realiza del siguiente modo:

    1º) La población de N elementos se divide en subpoblaciones o estratos homogéneos de elementos kNNN ,,, 21 K de forma que .21 NNNN k =+++ K

    2º) Se realiza en cada uno de ellos un m.a.s. o sistemático.

    Para elegir el tamaño de la muestra en cada estrato podemos seguir dos criterios: • m.a.e. con afijación de igualdad: se toma el mismo número de elementos en cada estrato.

    knnnn k ==== K21

    También se le llama m.a.e. constante o uniforme. • m.a.e. con afijación proporcional: el número de elementos seleccionados en cada estrato es

    proporcional a su tamaño.

    k

    k

    Nn

    Nn

    Nn

    Nn

    ==== K2

    2

    1

    1 , siendo ⎩⎨⎧

    +++=+++=

    k

    k

    NNNNnnnn

    K

    K

    21

    21

    También se le llama m.a.e. proporcional.

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 5 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    Ejemplo: En una población existen tres centros hospitalarios, que disponen de 100, 200 y 700 camas, respectivamente. Una investigación de los responsables sanitarios, realizada en un momento en el que todas las camas están ocupadas, pretende conocer las características sociodemográficas de los pacientes. Para ello se plantea obtener una muestra de 90 pacientes. ¿Cómo se debería llevar a cabo el muestreo aleatorio? Solución: Como se desea que en la muestra estén representados pacientes de los tres centros se opta por un muestreo estratificado considerando cada centro hospitalario como un estrato.

    Si se utiliza afijación de igualdad: 3

    9030321 ==== nnn

    Evidentemente, el centro hospitalario más pequeño tendría una representación muestral más intensa que el mayor.

    Por el contrario, si se opta por una afijación proporcional, el tamaño total de la

    muestra se repartiría proporcionalmente a los tamaños de los centros, dando lugar a muestras de tamaño 9, 18 y 63 respectivamente:

    1000700200100 =++=N 1001 =N 2002 =N 7003 =N

    91001000

    901

    1 =⇒= nn 182001000

    902

    2 =⇒= nn 637001000

    903

    3 =⇒= nn

    d) Muestreo aleatorio por conglomerados (m.a.c.)

    Para realizar un muestreo estratificado es necesario conocer con gran precisión la población de la que se quiere extraer información, y esto no siempre es posible. En cambio, en muchos estudios, la población se agrupa física o temporalmente en conglomerados que son parecidos a la población total.

    Este tipo de muestreo recibe el nombre de muestreo aleatorio por conglomerados o áreas. Es, en general, menos preciso que el muestreo aleatorio simple o el muestreo estratificado pero en algunos casos resulta más conveniente por la sencillez de su realización.

    El m.a.c. se realiza del siguiente modo:

    1º) Se divide la población en subpoblaciones más pequeñas: conglomerados, de forma que los elementos que forman cada uno de ellos son heterogéneos respecto a la característica objeto de estudio, pero los conglomerados son muy parecidos entre sí.

    2º) Se toma una muestra aleatoria simple de conglomerados y, dentro de los seleccionados,

    se podrán considerar todos sus elementos o bien muestras aleatorias extraídas de ellos.

    Ejemplo: Si se realiza un sondeo electoral, los electores se agrupan de manera natural en municipios. Si la intención de voto dentro de los municipios es similar a la de toda la población, se puede elegir primero al azar los municipios en los que muestrear y después realizar un muestreo aleatorio simple en cada uno de ellos.

    El muestreo estratificado es preferible cuando los estratos son internamente muy homogéneos con respecto a la característica que se estudia y, además, son muy diferentes entre sí en relación a dicha característica; en cambio el muestreo por conglomerados es más recomendable si los conglomerados reproducen internamente la variabilidad de la población y son bastante parecidos entre sí.

    MUESTREO ESTRATIFICADO

    MUESTREO POR CONGLOMERADOS

    Dentro estratos Homogeneidad Heterogeneidad Fuera estratos Heterogeneidad Homogeneidad Representa a la población La muestra Cada conglomerado

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 6 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    4. DISTRIBUCIÓN NORMAL La distribución Normal, también llamada de Gauss, es una de las más importantes del Cálculo de Probabilidades, no solo por el gran número de fenómenos que modeliza (naturales, económicos, sociológicos…) sino porque son muchos los experimentos aleatorios que pueden ser aproximados por esta distribución.

    Una variable aleatoria X continua sigue una distribución Normal de media μ y desviación típica σ y se escribe X ~ ( )σμ,N si cumple:

    a) La variable x puede tomar cualquier valor desde ∞− a .∞+ b) Su función de densidad viene dada por:

    ( )( )

    2

    2

    2

    21 σ

    μ

    πσ

    −−

    ⋅=

    x

    exf siendo ⎩⎨⎧

    >+∞

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 7 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    Propiedades: Si a y b son números reales positivos, para calcular

    a) ( ) =≤ aZP mirar valor en la tabla b) ( ) ( )aZPaZP

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 8 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    Primera aproximación en la asignación de probabilidades en una distribución ( )σμ ,N

    Propiedad: Si X ~ ( )σμ ,N a) El 68.26% de la población se encuentra en el intervalo ( )σμσμ +− , b) El 95.44% de la población se encuentra en el intervalo ( )σμσμ 2,2 +− c) El 99.74% de la población se encuentra en el intervalo ( )σμσμ 3,3 +−

    Ejemplo: En el ejemplo anterior: ( ) ( )

    44444 344444 21poblaciónlade

    cmcm%26.68

    ;185,165, =+− σμσμ ( ) ( );%44.95

    195,1552,2444444 3444444 21

    poblaciónlade

    cmcm=+− σμσμ ( ) ( );%74.99

    205,1453,3444444 3444444 21

    poblaciónlade

    cmcm=+− σμσμ

    5. PARÁMETROS POBLACIONALES, ESTADÍSTICOS Y ESTIMADORES Usualmente se desean conocer algunas de las características más interesantes de una población que pueden servirnos para determinar completamente su distribución de probabilidad. Estas características se llaman parámetros poblacionales.

    La inferencia estadística permite acercarnos al conocimiento de los parámetros de una población a partir de las características obtenidas de una muestra extraída de dicha población. Recordemos algunos conceptos básicos del comienzo del tema:

    Parámetro poblacional: característica numérica de la población (media, varianza, desviación típica…). Recuerda algunos parámetros poblacionales:

    Media poblacional: N

    nxN

    iii∑

    =

    ⋅= 1μ Varianza poblacional:

    ( )21

    2

    1

    2

    μμ

    −⋅

    =⋅−

    =∑∑==

    N

    nx

    N

    nxσ

    N

    iii

    N

    iii

    2

    Desviación típica poblacional: Varianza=σ Proporción poblacional: N

    nxp

    N

    iii∑

    =

    ⋅= 1

    Parámetro muestral o estadístico: característica numérica referida a la muestra. Es cualquier función definida sobre los datos de la muestra. Algunos parámetros muestrales son:

    Media muestral: n

    nxx

    n

    iii∑

    =

    ⋅= 1 Varianza muestral:

    ( )21

    2

    1

    2

    2 xn

    nx

    n

    nxxS

    n

    iii

    n

    iii

    −⋅

    =⋅−

    =∑∑==

    Cuasivarianza muestral: ( )

    21

    2

    1

    2

    2

    11ˆ x

    n

    nx

    n

    nxxS

    n

    iii

    n

    iii

    −−

    ⋅=

    ⋅−=

    ∑∑==

    Total muestral: in

    ii nxx ⋅= ∑

    =1

    Proporción muestral: n

    nxp

    n

    iii∑

    =

    ⋅= 1ˆ

    La proporción muestral es la media muestral en una población dicotómica, esto es, asociada a una alternativa (verdadero o falso, a favor o en contra, apto o no apto) y a cuyos elementos se les asigna solo los valores 0 o 1.

    Estimador: de un parámetro poblacional es un estadístico (parámetro muestral) cuyo valor sobre una muestra intenta acercarse lo más posible al valor del parámetro poblacional. Es decir, es una función de la muestra que se usa para estimar un parámetro.

    El valor que toma un estimador sobre una muestra da lugar a una estimación. Por ello, dado un estimador, hay tantas estimaciones asociadas al mismo como muestras posibles.

    Distribución en el muestreo de un estimador: es la distribución del estimador al tomar distintas muestras de tamaño n en la población.

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 9 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    Observa: Para una muestra nxxx ,,, 21 K obtenemos una media muestral :x

    nxxxx n+++= K21

    Para otra muestra nxxx ′′′ ,,, 21 K obtenemos otra media muestral :x′

    nxxxx n′++′+′

    =′K21

    Estos valores son los que toma la variable aleatoria .nX

    Fíjate: como el estimador toma valores diferentes en las distintas muestras, lo consideramos como una variable aleatoria y por eso hablamos de su distribución de probabilidad en el muestreo:

    Veamos ahora la distribución en el muestreo de algunos estimadores. Estos resultados se obtienen como consecuencia del Teorema Central del Límite que nos dice:

    “Si nxxx ,,, 21 K es una muestra aleatoria simple de una población con media μ y desviación típica σ , entonces la variable aleatoria nn xxxX +++= K21 sigue una distribución normal

    de media nμμnX= y desviación típica nσσ

    nX= . Es decir: nX ~ ( )n,nN σμ ”

    En el resto del tema siempre nos referiremos a muestreo aleatorio simple (m.a.s.)

    6. DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES Cada muestra de tamaño n que podamos extraer de la población proporciona una media (muestral). Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribución de probabilidad:

    →nX Variable aleatoria que a cada muestra de tamaño n le hace corresponder su media.

    Dada una población con media μ y desviación típica σ , y nxxx ,,, 21 K una m.a.s. de tamaño n, si la población sigue una distribución Normal ( )σμ,N , o bien no la sigue pero 30,n ≥ entonces la distribución de la variable aleatoria de las medias muestrales de tamaño n, nX viene dada por:

    nX ~ ⎟⎠

    ⎞⎜⎝

    ⎛nσμ,N

    Observaciones: 1) μ coincide con la media de la distribución de las medias muestrales nX . Es decir, μμ nX = .

    2) nσ

    es la desviación típica de la distribución de las medias muestrales nX y, por tanto, nσ 2

    es su varianza. Es decir, nσ

    =nX

    σ y nσσ

    22X n= .

    3) Aunque la población NO siga una ley Normal, la distribución de las medias muestrales SÍ la sigue siempre que 30.n ≥ Conforme aumente n mejor será la estimación.

    4) nσ

    indica el grado de variabilidad de la medias muestrales. Al aumentar n, nσ

    disminuye

    y por tanto más similares serán la media de la población μ y la media obtenida en la muestra. 5) Si en lugar de realizar m.a.s. se efectúa m.a. sin reemplazamiento, entonces la desviación

    típica de las medias muestrales es 1−

    −⋅

    NnN

    Ejemplo: Las notas de un examen se distribuyen según una ley Normal de media 5.6 y varianza 9. Seleccionamos al azar 16 estudiantes y calculamos la media de sus notas. Calcule la probabilidad de que dicha media esté comprendida entre 4.7 y 6.5.

    Solución:

    Si →X VA que mide las notas de un examen X⇒ ~ ( )3,6.5N ya que ⎩⎨⎧

    =⇒=

    =

    396.5

    2 σσ

    μ

    Como 16=n 16X⇒ ~ ⎟⎠

    ⎞⎜⎝

    ⎛163,6.5N 16X⇒ ~ ( )75.0,6.5N { 75.0

    6.516 −=⇒ XZTipif

    ~ ( )1,0N

    ( ) ( ) =≤≤−=⎟⎠⎞

    ⎜⎝⎛ −≤≤

    −=≤≤ 2.12.1

    75.06.55.6

    75.06.57.45.67.4 16 ZPZPXP

    ( ) ( ) ( )[ ] [ ] 7698.05.08849.0202.122.102 =−=

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 10 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    7. DISTRIBUCIÓN DE LAS PROPORCIONES MUESTRALES Consideremos una población formada por un número determinado de individuos. Cada uno de ellos posee una característica determinada o no la posee, siendo: p→ Proporción (poblacional) de individuos que la poseen.

    p1q −= → Proporción (poblacional) de individuos que NO la poseen. Consideramos una muestra de tamaño n, habrá una proporción p̂ de individuos con esa característica (proporción muestral). Cada muestra proporciona un valor de la proporción (muestral). →nP̂ Variable aleatoria que asigna a cada muestra de tamaño n la proporción de individuos con esa característica. Entonces, si n es suficientemente grande ( 30n ≥ ) la proporción muestral nP̂ de individuos que tienen esa característica en las muestras de tamaño n es una variable aleatoria que sigue una distribución:

    nP̂ ~ ⎟⎟⎠

    ⎞⎜⎜⎝

    ⎛ ⋅n

    qpp,N

    Observaciones: 1) p coincide con la media de la proporción muestral nP̂ . Es decir pμ nP =ˆ

    2) n

    qp⋅ es la desviación típica de la proporción muestral nP̂ . Es decir nqp

    σnP

    ⋅=ˆ y n

    qpσnP

    ⋅=2ˆ

    3) n

    ticacaracterís lacon individuos de nºmuestra la de proporciónˆ ==p

    Ejemplo: Una marca de automóviles vende mensualmente 4000 coches, de los cuales 2350 utilizan gasolina y el resto diésel. Se toma una muestra de tamaño 500 en la cual hay 260 coches diésel. Escribe los valores de los parámetros p y p̂ de la proporción de coches que utilizan diésel. ¿Cuál será la distribución de las proporciones muestrales para muestras de tamaño 500?

    Solución: →p Proporción de coches que usan diésel. N = 4000 →p̂ Proporción muestral de coches que usan diésel

    4000=N 500=n 165023504000 =− coches diésel.

    4125.040001650

    ==p 52.0500260ˆ ==p

    Como ⇒=−=−= 5875.04125.011 pq 500P̂ ~ ⎟⎟⎠

    ⎞⎜⎜⎝

    ⎛ ⋅500

    0.58750.41250.4125,N

    500P̂⇒ ~ ( )0.0220.4125,N

    8. DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES Consideremos todas las muestras aleatorias de tamaños respectivos xn y yn que puedan extraerse de dos poblaciones. Sus respectivas medias muestrales, consideradas como valores de una variable aleatoria, dan lugar a dos variables aleatorias

    xnX e

    ynY una para cada población.

    Sean dos poblaciones con medias xμ y yμ , desviaciones típicas xσ y yσ , y dos m.a.s. de tamaño

    xn y yn extraídas respectivamente de cada población. Si las poblaciones siguen distribuciones Normales ( )xxN σμ , , ( )yyN σμ , o bien no las siguen pero 30nx ≥ y 30ny ≥ , entonces la distribución de la diferencia de medias muestrales

    yx nnYX − viene dada por:

    yx nnYX − ~

    ⎟⎟

    ⎜⎜

    ⎛+−

    y

    2y

    x

    2x

    yx nσ

    nσ,μμN

    n = 500

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 11 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    Observaciones: 1) yx μμ − coincide con la media de la distribución de la diferencia de medias

    muestralesyx nn

    YX − . Es decir, .yxYX μμμ ynxn −=−

    2) y

    2y

    x

    2x

    + es la desviación típica de la distribución de la diferencia de medias muestrales

    yx nnYX − . Es decir, .

    y

    2y

    x

    2x

    YX nσ

    nσσ

    ynxn+=− Su varianza es .

    2

    y

    2y

    x

    2x

    YX nσ

    nσσ

    ynxn+=−

    3) Aunque las poblaciones NO sigan una ley Normal, la distribución de la diferencia de medias muestrales SÍ la sigue siempre que 30nx ≥ y 30.ny ≥ Conforme aumenten xn y yn mejor será la estimación.

    4) La diferencia de medias nos permite comparar distintas poblaciones.

    Ejemplo: El peso de los huevos de gallina producidos por una granja sigue una distribución normal de media 63g y desviación típica 5g. En otra granja con otro tipo de alimentación se ha comprobado que el peso de los huevos corresponde a otra distribución normal de media 68g y desviación típica 2g. Si se toman al azar muestras de 100 huevos de cada granja, determina la distribución para la diferencia de medias muestrales. ¿Cuál es la probabilidad de que la diferencia en los pesos de los huevos no sea mayor de 4g? Solución:

    →X VA que mide el peso de los huevos de gallina producidos por la primera granja →Y VA que mide el peso de los huevos de gallina producidos por la segunda granja

    X ~ ( )5,63N Y ~ ( )2,68N ya que ⎪⎩

    ⎪⎨⎧

    ==

    ==

    25

    6863

    yx

    yx

    σσ

    μμ y como ⇒

    ⎩⎨⎧

    ==

    100100

    y

    x

    nn

    100100 YX −⇒ ~ ⎟⎟⎠

    ⎞⎜⎜⎝

    ⎛+−

    1004

    1002568,63N 100100 YX −⇒ ~ ( )54.05,N −

    { 54.05100100 +−=⇒ YXZ

    Tipif

    ~ ( )1,0N

    ( ) ( ) ≈⎟⎠⎞

    ⎜⎝⎛ +≤≤

    +−=≤−≤−=≤−

    54.054

    54.054444 100100100100 ZPYXPYXP

    9. ESTIMACIÓN PUNTUAL Y POR INTERVALOS La estimación, como ya sabemos, nos proporciona información sobre un parámetro desconocido de la población a partir de la información que nos aporta la muestra. Para ello se construye un estimador (función de los valores de una muestra), que nos proporcione un valor numérico que constituye la estimación del parámetro poblacional.

    Distinguimos dos tipos de estimación:

    9.1.ESTIMACIÓN PUNTUAL Proporciona un solo valor del parámetro desconocido.

    Los estimadores más usuales utilizados en la estimación puntual son:

    n

    nxx

    n

    iii∑

    =

    ⋅= 1 media muestral, estimador de la media poblacional

    N

    nxN

    iii∑

    =

    ⋅= 1μ

    ( ) ( ) ( ) 0.0322=−=

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 12 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    ( )21

    2

    1

    2

    2 xn

    nx

    n

    nxxS

    n

    iii

    n

    iii

    −⋅

    =⋅−

    =∑∑==

    ⎭⎬⎫

    muestralVarianza estimador de la

    ⎩⎨⎧

    lpoblacionaVarianza

    ( )21

    2

    1

    2

    μμ

    −⋅

    =⋅−

    =∑∑==

    N

    nx

    N

    nxσ

    N

    iii

    N

    iii

    2

    ( )21

    2

    1

    2

    2

    11ˆ x

    n

    nx

    n

    nxxS

    n

    iii

    n

    iii

    −−

    ⋅=

    ⋅−=

    ∑∑==

    ⎭⎬⎫

    muestralarianzaCuasiv estimador de la

    ⎩⎨⎧

    lpoblacionaVarianza

    ( )21

    2

    1

    2

    μμ

    −⋅

    =⋅−

    =∑∑==

    N

    nx

    N

    nxσ

    N

    iii

    N

    iii

    2

    n

    nxp

    n

    iii∑

    =

    ⋅= 1ˆ Proporción muestral, estimador de la proporción poblacional

    N

    nxp

    N

    iii∑

    =

    ⋅= 1

    Ejemplo: Las últimas 14 personas que han entrado en una sala de exposiciones han permanecido en ella durante los siguientes periodos de tiempo (en minutos):

    71,61,30,66,49,38,61,50,62,55,36,89,47,25 a) Estima el valor medio y la varianza de los tiempos de permanencia de los

    visitantes de la sala. b) Estima la proporción de visitantes que permanecen en la sala más de una hora. Solución: a) La estimación de la media y varianza poblacionales μ y ,2σ la hacemos a través

    de la media muestral x y de la varianza muestral 2S .

    86.52147401 ==

    ⋅=∑=

    n

    nxx

    n

    iii

    53.27786.5214

    43004 2212

    2 =−=−⋅

    =∑= x

    n

    nxS

    n

    iii

    También se puede estimar 2σ calculando la cuasivarianza muestral .ˆ 2S

    b) La estimación de la proporción p será la proporción muestral de personas que

    pasan más de una hora en la sala: 4286.0146ˆ ==p

    9.2.ESTIMACIÓN POR INTERVALOS Los estimadores NO aportan información sobre la precisión con que se realiza la estimación. El estimador puntual puede ser poco fiable ya que su valor depende de la muestra elegida. Por ello, en lugar de utilizar un único valor, conviene construir un intervalo que contenga al verdadero valor del parámetro desconocido con gran probabilidad.

    Intervalo de confianza ( )ba,IC = : intervalo que contendrá al verdadero valor del parámetro desconocido con una cierta seguridad.

    Nivel de confianza :α1 − es la probabilidad de que el parámetro se encuentre en ese intervalo. Nivel de significación :α es la probabilidad de que el parámetro NO se encuentre en ese intervalo (diferencia entre la certeza y el nivel de confianza).

    Amplitud del intervalo de confianza: abA CI −= (es la longitud del IC)

    Error de estimación máximo: se define como 2

    abE −= (es decir, la mitad de CIA )

    Siendo a y b los extremos de un intervalo de confianza: ( )ba,IC =

    También se llama Error máximo admisible.

    Por tanto: Un intervalo de confianza con nivel de confianza α1− es un intervalo ( )ba,IC = que contiene el verdadero valor del parámetro con probabilidad α.1−

    La cuasivarianza muestral suele ser

    mejor estimador de la varianza

    poblacional que la varianza muestral.

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 13 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    ¡Compruébalos!

    Fíjate: 2

    αz se puede obtener

    también con la expresión:

    2nc1

    )zP(Z2

    α+

    =≤

    y usar, como antes, la tabla de la distribución normal estándar.

    ¿Por qué?

    Valor crítico 2

    αz : En la construcción de un intervalo de confianza, fijado un nivel de confianza

    ,α1− llamamos valor crítico 2

    αz , al número real que deja a su derecha una probabilidad 2α

    en la distribución Normal estándar ( )1,0N

    Así, si Z es una variable con distribución ( )1,0N , un intervalo de confianza con probabilidad ,α1− se obtiene dejando probabilidad igual a

    a ambos lados, como puede verse en la figura:

    ααα −=≤≤− 1)(22

    zZzP

    Ejemplo: Calcular el valor crítico 2

    αz correspondiente a un nivel de confianza del 90%.

    05,02

    10,090,01 =⇒=⇒=− ααα 05,0)(2=>⇒ αzZP

    )(1)(22

    αα zZPzZP ≤−=> 95,0)(2=≤⇒ αzZP 645,1

    2=⇒ αz

    Valores críticos 2

    αz más utilizados según el nivel de confianza α.1−

    Cuando se estima por intervalos hay tres elementos que están relacionados: el tamaño muestral, el nivel de confianza y la longitud del intervalo (es el doble del error). Fíjate que:

    a) Cuanto más pequeño es el intervalo (menor error), mayor es la precisión de la estimación pero disminuye el nivel de confianza.

    b) Cuanto mayor sea el nivel de confianza, más seguridad tendremos en la estimación pero aumenta el error (aumenta la amplitud). Es decir:

    Mayor ⇒−= α1nc Mayor 2

    αz ⇒Mayor E

    c) Para aumentar el nivel de confianza y para ser más precisos en la estimación (menor error), tenemos que aumentar el tamaño de la muestra. (Mayor n⇒Menor error E)

    Dados dos de esos elementos, el tercero viene determinado, con lo cual el profesional de la estadística tiene la capacidad de decidir cual de ellos subordina en beneficio de los dos restantes.

    α1− α/2 2

    αz

    0,90 0,05 1,645 0,95 0,025 1,96 0,99 0,005 2,575

    2)(

    2

    αα => zZP

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 14 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    (Despejando en la expresión anterior)

    (Despejando en la expresión anterior de E)

    INTERVALO DE CONFIANZA PARA LA MEDIA Un intervalo de confianza con nivel de confianza α1− para la media μ de una población Normal con desviación típica σ conocida construido a partir de una muestra de tamaño n, viene dado por la expresión:

    ⎟⎠⎞

    ⎜⎝⎛ ⋅+⋅−=

    nσzx,

    nσzxCI

    2α α1

    n

    σ

    2αzxμn

    σ

    2αzxP −=⋅+

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 15 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS Un intervalo de confianza con nivel de confianza α1− para la diferencia de medias xμ y yμ de dos poblaciones Normales con desviaciones típicas xσ y yσ conocidas construido a partir de dos muestras de tamaño xn y ,yn viene dado por la expresión:

    ( ) ( ) ⎟⎟

    ⎜⎜

    ⎛+⋅+−+⋅−−=

    y

    2y

    x

    2x

    y

    2y

    x

    2x

    2α n

    σnσzyx,

    nσzyxCI

    ( ) ( ) α-1Py

    2y

    x

    2x

    2αyx

    y

    2y

    x

    2x

    2α n

    σnσzyxμμ

    nσzyx =⇒

    ⎟⎟

    ⎜⎜

    ⎛+⋅+−

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 16 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    →X VA que mide la tensión de ruptura de una fibra sintética. X ~ ( )2,μN

    16=n 16X⇒ ~ ⎟⎠

    ⎞⎜⎝

    ⎛162,μN 16X⇒ ~ ( )5.0,μN

    96.12=⇒ αz (Ver tabla o calcularlo)

    Fíjate que 025.02/05.0 =⇒= αα 96.12=⇒ αz

    →X VA que mide la edad de los alumnos que se... X ~ ( )6.0,μN

    →X VA que mide el tiempo de reacción de un conductor ante una posible incidencia.

    X ~ ( )5.0,μN

    Solución:

    ⎪⎪⎪

    ⎪⎪⎪

    ==⇓

    =−====⇒=

    025.02/;05.0

    95.0132.20;16

    242

    αα

    α

    σσ

    cnxn

    Por tanto, un intervalo de confianza para la media poblacional μ es:

    ( ) ( )21.3019.34,CInσzx

    2α =⇒±=⎟

    ⎠⎞

    ⎜⎝⎛ ⋅±=⎟

    ⎠⎞

    ⎜⎝⎛ ⋅±= 98.032.20

    16296.132.20CI

    Por tanto ( ) 95.030.2134.19 = ZPZP 0456.00228.02

    =⇒=⇒ αα

    95.44%cn =⇒=−⇒ 9544.01 α

    25.01001.0

    1005.01.0 =⋅=⇒⋅=⇒⋅=

    2α zzn

    σzE2

    α

    ( )2

    2 α=>=⎟⎠⎞⎜

    ⎝⎛ > ZPzZP

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 17 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    →p Proporción de adolescentes que practican algún deporte habit. →p̂ Proporción muestral de adolescentes que practican algún deporte

    habitualmente. ⇒= 90.0cn 05.02/;10.090.01 ==⇒=− ααα 645.1

    2=⇒ αz

    →X VA que mide la estatura de los estudiantes de ese internado. X ~ ( )3.5,μN

    Ejemplo: En un internado se sabe que la estatura media de los estudiantes está entre 179 y 180 con una desviación típica de 5.3cm. Si se ha extraído una muestra de 30 alumnos, ¿cuál es el nivel de confianza con el que se ha realizado la estimación?

    Solución: ( )

    ⎪⎪⎭

    ⎪⎪⎬

    ====

    ?30

    3.5180,179

    cnn

    CIσ

    ( )2

    52.0 α=>=⎟⎠⎞⎜

    ⎝⎛ > ZPzZP

    ( ) ( ) 3015.06985.0152.0152.0 =−=≤−=> ZPZP 603.03015.02

    =⇒=⇒ αα

    39.7%cn =⇒=−⇒ 397.01 α

    Caso 4º Cálculo de un intervalo de confianza para las proporciones Ejemplo: En una muestra de 400 adolescentes se encontró que 154 practican deporte

    habitualmente. Halla con un nivel de confianza del 90% un intervalo para estimar la proporción de adolescentes que practican algún deporte. Calcule el error máximo cometido en la estimación. Solución:

    Puesto que 400=n es “grande”, un I.C. para la proporción poblacional p es:

    ≈⎟⎟⎠

    ⎞⎜⎜⎝

    ⎛ ⋅⋅±=⎟⎟

    ⎞⎜⎜⎝

    ⎛ ⋅⋅±=

    400615.0385.0645.1385.0

    ˆˆˆnqpzp

    2αCI ( ) ( )0.4250.345,CI ≈⇒± 04.0385.0

    Por tanto ( ) 90.0425.0345.0 =

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 18 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    220300 YX − ~ ⎟⎟⎠

    ⎞⎜⎜⎝

    ⎛+−

    2208.0

    3005.0,

    22

    yxN μμ ≈ ( )061.0,yxN μμ −

    96.12=⇒ αz (Ver tabla o calcularlo)

    →X VA que mide el peso de los bebés de madres no fumadoras →Y VA que mide el peso de los bebés de madres fumadoras

    X ~ ( )5.0,xN μ Y ~ ( )8.0,yN μ

    Solución: a)

    ⎪⎪⎪⎪

    ⎪⎪⎪⎪

    ==⇓

    =−===

    ==

    ==

    025.02/;05.0

    95.012.36.3

    8.05.0;220300

    αα

    α

    σσ

    cnkgykgx

    nn

    yx

    yx

    Por tanto, un intervalo de confianza para la diferencia de medias poblacionales yx μμ − es:

    ( ) ( ) ( )124.04.0220

    8.0300

    5.096.12.36.322

    ±≈⎟⎟⎠

    ⎞⎜⎜⎝

    ⎛+⋅±−=⎟

    ⎜⎜

    ⎛+⋅±−=

    y

    2y

    x

    2x

    2α n

    σnσzyxCI

    ( )0.5240.276,CI ≈⇒ Por tanto ( ) 95.0524.0276.0 =

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 19 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    11. TABLA DE NÚMEROS ALEATORIOS DE FISHER Y YATES

    Podemos construir una tabla de números aleatorios poniendo los números premiados en los sorteos de la lotería uno detrás del otro.

  • IES Padre Poveda (Guadix) Estadística

    Departamento de Matemáticas 20 Bloque III: Inferencia Estadística Profesor: Ramón Lorente Navarro Unidad 7: Muestreo e Inferencia Estadística

    12. TABLA DE PROBABILIDADES DE LA ( )10,N