46
Muestreo aleatorio estratificado Dr. José Dionicio Zacarias Flores

Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

  • Upload
    others

  • View
    35

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Muestreo aleatorio estratificado

Dr. José Dionicio Zacarias Flores

Page 2: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

introducción

• Un problema importante de interés nacional implica la estimación del costo de la atención médica. Estos costos son estudiados por varias agencias, tanto en el gobierno como en el sector privado, para establecer políticas gubernamentales y evaluar decisiones comerciales, como las tarifas de las pólizas de seguros.

• Un método para estimar los costos hospitalarios de una enfermedad se considera en el artículo "Impacto económico de los cálculos renales en hombres adultos blancos", por J. Shuster y R. L. Scheaffer(Urology 24 (4), 1984).

Page 3: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

introducción

• En dicho trabajo, dos regiones de los Estados Unidos, las Carolinas y losestados de las Montañas Rocosas, fueron seleccionadas para un estudioespecial. Una muestra de n1 = 363 pacientes con cálculos renales en lasCarolinas tuvieron un costo promedio de $1350 por primera hospitalización;una muestra de n2 = 258 pacientes con cálculos renales en las MontañasRocosas tuvo un costo promedio de $1150 por primera hospitalización.

• ¿Podemos estimar los costos totales anuales de hospitalización por estaenfermedad en ambas regiones combinadas? Los métodos que estudiaremosnos muestran cómo hacerlo si hay información adicional disponible. Losmétodos se pueden usar para encontrar una estimación para todo EstadosUnidos si hay información de muestra disponible para otras regiones.

Page 4: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Propósito del tema

• El propósito del diseño de encuestas de muestras es maximizar lacantidad de información para un costo dado. El muestreoaleatorio simple, el diseño de muestreo básico, a menudoproporciona buenas estimaciones de las cantidades de población abajo costo. En esta parte definimos un segundo procedimiento demuestreo, el muestreo aleatorio estratificado, que en muchoscasos aumenta la cantidad de información para un costo dado.

Page 5: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Definición

• Una muestra aleatoria estratificada es aquellaobtenida separando los elementos de la poblaciónen grupos no superpuestos, llamados estratos, yluego seleccionando una muestra aleatoria simplede cada estrato.

Page 6: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Razones principales para usar el muestreo aleatorio estratificado

• Las razones principales para usar el muestreo aleatorioestratificado en lugar del muestreo aleatorio simple son lassiguientes:

• 1. La estratificación puede producir un límite menor en el error deestimación que el que produciría una muestra aleatoria simple delmismo tamaño. Este resultado es particularmente cierto si lasmediciones dentro de los estratos son homogéneas.

• 2. El costo por observación en la encuesta puede reducirseestratificando los elementos de la población en gruposconvenientes.

• 3. Se pueden desear estimaciones de los parámetros de lapoblación para subgrupos de la población. Estos subgruposdeberían ser estratos identificables.

Page 7: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Deben tenerse en cuenta estas tres razones para laestratificación cuando decidimos estratificar una poblacióno decidir cómo definir estratos.

• El muestreo de pacientes del hospital con una dietadeterminada para evaluar el aumento de peso puede sermás eficiente si los pacientes se estratifican por géneroporque los hombres tienden a pesar más que las mujeres.

• La inscripción de estudiantes universitarios en unauniversidad grande puede administrarse y llevarse a cabomás convenientemente si los estudiantes son estratificadosen residentes dentro y fuera del campus

Page 8: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Cómo diseñar una muestra aleatoria estratificada

• El primer paso en la selección de una muestra aleatoriaestratificada es especificar claramente los estratos, luego cadaunidad de muestreo de la población se coloca en su estratoapropiado.

• Este paso puede ser más difícil de lo que parece. Por ejemplo,suponga que planea estratificar las unidades de muestreo, porejemplo, hogares, en unidades rurales y urbanas. ¿Qué se debehacer con los hogares en una ciudad de 1000 habitantes? ¿Sonestos hogares rurales o urbanos? Pueden ser rurales si la ciudadestá aislada en el país, o pueden ser urbanos si la ciudad esadyacente a una gran ciudad.

Page 9: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Cómo diseñar una muestra aleatoria estratificada

• Por lo tanto, especificar qué se entiende por urbano y rural es esencial para que cada unidad de muestreo caiga claramente en un solo estrato.

• Después de que las unidades de muestreo se hayan dividido en estratos, seleccionamos una muestra aleatoria simple de cada estrato.

• Cosas a considerar: el problema de elegir tamaños de muestra apropiados para los estratos, y debemos estar seguros de que las muestras seleccionadas de los estratos son independientes.

Page 10: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Notación para muestreo estratificado

• L = Número de estratos

• Ni = Número de unidades de muestreo en el estrato i

• N = Número de unidades de muestreo en la población

• = N1 + N 2 + … + NL

Page 11: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Ejemplo

• Una empresa de publicidad, interesada en determinar cuántoenfatizar la publicidad televisiva en cierto condado, decide realizaruna encuesta para estimar el número promedio de horas por semanaque los hogares dentro del condado miran televisión.El condado contiene dos ciudades, A y B, y un área rural. La ciudad Aestá construida alrededor de una fábrica, y la mayoría de los hogarescontienen trabajadores de fábrica con niños en edad escolar. Town Bes un suburbio exclusivo de una ciudad en un condado vecino ycontiene residentes mayores con pocos hijos en el hogar. Hay 155hogares en la ciudad A, 62 en la ciudad B y 93 en el área rural.Discuta los méritos de usar muestreo aleatorio estratificado en estasituación.

Page 12: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Solución

• La población de hogares se divide en tres grupos naturales, dos ciudadesy un área rural, según la ubicación geográfica. Por lo tanto, usar estasdivisiones como tres estratos es bastante natural simplemente porconveniencia administrativa al seleccionar las muestras y llevar a cabo eltrabajo de campo. Además, cada uno de los tres grupos de hogares debetener patrones de comportamiento similares entre los residentes dentrodel grupo. Esperamos ver una variabilidad relativamente pequeña en elnúmero de horas de visualización de televisión entre los hogares dentrode un grupo, y esta es precisamente la situación en la que laestratificación produce una reducción en un límite en el error deestimación.

Page 13: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Solución

• La empresa de publicidad puede desear producir estimaciones sobre el promedio de horas de televisión para cada ciudad por separado. El muestreo aleatorio estratificado permite estas estimaciones.Para la muestra aleatoria estratificada, tenemos N1 = 155, N2 = 62, y N3 = 93, con N = 310.

Page 14: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Estimación de una media poblacional y total

• ¿Cómo podemos usar los datos de una muestra aleatoriaestratificada para estimar la media de la población? Denotemos lamedia muestral 𝑦 para la muestra aleatoria simple seleccionadadel estrato i, ni el tamaño de la muestra para el estrato i, 𝜇𝑖 lamedia poblacional para el estrato i y 𝜏𝑖 el total de la poblaciónpara el estrato i. Entonces el total de la población τ es igual a 𝜏1 +𝜏2 + ⋯+ 𝜏𝐿.

• Tenemos una muestra aleatoria simple dentro de cada estrato y yasabemos que 𝑦𝑖 es un estimador insesgado de 𝜇𝑖 y Ni 𝑦𝑖 es unestimador insesgado del estrato total𝜏𝑖 = Ni𝜇𝑖 . Parece razonableformar un estimador de τ, que es la suma de los 𝜏𝑖 valores,sumando los estimadores de los 𝜏𝑖.

Page 15: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Estimación de una media poblacional y total

• De manera similar, debido a que la media de la población µ esigual al total de la población τ dividido por N, se obtiene unestimador insesgado de µ sumando los estimadores 𝜏𝑖 de todos losestratos y luego dividiéndolos por N. Denotamos este estimadorpor 𝑦𝑠𝑡, donde el subíndice st indica que el muestreo aleatorioestratificado se está utilizando.

Page 16: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Estimador de la media poblacional µ.

• Varianza estimada de 𝑦𝑠𝑡.

Page 17: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Ejemplo

• Retomando el ejemplo anterior:

• La mejor estimación del número promedio de horas por semana que todos los hogares en el condado pasan viendo la televisión.

Page 18: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Ejemplo

• La mejor estimación del número promedio de horas por semana que todos los hogares en el condado pasan viendo la televisión.

Page 19: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Ejemplo

• Su varianza es.

Page 20: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Ejemplo

• La estimación de la media de la población con un límite aproximado de 2-SD en el error de estimación viene dada por.

Page 21: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Ejemplo

• Debido a que las muestras aleatorias simples elegidasdentro de cada estrato son independientes entre sí, lasdiferencias entre las medias del estrato puedenestimarse de manera directa, como ya se mostró enclase. Recuerde que la varianza de la diferencia entredos variables aleatorias independientes es la suma de susrespectivas variaciones. ■

Page 22: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Selección del tamaño de la muestra para estimar medias y totales de la población

Page 23: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• La cantidad de información en una muestra depende deltamaño de la muestra n, porque 𝑉 𝑦𝑠𝑡 disminuye amedida que n aumenta. Ahora examinemos un métodopara elegir el tamaño de la muestra para obtener unacantidad fija de información para estimar un parámetrode población. Supongamos que especificamos que elestimador 𝑦𝑠𝑡 debe estar dentro de las B unidades de lamedia de la población, con una probabilidadaproximadamente igual a .95.

Page 24: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Simbólicamente, queremos

• 2 𝑉 𝑦𝑠𝑡 𝑜 𝑉 𝑦𝑠𝑡 = 𝐵2

4

• Esta ecuación contiene la varianza de la población actual de 𝑦𝑠𝑡 en lugar de la varianza estimada. Para N grande, la varianza actual 𝑉 𝑦𝑠𝑡 , se ve muy similar a la ecuación

• Con 𝑠12, 𝑠2

2, … , 𝑠𝐿2 reemplazado por σ1

2, σ22, … , σ𝐿

2.

Page 25: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Aunque establecemos 𝑉 𝑦𝑠𝑡 igual a B2/4, no podemos resolverpara n a menos que sepamos algo sobre las relaciones entre n1, n2,..., nL y n. Hay muchas formas de asignar una muestra de tamañon entre los distintos estratos. Sin embargo, en cada caso, elnúmero de observaciones ni asignadas al estrato i-ésimo es unafracción del tamaño total de la muestra n. Denotamos estafracción de asignación por ai. Por lo tanto, podemos escribir

ni = n ai i = 1, 2, …, L

• Usando la ecuación anterior, podemos establecer 𝑉 𝑦𝑠𝑡 igual a B2/4 y resolver para n.

Page 26: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Del mismo modo, la estimación del total de la población τ con un límite de B unidades en el error de estimación conduce a la ecuación

O

Page 27: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Tamaño de muestra aproximado requerido paraestimar µ o τ con un límite B en el error deestimación:

(*)

• donde ai es la fracción de observaciones asignadas al estrato i, 𝜎𝑖

2 es la varianza de la población para el estrato i, y

•cuando se estima µ

• cuando se estima τ

Debemos obtener aproximaciones de las variaciones

poblacionales σ12, σ2

2, … , σ𝐿2, antes de poder utilizar (∗)

Page 28: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Ejemplo

• Una encuesta previa sugiere que las variaciones de estrato para elejemplo del problema de la región de habitantes que ventelevisión son aproximadamente 𝜎1

2 ≈ 25, 𝜎22 ≈ 225, 𝜎3

2 ≈ 100.Deseamos estimar la media poblacional utilizando 𝑦𝑠𝑡.

• Elija el tamaño de la muestra para obtener un límite en el errorde estimación igual a 2 horas si las fracciones de asignación estándadas por a1 = 1/3, a2 = 1/3, y a3 = 1/3. En otras palabras, debetomar el mismo número de observaciones de cada estrato.

Page 29: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Solución

• Un límite o cota en el error de 2 horas significa que

• 2 𝑉 𝑦𝑠𝑡 = 2 𝑜 𝑉 𝑦𝑠𝑡 = 1

• Por lo tanto, D = 1.

• Regresando al problema original, N1 = 155, N2 = 62, y N3 = 93, con N = 310, por lo tanto:

Page 30: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Solución

• De (*) tenemos:

• Así, el experimentador debe tomar n = 57 observaciones con

Page 31: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Ejemplo 2

• Como en el ejemplo anterior, suponga que las variaciones delejemplo original se aproximan por 𝜎1

2 ≈ 25, 𝜎22 ≈ 225, 𝜎3

2 ≈ 100.

• Deseamos estimar la población total τ con un límite de 400 horasen el error de estimación. Elija el tamaño de muestra apropiadosi se tomará un número igual de observaciones de cada estrato.

Page 32: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Solución

• El límite del error de estimación es de 400 horas y, por lo tanto,

• Para calcular n a partir de la ecuación (*), necesitamos las siguientes cantidades:

Page 33: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Solución

• Usando (*)

Page 34: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Asignación de la muestra

Page 35: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Recordemos que el objetivo del diseño de una encuesta muestrales proporcionar estimadores con pequeñas variaciones al menorcosto posible. Después de elegir el tamaño de muestra n, haymuchas maneras de dividir n en los tamaños de muestra de estratoindividuales, n1, n2, ..., nL.

• Cada división puede resultar en una varianza diferente para lamedia muestral. Por lo tanto, nuestro objetivo es utilizar unaasignación que proporcione una cantidad especificada deinformación al costo mínimo.

Page 36: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• En términos de nuestro objetivo, el mejor esquema de asignaciónse ve afectado por tres factores:

• 1. El número total de elementos en cada estrato.

• 2. La variabilidad de las observaciones dentro de cada estrato.

• 3. El costo de obtener una observación de cada estrato.

• El número de elementos en cada estrato afecta la cantidad deinformación en la muestra. Un tamaño 20 de una población de 200elementos debe contener más información que una muestra de 20de 20,000 elementos. Por lo tanto, se deben asignar grandestamaños de muestra a estratos que contengan grandes cantidadesde elementos.

Page 37: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Se debe considerar la variabilidad porque se necesita unamuestra más grande para obtener una buena estimaciónde un parámetro de población cuando las observacionesson menos homogéneas. Si el costo de obtener unaobservación varía de estrato a estrato, tomamospequeñas muestras de estratos con altos costos. Lohacemos porque nuestro objetivo es mantener el costode muestreo al mínimo.

Page 38: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Asignación aproximada que minimiza el costo para un valor fijo de 𝑉 𝑦𝑠𝑡 o minimiza 𝑉 𝑦𝑠𝑡 para un costo fijo:

• (**)

• Donde Ni denota el tamaño del i-ésimo estrato, 𝜎𝑖2 denota la varianza

poblacional para el i-ésimo estrato, ci denota el costo de obtener unaobservación simple desde el i-ésimo estrato. Note que ni es directamenteproporcional a Ni, y a σi e inversamente proporcional a 𝑐𝑖.

Page 39: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Debemos aproximar la varianza de cada estratoantes del muestreo para usar la fórmula deasignación (**). Las aproximaciones se puedenobtener de encuestas anteriores o delconocimiento del rango de las mediciones dentrode cada estrato.

Page 40: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

• Sustituyendo los ni/n dados por la fórmula (**) para las ai en (*) nos da:

• para una asignación óptima con la varianza de 𝑦𝑠𝑡 fija en D.

Page 41: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Problemas

Page 42: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Problema 1

Page 43: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Problema 2

Page 44: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Problema 2

Page 45: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Problema 3

Page 46: Muestreo aleatorio estratificado...aleatorio simple, el diseño de muestreo básico, a menudo proporciona buenas estimaciones de las cantidades de población a bajo costo. En esta

Problema 4