Upload
independent
View
1
Download
0
Embed Size (px)
Citation preview
19/11/2022
Introducción al Muestreo:Aspectos Teóricos y
Prácticos de las Encuestas a Hogares y
Establecimientos
Facilitador: Lalito R. Vargas
Maestría en Estadística Aplicada
19/11/2022
Población o universo: Es el grupo completo de todas las unidades de análisis cuyas características queremos estimar. También se define como cualquier colección finita o infinita de individuos o elementos. En esta oportunidad trataremos poblaciones finitas con N unidades.
Muestra: Es cuando se observa a una parte de la población con el propósito de tomar decisiones con relación a la población objetivo de donde proviene la misma.
Conceptos Básicos de Muestreo
19/11/2022
Muestra probabilística: Es una muestra obtenida mediante la aplicación de la teoría de probabilidad, en donde cada elemento de una población definida tiene una probabilidad conocida y diferente de cero de formar parte de la muestra, es decir, se conoce matemáticamente la probabilidad que tiene cada elemento de formar parte de la misma.Muestra no probabilística: Es cuando se escoge una parte de la población con método no probabilístico, es decir, los elemento escogidos no tienen una probabilidad asociada a la selección de los mismos. Tales como muestreo por cuota, de juicio, casual, etc.
Conceptos Básicos de Muestreo
19/11/2022
Encuesta: Es un método para recoger información sobre una población humana, en el que el contacto directo se hace con unidades de estudio (individuos, organizaciones, comunidades, etc.) a través de medios tan sistemáticos como cuestionarios y programas de entrevistas.
Censo: Es una encuesta en la cual se recopila información de todos los componentes de una población. Objetivos principales de un Censo de Población y Vivienda son: Servir de marco de referencia para las encuestas y dar informaciones para las pequeñas demarcaciones.
Conceptos Básicos de Muestreo
19/11/2022
Tipos de Errores en los Censos y en las Encuestas
Censos: Errores ajenos al muestreo.
Encuestas: Errores de muestreo y Errores ajenos al muestreo.
Precisión de las Encuestas Vs. Precisión de los Censos.
19/11/2022
Unidad de Análisis o Elemento de la Población: Es la unidad para la cual se desea obtener información estadística, por ejemplo: personas, hogares, establecimientos comerciales, industrias, etc.
Características: Se utiliza para referirnos a una variable o atributo que tiene diferentes valores para las unidades de muestreo o de análisis.
Variable Aleatoria: Es aquella que puede tomar aleatoriamente cualquier valor de un conjunto de valores.
Conceptos Básicos de Muestreo
19/11/2022
Marco de muestreo: Aspectos a considerar en su construcción
Muestreo con reemplazo y sin reemplazo
Poblaciones finitas e infinitas
Conceptos Básicos de Muestreo
19/11/2022
Parámetro: Es el valor de una característica determinada que se calcula usando todos los valores de una población determinada.
Estadístico: Es una cantidad que se obtiene a partir de las observaciones muéstrales de una característica para estimar la misma en la población. “El objetivo del muestreo es estimar los parámetros de una población”.
Conceptos Básicos de Muestreo
Los objetivos de la muestra Definición precisa de lo que se va a
investigar.
Claridad en los conceptos empleados.
Definición de la población a estudiar.
Definición de los períodos de referencia.19/11/2022
19/11/2022
Diseño de la encuesta Población objetivo. Tipo de investigación: panel, corte
transversal único, encuesta longitudinal o continua, etc.
Cobertura geográfica. El marco de muestreo o de referencia. Estratificación o formación de estratos. Dominio de estimación o de inferencia. Distribución o afijación del tamaño de
muestra por dominios o estratos.
19/11/2022
Precisión Versus Presupuesto: El Gran Dilema
¿De Cuánto dispongo para el estudio que deseo?
¿Qué estimaciones de datos puedo obtener y en cuáles dominios de estimación o inferencia?
¿Con qué precisión estadística tendré mis estimaciones?
¿Quién manda en la decisión final? ¿Qué sacrifico? Precisión, desagregación de
los datos por dominio, presupuesto, etc.
19/11/2022
Diseño de la encuesta Tipo de muestreo. Tamaño de la muestra. Distribución y selección de la
muestra. Probabilidades de selección. Pesos o factores de expansión o
elevación de la muestra a la población y ponderaciones muestrales.
19/11/2022
Prueba Piloto Es una muestra muy pequeña dirigida a
probar en el campo todos los procesos o etapas de una encuesta o un censo, tales como: cuestionarios; entrevistas, supervisión, coordinación en terreno; plan de tabulación, programas de entrada y salida de datos; etc.
Prueba del cuestionario: se debe probar primero en grupos focales ante de la prueba piloto.
19/11/2022
Principales parámetros que se estiman en una encuesta
Medias. Medianas. Proporciones o porcentajes. Totales o valores absolutos. De razón. Varianzas.
19/11/2022
Es un procedimiento que se utiliza para escoger n (muestra) unidades, una a la vez, de una población de N (población) unidades, de tal manera que cada unidad tenga la misma probabilidad de forma parte de muestra. Es un caso especial del muestreo probabilístico y se utiliza una tabla de números aleatorios para escoger la muestra o se generan en programas.
Muestreo Aleatorio Simple (MAS)
19/11/2022
Tamaño de muestra con MAS para proporciones
Notación:P = Proporción Verdadera de esa clase en la PoblaciónQ = Prop. Fuera de la clase en la poblaciónp = Proporción de esa clase en la muestraq = Prop. Fuera de la clase en la muestraN = Total de unidades en la poblaciónn = Tamaño de muestra deseadoE = Error AbsolutoER = Error relativoK = Nivel de confianza deseado en la muestra S = Varianza en la Población.s = Varianza en la muestraCV = Coeficiente de variación de la Poblacióncv = Coeficiente de variación del estimador.S2 = PQ
19/11/2022
Selección de las unidades en la muestra estimada: MAS
Selección en el MAS usando tablas de números aleatorios. Procedimiento. Ejemplo práctico.
Muestreo sistemático: Es necesario organizar el marco de muestreo ante de escoger la muestra, pero garantiza una mejor selección, ya que la muestra se extrae recorriendo a toda la población con un mismo intervalo. El error de muestreo es menor que el MAS. Procedimiento de selección. Ejemplo práctico.
19/11/2022
Tamaño de muestra con MAS para proporciones con E
absoluto
Tamaño de muestra para una población pequeñan = K2NPQ / (K2PQ + E2N)
Para una población grande donde n es menor o igual a 0.05N, se omite el factor de corrección para poblaciones finitasn = K2PQ / E2
19/11/2022
Tamaño de muestra con MAS para estimar una medias con E absoluto Tamaño de muestra para una población
pequeñan = K2NS2 / (K2S2 + E2N)
Para una población grande donde n es menor o igual a 0.05N, se omite el factor de corrección para poblaciones finitasn = K2S2 / E2
19/11/2022
Tamaño de muestra con MAS para estimar un total con E absoluto Tamaño de muestra para una
población pequeñan = K2NS2 / (K2NS2 + E2)
Ignorando el factor de corrección para poblaciones finitasn = K2NS2 / E2
19/11/2022
Tamaño de muestra con MAS para proporciones con ER
relativo
Tamaño de muestra para una población pequeñan = K2NQ / (K2Q + NP*(ER)2)
Ignorando el factor de corrección para poblaciones finitas
n = K2Q / (P*(ER)2)
19/11/2022
Tamaño de muestra con MAS para estimar la media o el total con ER
relativo
Tamaño de muestra para una población pequeñan = K2N(CV)2 / (K2(CV)2 + N(ER)2)
Ignorando el factor de corrección para poblaciones finitasn = K2(CV)2 / (ER)2
19/11/2022
Tamaño de muestra con MAS cuando el error se expresa en
término del C. V.
Tamaño de muestra para una población pequeñan = (K / ER)2*(CV)2 / {1 + [(1/N) * (K / ER)2*(CV)2]}
Ignorando el factor de corrección para poblaciones finitas
n = (K / ER)2*(CV)2 = [(CV)Calculado / (cv)deseado ]2
Selección de las Unidades con Muestreo Sistemático
1. Asignar números de orden desde 1 a N a las unidades poblacionales.
2. Calcular k=N/n, intervalo de selección.
3. Escoger un No. aleatorio y multiplicarlo por k, con este No. Se escoge la primera unidad, llamada arranque aleatorio (AA). Los decimales de k se redondean siempre hacia arriba.19/11/2022
Selección de las Unidades con Muestreo Sistemático
4. Al AA súmele k, para obtener el segundo número, a este súmele k de nuevo y obtendrá el tercer número y así sucesivamente hasta completar el tamaño de muestra deseado.
5. Después de escoger todos los números, se redondean, y vamos a los elementos de la población listada en orden, y lo marcamos con un circulo en la lista o con un 1 o una X, si es en una base de datos, luego filtramos y tenemos la muestra.19/11/2022
19/11/2022
Muestreo Estratificado En el MAS el error muestral solamente
puede reducirse aumentando el tamaño de la muestra, pero cuando se conocen algunas informaciones de la población en estudio, es posible estratificar y reducir el error de muestreo. Es decir, la estratificación tiene como objetivo fundamental tener poblaciones más homogéneas y por ende una menor varianza en las estimaciones.
19/11/2022
Muestreo Aleatorio Estratificado
Es un método en el cual los elementos de la población se clasifican en grupos (estratos), luego se elige la muestra en forma independiente en cada grupo. El proceso de establecer estos grupos se denomina “Estratificación” y los grupos clasificados, se llaman “estratos”, estos pueden ser regiones geográficas, zonas de residencias, estratos socioeconómicos, sexo, grupos de edad, etc. Las estimaciones totales son ponderaciones de cada estrato.
19/11/2022
Muestreo aleatorio estratificado - Simbología que se utiliza
Se utiliza la misma simbología que en el MAS, pero se le adiciona un subíndice para identificar un estrato en particular cuando nos referimos a las informaciones de ese estrato en particular. El subíndice h se refiere al estrato y el i a la unidad dentro del estrato. N1 y n1 representan la población y la muestra en el estrato 1, N2 y n2 en el segundo estrato, … NL y nL en el último estrato.
19/11/2022
Muestreo Aleatorio Estratificado-Ventajas
Permite utilizar métodos de selección diferente en cada estrato.
Reducción de la varianza. La ubicación y distribución de las unidades
escogidas dentro de cada estrato facilita la supervisión durante el levantamiento de las informaciones en campo.
Permite trabajar por separado cada estrato, tanto en las estimaciones como administrativamente, pero los estratos se pueden sumar y obtener los dominios de estimación.
19/11/2022
Muestreo Estratificado-Desventajas
Se necesita conocer el tamaño de la población en cada estrato para realizar las estimaciones.
Es necesario construir un marco muestreo por separado para cada estrato.
No se pueden dar estimaciones para cada estrato, depende del diseño de la muestra. En ocasiones el estrato coincide con el dominio de estimación.
19/11/2022
Muestreo Estratificado-Asignación de la Muestra en los Estratos: Criterios
utilizados Método fácil de aplicar y tabular:
Asignación proporcional al tamaño o muestra autoponderada, asignación de igual tamaño.
Para estratos auto-representados o dominios de estimación: Asignación proporcional a la raíz cuadrada del total de elementos en cada estrato y asignación de Markwardt.
Método de la varianza más baja en los estratos: Asignación óptima y de Neyman.
19/11/2022
Muestreo Estratificado: Asignación de nh con el método fácil de aplicar y
tabular Afijación o asignación proporcional al
tamaño de cada estrato: En el muestreo estratificado es frecuente asignar la misma proporción de unidades en cada estrato con el objetivo de obtener una muestra autoponderada.
nh = (n / N)*Nh = (Nh / N)*n Afijación o asignación con igual tamaño
en cada estrato. nh = n / L
Donde L = Número de estrato.
19/11/2022
Muestreo Estratificado: Asignación de nh en estratos auto representados
Afijación de Markwardt: asigna a cada estrato el promedio de la afijación proporcional y la de igual tamaño en cada estrato.
Afijación proporcional a la raíz cuadrada al total de elementos cada estrato (Nh): Se saca la raíz cuadrada de total de Nh elementos y luego se aplica la asignación proporcional al tamaño. Este método garantiza que la muestra no recaiga casi en la totalidad en los estratos más grandes, en donde estos estratos tienen mayor muestra, pero lo más pequeños quedan mejor representados.
19/11/2022
Muestreo Estratificado: Asignación de nh en estratos con varianza mínima
Asignación óptima: Se refiere a la manera óptima de asignar n a los diferentes estratos.
nh = {(Nh*Ŝh /{ch}0.5) / (∑Nh*Ŝh /{ch}0.5)}*n, Donde: ch = al costo de muestreo de una unidad
en el estrato h. Asignación de Neyman: es un caso
especial de la asignación óptima, se presenta cuando no hay diferencia en el costo de muestral las unidades en los estratos.
nh = {(Nh*Ŝh) / (∑Nh*Ŝh)}*n
19/11/2022
Muestreo por Conglomerados: Definición
Hemos visto hasta ahora que las unidades de muestreo o unidades a seleccionar eran las mismas que constituían el objeto de nuestro estudio. Cuando las unidades de muestreo comprenden dos o más unidades de estudio o unidades últimas; se dice que cada unidad de muestreo constituye “un conglomerado” de unidades últimas, y que el “muestreo es por conglomerados”. Generalmente son áreas geográficas, pero pueden ser además establecimientos o empresas
19/11/2022
Muestreo de Conglomerados por Etapas
Los conglomerados muéstrales determinan las unidades a incluirse, la cual se puede hacer de dos maneras:
1.- Muestro por Conglomerados Unietápico: Cuando se incluyen en la muestra a todas las unidades dentro del conglomerado escogido. Ej. ENI-2012.
2.- Muestro por Conglomerados Multietápico: Cuando se elige una submuestra dentro de los conglomerados seleccionados previamente. Ej. ENFT, ENHOGAR, ENDESA, ENCFT, etc.
19/11/2022
Razones para el uso del Muestreo de Conglomerados
La no existencia de un marco muestral adecuado del cual se puedan seleccionar directamente una muestra de elementos de la población.
Costo de construcción del marco de muestreo.
Ahorro en costo durante el levantamiento en campo. En las mayorías de las situaciones el MAS tiene una varianza menor que el muestreo por conglomerado.
19/11/2022
Muestreo de Conglomerados por Etapas: Efecto de diseño o
DEFF Es el cociente de la varianza de una
estimación obtenida utilizando un diseño de muestra complejo o de conglomerados y de la varianza de la estimación obtenida con una muestra aleatoria simple del mismo tamaño.
Efecto de diseño o DEFF = Varianza con el diseño complejo / varianza obtenida con el MAS de la estimación que se trate.
19/11/2022
Selección con Probabilidad Proporcional al Tamaño (PPT) de los
conglomerados Es muy difícil en la práctica obtener
conglomerados de igual tamaño y seleccionar la muestra con el MAS, para controlar los efectos de la variabilidad en los tamaños de los conglomerados, se utiliza el método de escoger los conglomerados de la muestra con probabilidad proporcionar al tamaño (# de elementos) de los mismos.
19/11/2022
Muestreo de Conglomerados en dos Etapas o Biétapico
Es el tipo de muestreo más utilizado en las encuestas de hogares de América Latina. En la primera etapa se escogen los conglomerados como unidades primarias de muestreo (UPM) con PPT y en la segunda etapa se eligen las viviendas como unidades secundarias de muestreo (USM), ya sea con segmentos sistemático o compacto, algunos países tienen segmentos sistemático en la zona urbana y compacto en la rural.
19/11/2022
Segmentos Compactos y Sistemáticos
Segmentos compactos: Cuando los elementos de un conglomerado se escogen en grupo de elementos contiguos. Facilita el levantamiento de las informaciones, pero aumenta la varianza en las estimaciones.
Segmentos sistemáticos: Cuando los elementos de un conglomerado se escogen a intervalo fijo entre un elemento y otro, de tal manera que en el proceso de selección se recorre todo el conglomerado.
19/11/2022
Marco de Referencia del Censo
Formación de las áreas o conglomerados censales.
Base de la segmentación para realizar el Censo.
Tipos de conglomerados y forma de selección de los mismos.
19/11/2022
Factores de Expansión o Elevación en Muestras de Hogares utilizando el Censo
Cálculos de los factores de expansión o elevación de la muestra al universo.
Ajustes de los factores de expansión o elevación ante del levantamiento de la encuesta.
Ajustes de los factores de expansión o elevación posterior al levantamiento de la encuesta.
19/11/2022
Tamaño en muestra compleja: Fórmula para proporciones en muestra de
hogares
Nnnn
0
0
1
n = Número de hogares para la muestraZ = Valor para el 95% de confianzae = Error relativoN = Tamaño de la población del grupo objetivoDeff = Efecto del diseño hv = Personas del grupo objetivo por viviendaTnr = Tasa de no-respuesta.
)1(12
0 tnrhvdeff
pp
ezn
Nnnn
0
0
1
)1(12
0 tnrhvdeff
pp
ezn
19/11/2022
Tamaño de muestra en muestra compleja: Fórmula para medias en
muestra de hogares
)1()(
2
0 tnrhvdeff
promezsn
Nnnn
0
0
1
n = Número de hogares para la muestraZ = Valor para el 95% de confianzae = Error relativoN = Tamaño de la población del grupo objetivoDeff = Efecto del diseño hv = Personas del grupo objetivo por viviendaTnr = Tasa de no-respuesta.
)1()(
2
0 tnrhvdeff
promezsn
Nnnn
0
0
1
19/11/2022
Asignación del tamaño de la muestra en los estratos cuando la muestra es
compleja Si la muestra compleja es
estratificada, se utilizan las mismas formas de afijación o asignación de la muestra que se utilizaron en el muestreo aleatorio estratificado que vimos anteriormente.
19/11/2022
Datos del Problema 1 El ingreso promedio de un hogar es de
aproximadamente 425 Dólares y la desviación estándar de la distribución es 150 Dólares. Se desea tomar una muestra de una población de 750 hogares, de tal manera que el error relativo no supere el 10% de la media, con un nivel de confianza del 95%, tasa de no respuesta de 7%, un efecto de diseño de 2.2 y un promedio de persona por hogar de 3.8.
19/11/2022
Datos del Problema 2 Proporción en la población de las variables de
diseño en la muestras, en donde la V1 tiene una P1=0.24 y en la V2 la P2=0.12 respectivamente. Se desea tomar una muestra de una población de 50,000 hogares, de tal manera que el error relativo no supere el 7.5% de la proporción, con un nivel de confianza del 90%, tasa de no respuesta de 10%, un efecto de diseño de 1.9 y un promedio de persona por hogar de 3.7.
¿Cuál tamaño de muestra recomienda usted y por qué?