52
19/11/2022 Introducción al Muestreo: Aspectos Teóricos y Prácticos de las Encuestas a Hogares y Establecimientos Facilitador: Lalito R. Vargas Maestría en Estadística Aplicada

Charla Introduccion al muestreo en la MEA Casos practicos

Embed Size (px)

Citation preview

19/11/2022

Introducción al Muestreo:Aspectos Teóricos y

Prácticos de las Encuestas a Hogares y

Establecimientos

Facilitador: Lalito R. Vargas

Maestría en Estadística Aplicada

19/11/2022

Población o universo: Es el grupo completo de todas las unidades de análisis cuyas características queremos estimar. También se define como cualquier colección finita o infinita de individuos o elementos. En esta oportunidad trataremos poblaciones finitas con N unidades.

Muestra: Es cuando se observa a una parte de la población con el propósito de tomar decisiones con relación a la población objetivo de donde proviene la misma.

Conceptos Básicos de Muestreo

19/11/2022

Muestra probabilística: Es una muestra obtenida mediante la aplicación de la teoría de probabilidad, en donde cada elemento de una población definida tiene una probabilidad conocida y diferente de cero de formar parte de la muestra, es decir, se conoce matemáticamente la probabilidad que tiene cada elemento de formar parte de la misma.Muestra no probabilística: Es cuando se escoge una parte de la población con método no probabilístico, es decir, los elemento escogidos no tienen una probabilidad asociada a la selección de los mismos. Tales como muestreo por cuota, de juicio, casual, etc.

Conceptos Básicos de Muestreo

19/11/2022

Encuesta: Es un método para recoger información sobre una población humana, en el que el contacto directo se hace con unidades de estudio (individuos, organizaciones, comunidades, etc.) a través de medios tan sistemáticos como cuestionarios y programas de entrevistas.

Censo: Es una encuesta en la cual se recopila información de todos los componentes de una población. Objetivos principales de un Censo de Población y Vivienda son: Servir de marco de referencia para las encuestas y dar informaciones para las pequeñas demarcaciones.

Conceptos Básicos de Muestreo

19/11/2022

Tipos de Errores en los Censos y en las Encuestas

Censos: Errores ajenos al muestreo.

Encuestas: Errores de muestreo y Errores ajenos al muestreo.

Precisión de las Encuestas Vs. Precisión de los Censos.

19/11/2022

Unidad de Análisis o Elemento de la Población: Es la unidad para la cual se desea obtener información estadística, por ejemplo: personas, hogares, establecimientos comerciales, industrias, etc.

Características: Se utiliza para referirnos a una variable o atributo que tiene diferentes valores para las unidades de muestreo o de análisis.

Variable Aleatoria: Es aquella que puede tomar aleatoriamente cualquier valor de un conjunto de valores.

Conceptos Básicos de Muestreo

19/11/2022

Marco de muestreo: Aspectos a considerar en su construcción

Muestreo con reemplazo y sin reemplazo

Poblaciones finitas e infinitas

Conceptos Básicos de Muestreo

19/11/2022

Parámetro: Es el valor de una característica determinada que se calcula usando todos los valores de una población determinada.

Estadístico: Es una cantidad que se obtiene a partir de las observaciones muéstrales de una característica para estimar la misma en la población. “El objetivo del muestreo es estimar los parámetros de una población”.

Conceptos Básicos de Muestreo

Los objetivos de la muestra Definición precisa de lo que se va a

investigar.

Claridad en los conceptos empleados.

Definición de la población a estudiar.

Definición de los períodos de referencia.19/11/2022

19/11/2022

Diseño de la encuesta Población objetivo. Tipo de investigación: panel, corte

transversal único, encuesta longitudinal o continua, etc.

Cobertura geográfica. El marco de muestreo o de referencia. Estratificación o formación de estratos. Dominio de estimación o de inferencia. Distribución o afijación del tamaño de

muestra por dominios o estratos.

19/11/2022

Precisión Versus Presupuesto: El Gran Dilema

¿De Cuánto dispongo para el estudio que deseo?

¿Qué estimaciones de datos puedo obtener y en cuáles dominios de estimación o inferencia?

¿Con qué precisión estadística tendré mis estimaciones?

¿Quién manda en la decisión final? ¿Qué sacrifico? Precisión, desagregación de

los datos por dominio, presupuesto, etc.

19/11/2022

Diseño de la encuesta Tipo de muestreo. Tamaño de la muestra. Distribución y selección de la

muestra. Probabilidades de selección. Pesos o factores de expansión o

elevación de la muestra a la población y ponderaciones muestrales.

19/11/2022

Prueba Piloto Es una muestra muy pequeña dirigida a

probar en el campo todos los procesos o etapas de una encuesta o un censo, tales como: cuestionarios; entrevistas, supervisión, coordinación en terreno; plan de tabulación, programas de entrada y salida de datos; etc.

Prueba del cuestionario: se debe probar primero en grupos focales ante de la prueba piloto.

19/11/2022

Principales parámetros que se estiman en una encuesta

Medias. Medianas. Proporciones o porcentajes. Totales o valores absolutos. De razón. Varianzas.

19/11/2022

Es un procedimiento que se utiliza para escoger n (muestra) unidades, una a la vez, de una población de N (población) unidades, de tal manera que cada unidad tenga la misma probabilidad de forma parte de muestra. Es un caso especial del muestreo probabilístico y se utiliza una tabla de números aleatorios para escoger la muestra o se generan en programas.

Muestreo Aleatorio Simple (MAS)

19/11/2022

Tamaño de muestra con MAS para proporciones

Notación:P = Proporción Verdadera de esa clase en la PoblaciónQ = Prop. Fuera de la clase en la poblaciónp = Proporción de esa clase en la muestraq = Prop. Fuera de la clase en la muestraN = Total de unidades en la poblaciónn = Tamaño de muestra deseadoE = Error AbsolutoER = Error relativoK = Nivel de confianza deseado en la muestra S = Varianza en la Población.s = Varianza en la muestraCV = Coeficiente de variación de la Poblacióncv = Coeficiente de variación del estimador.S2 = PQ

19/11/2022

Selección de las unidades en la muestra estimada: MAS

Selección en el MAS usando tablas de números aleatorios. Procedimiento. Ejemplo práctico.

Muestreo sistemático: Es necesario organizar el marco de muestreo ante de escoger la muestra, pero garantiza una mejor selección, ya que la muestra se extrae recorriendo a toda la población con un mismo intervalo. El error de muestreo es menor que el MAS. Procedimiento de selección. Ejemplo práctico.

19/11/2022

Tamaño de muestra con MAS para proporciones con E

absoluto

Tamaño de muestra para una población pequeñan = K2NPQ / (K2PQ + E2N)

Para una población grande donde n es menor o igual a 0.05N, se omite el factor de corrección para poblaciones finitasn = K2PQ / E2

19/11/2022

Tamaño de muestra con MAS para estimar una medias con E absoluto Tamaño de muestra para una población

pequeñan = K2NS2 / (K2S2 + E2N)

Para una población grande donde n es menor o igual a 0.05N, se omite el factor de corrección para poblaciones finitasn = K2S2 / E2

19/11/2022

Tamaño de muestra con MAS para estimar un total con E absoluto Tamaño de muestra para una

población pequeñan = K2NS2 / (K2NS2 + E2)

Ignorando el factor de corrección para poblaciones finitasn = K2NS2 / E2

19/11/2022

Tamaño de muestra con MAS para proporciones con ER

relativo

Tamaño de muestra para una población pequeñan = K2NQ / (K2Q + NP*(ER)2)

Ignorando el factor de corrección para poblaciones finitas

n = K2Q / (P*(ER)2)

19/11/2022

Tamaño de muestra con MAS para estimar la media o el total con ER

relativo

Tamaño de muestra para una población pequeñan = K2N(CV)2 / (K2(CV)2 + N(ER)2)

Ignorando el factor de corrección para poblaciones finitasn = K2(CV)2 / (ER)2

19/11/2022

Tamaño de muestra con MAS cuando el error se expresa en

término del C. V.

Tamaño de muestra para una población pequeñan = (K / ER)2*(CV)2 / {1 + [(1/N) * (K / ER)2*(CV)2]}

Ignorando el factor de corrección para poblaciones finitas

n = (K / ER)2*(CV)2 = [(CV)Calculado / (cv)deseado ]2

Selección de las Unidades con Muestreo Sistemático

1. Asignar números de orden desde 1 a N a las unidades poblacionales.

2. Calcular k=N/n, intervalo de selección.

3. Escoger un No. aleatorio y multiplicarlo por k, con este No. Se escoge la primera unidad, llamada arranque aleatorio (AA). Los decimales de k se redondean siempre hacia arriba.19/11/2022

Selección de las Unidades con Muestreo Sistemático

4. Al AA súmele k, para obtener el segundo número, a este súmele k de nuevo y obtendrá el tercer número y así sucesivamente hasta completar el tamaño de muestra deseado.

5. Después de escoger todos los números, se redondean, y vamos a los elementos de la población listada en orden, y lo marcamos con un circulo en la lista o con un 1 o una X, si es en una base de datos, luego filtramos y tenemos la muestra.19/11/2022

Muestreo Estratificado en las

Encuestas por Muestreo

19/11/2022

19/11/2022

Muestreo Estratificado En el MAS el error muestral solamente

puede reducirse aumentando el tamaño de la muestra, pero cuando se conocen algunas informaciones de la población en estudio, es posible estratificar y reducir el error de muestreo. Es decir, la estratificación tiene como objetivo fundamental tener poblaciones más homogéneas y por ende una menor varianza en las estimaciones.

19/11/2022

Muestreo Aleatorio Estratificado

Es un método en el cual los elementos de la población se clasifican en grupos (estratos), luego se elige la muestra en forma independiente en cada grupo. El proceso de establecer estos grupos se denomina “Estratificación” y los grupos clasificados, se llaman “estratos”, estos pueden ser regiones geográficas, zonas de residencias, estratos socioeconómicos, sexo, grupos de edad, etc. Las estimaciones totales son ponderaciones de cada estrato.

19/11/2022

Muestreo aleatorio estratificado - Simbología que se utiliza

Se utiliza la misma simbología que en el MAS, pero se le adiciona un subíndice para identificar un estrato en particular cuando nos referimos a las informaciones de ese estrato en particular. El subíndice h se refiere al estrato y el i a la unidad dentro del estrato. N1 y n1 representan la población y la muestra en el estrato 1, N2 y n2 en el segundo estrato, … NL y nL en el último estrato.

19/11/2022

Muestreo Aleatorio Estratificado-Ventajas

Permite utilizar métodos de selección diferente en cada estrato.

Reducción de la varianza. La ubicación y distribución de las unidades

escogidas dentro de cada estrato facilita la supervisión durante el levantamiento de las informaciones en campo.

Permite trabajar por separado cada estrato, tanto en las estimaciones como administrativamente, pero los estratos se pueden sumar y obtener los dominios de estimación.

19/11/2022

Muestreo Estratificado-Desventajas

Se necesita conocer el tamaño de la población en cada estrato para realizar las estimaciones.

Es necesario construir un marco muestreo por separado para cada estrato.

No se pueden dar estimaciones para cada estrato, depende del diseño de la muestra. En ocasiones el estrato coincide con el dominio de estimación.

19/11/2022

Muestreo Estratificado-Asignación de la Muestra en los Estratos: Criterios

utilizados Método fácil de aplicar y tabular:

Asignación proporcional al tamaño o muestra autoponderada, asignación de igual tamaño.

Para estratos auto-representados o dominios de estimación: Asignación proporcional a la raíz cuadrada del total de elementos en cada estrato y asignación de Markwardt.

Método de la varianza más baja en los estratos: Asignación óptima y de Neyman.

19/11/2022

Muestreo Estratificado: Asignación de nh con el método fácil de aplicar y

tabular Afijación o asignación proporcional al

tamaño de cada estrato: En el muestreo estratificado es frecuente asignar la misma proporción de unidades en cada estrato con el objetivo de obtener una muestra autoponderada.

nh = (n / N)*Nh = (Nh / N)*n Afijación o asignación con igual tamaño

en cada estrato. nh = n / L

Donde L = Número de estrato.

19/11/2022

Muestreo Estratificado: Asignación de nh en estratos auto representados

Afijación de Markwardt: asigna a cada estrato el promedio de la afijación proporcional y la de igual tamaño en cada estrato.

Afijación proporcional a la raíz cuadrada al total de elementos cada estrato (Nh): Se saca la raíz cuadrada de total de Nh elementos y luego se aplica la asignación proporcional al tamaño. Este método garantiza que la muestra no recaiga casi en la totalidad en los estratos más grandes, en donde estos estratos tienen mayor muestra, pero lo más pequeños quedan mejor representados.

19/11/2022

Muestreo Estratificado: Asignación de nh en estratos con varianza mínima

Asignación óptima: Se refiere a la manera óptima de asignar n a los diferentes estratos.

nh = {(Nh*Ŝh /{ch}0.5) / (∑Nh*Ŝh /{ch}0.5)}*n, Donde: ch = al costo de muestreo de una unidad

en el estrato h. Asignación de Neyman: es un caso

especial de la asignación óptima, se presenta cuando no hay diferencia en el costo de muestral las unidades en los estratos.

nh = {(Nh*Ŝh) / (∑Nh*Ŝh)}*n

MUESTREO POR CONGLOMERADOS: MUESTRAS COMPLEJAS

19/11/2022

19/11/2022

Muestreo por Conglomerados: Definición

Hemos visto hasta ahora que las unidades de muestreo o unidades a seleccionar eran las mismas que constituían el objeto de nuestro estudio. Cuando las unidades de muestreo comprenden dos o más unidades de estudio o unidades últimas; se dice que cada unidad de muestreo constituye “un conglomerado” de unidades últimas, y que el “muestreo es por conglomerados”. Generalmente son áreas geográficas, pero pueden ser además establecimientos o empresas

19/11/2022

Muestreo de Conglomerados por Etapas

Los conglomerados muéstrales determinan las unidades a incluirse, la cual se puede hacer de dos maneras:

1.- Muestro por Conglomerados Unietápico: Cuando se incluyen en la muestra a todas las unidades dentro del conglomerado escogido. Ej. ENI-2012.

2.- Muestro por Conglomerados Multietápico: Cuando se elige una submuestra dentro de los conglomerados seleccionados previamente. Ej. ENFT, ENHOGAR, ENDESA, ENCFT, etc.

19/11/2022

Razones para el uso del Muestreo de Conglomerados

La no existencia de un marco muestral adecuado del cual se puedan seleccionar directamente una muestra de elementos de la población.

Costo de construcción del marco de muestreo.

Ahorro en costo durante el levantamiento en campo. En las mayorías de las situaciones el MAS tiene una varianza menor que el muestreo por conglomerado.

19/11/2022

Muestreo de Conglomerados por Etapas: Efecto de diseño o

DEFF Es el cociente de la varianza de una

estimación obtenida utilizando un diseño de muestra complejo o de conglomerados y de la varianza de la estimación obtenida con una muestra aleatoria simple del mismo tamaño.

Efecto de diseño o DEFF = Varianza con el diseño complejo / varianza obtenida con el MAS de la estimación que se trate.

19/11/2022

Selección con Probabilidad Proporcional al Tamaño (PPT) de los

conglomerados Es muy difícil en la práctica obtener

conglomerados de igual tamaño y seleccionar la muestra con el MAS, para controlar los efectos de la variabilidad en los tamaños de los conglomerados, se utiliza el método de escoger los conglomerados de la muestra con probabilidad proporcionar al tamaño (# de elementos) de los mismos.

19/11/2022

Muestreo de Conglomerados en dos Etapas o Biétapico

Es el tipo de muestreo más utilizado en las encuestas de hogares de América Latina. En la primera etapa se escogen los conglomerados como unidades primarias de muestreo (UPM) con PPT y en la segunda etapa se eligen las viviendas como unidades secundarias de muestreo (USM), ya sea con segmentos sistemático o compacto, algunos países tienen segmentos sistemático en la zona urbana y compacto en la rural.

19/11/2022

Segmentos Compactos y Sistemáticos

Segmentos compactos: Cuando los elementos de un conglomerado se escogen en grupo de elementos contiguos. Facilita el levantamiento de las informaciones, pero aumenta la varianza en las estimaciones.

Segmentos sistemáticos: Cuando los elementos de un conglomerado se escogen a intervalo fijo entre un elemento y otro, de tal manera que en el proceso de selección se recorre todo el conglomerado.

19/11/2022

Marco de Referencia del Censo

Formación de las áreas o conglomerados censales.

Base de la segmentación para realizar el Censo.

Tipos de conglomerados y forma de selección de los mismos.

19/11/2022

Factores de Expansión o Elevación en Muestras de Hogares utilizando el Censo

Cálculos de los factores de expansión o elevación de la muestra al universo.

Ajustes de los factores de expansión o elevación ante del levantamiento de la encuesta.

Ajustes de los factores de expansión o elevación posterior al levantamiento de la encuesta.

19/11/2022

Tamaño en muestra compleja: Fórmula para proporciones en muestra de

hogares

Nnnn

0

0

1

n = Número de hogares para la muestraZ = Valor para el 95% de confianzae = Error relativoN = Tamaño de la población del grupo objetivoDeff = Efecto del diseño hv = Personas del grupo objetivo por viviendaTnr = Tasa de no-respuesta.

)1(12

0 tnrhvdeff

pp

ezn

Nnnn

0

0

1

)1(12

0 tnrhvdeff

pp

ezn

19/11/2022

Tamaño de muestra en muestra compleja: Fórmula para medias en

muestra de hogares

)1()(

2

0 tnrhvdeff

promezsn

Nnnn

0

0

1

n = Número de hogares para la muestraZ = Valor para el 95% de confianzae = Error relativoN = Tamaño de la población del grupo objetivoDeff = Efecto del diseño hv = Personas del grupo objetivo por viviendaTnr = Tasa de no-respuesta.

)1()(

2

0 tnrhvdeff

promezsn

Nnnn

0

0

1

19/11/2022

Asignación del tamaño de la muestra en los estratos cuando la muestra es

compleja Si la muestra compleja es

estratificada, se utilizan las mismas formas de afijación o asignación de la muestra que se utilizaron en el muestreo aleatorio estratificado que vimos anteriormente.

PRÁCTICA

Estimar el tamaño de muestra que se

presentan a continuación

19/11/2022

19/11/2022

Datos del Problema 1 El ingreso promedio de un hogar es de

aproximadamente 425 Dólares y la desviación estándar de la distribución es 150 Dólares. Se desea tomar una muestra de una población de 750 hogares, de tal manera que el error relativo no supere el 10% de la media, con un nivel de confianza del 95%, tasa de no respuesta de 7%, un efecto de diseño de 2.2 y un promedio de persona por hogar de 3.8.

19/11/2022

Datos del Problema 2 Proporción en la población de las variables de

diseño en la muestras, en donde la V1 tiene una P1=0.24 y en la V2 la P2=0.12 respectivamente. Se desea tomar una muestra de una población de 50,000 hogares, de tal manera que el error relativo no supere el 7.5% de la proporción, con un nivel de confianza del 90%, tasa de no respuesta de 10%, un efecto de diseño de 1.9 y un promedio de persona por hogar de 3.7.

¿Cuál tamaño de muestra recomienda usted y por qué?

19/11/2022

GRACIAS POR SU ATENCION