26
GUÍA DE LABORATORIO 1 TEMA: MUESTREO PROBABILÍSTICO

Guias de Laboratorio muestreo probabilistico spss 20

  • Upload
    henry

  • View
    28

  • Download
    7

Embed Size (px)

DESCRIPTION

 Muestreo Aleatorio Simple Muestreo Aleatorio Sistemático Muestreo Aleatorio Estratificado

Citation preview

Page 1: Guias de Laboratorio  muestreo probabilistico spss 20

GUÍA DE LABORATORIO 1

TEMA: MUESTREO PROBABILÍSTICO

Page 2: Guias de Laboratorio  muestreo probabilistico spss 20

2

Contenido teórico:

Muestreo Aleatorio Simple

Muestreo Aleatorio Sistemático

Muestreo Aleatorio Estratificado

Todas las aplicaciones se realizarán en base al archivo de datos Employee data.sav,

disponible en el archivo de instalación del SPSS.

Muestreo Aleatorio Simple

Archivo de datos Employee data.sav :

Observe que en este archivo se han registrado 474 observaciones para un total de 10

variables.

Puede solicitar un reporte de frecuencias para alguna variable de interés, como por

ejemplo Categoría laboral (catlab)

Page 3: Guias de Laboratorio  muestreo probabilistico spss 20

3

Ejercicio 1.

Seleccione una muestra aleatoria simple de 50 empleados

Para ello debe seguir los pasos siguientes:

Datos → Seleccionar casos

Por defecto siempre estarán activos Todos los casos. Elija Muestra aleatoria de casos,

haga clik en el botón Ejemplo …

Page 4: Guias de Laboratorio  muestreo probabilistico spss 20

4

Importante:

En la ventana anterior note que: por defecto se encuentra activa, en el

recuadro inferior de Resultado, la opción: Descartar casos no seleccionados.

Esto permite realizar la selección sin eliminar el caso no seleccionado.

En seguida se muestra la siguiente ventana en la que usted puede solicitar al programa

seleccione aproximadamente cierto porcentaje de casos, conocidos también como

registros u observaciones, para la muestra.

También puede solicitar al programa la selección de un número exacto de casos o

registros. Para nuestro caso utilizaremos esta opción para solicitar que seleccione

exactamente 50 observaciones de los primeros 474 casos.

En esta selección se obtuvo una muestra en la que se ha seleccionado las observaciones

9, 10, 12 y otras. Observe que el programa tacha con una línea oblicua la observación

que NO ha sido seleccionada. Además, ha generado una variable Filtro (filter_$) en la

última columna en la que ha asignado el código 0 a las observaciones que no han sido

seleccionadas y 1 a las que sí han sido seleccionadas.

Page 5: Guias de Laboratorio  muestreo probabilistico spss 20

5

Si usted vuelve a solicitar un reporte de frecuencias para la variable catlab, observará

que ahora solo son consideradas las 50 observaciones que han sido seleccionadas.

Observación:

Cualquier análisis que usted solicite se efectuará solamente sobre las 50

observaciones seleccionadas.

Las observaciones que no han sido seleccionadas no se han perdido,

simplemente por ahora no se encuentran disponibles.

Si desea reestablecer todo el archivo de datos debe hacer lo siguiente:

Datos → Seleccionar casos → Todos los casos

Page 6: Guias de Laboratorio  muestreo probabilistico spss 20

6

Observe que ahora ya no se encuentran tachados los números correspondientes a cada

caso. Nuevamente tenemos disponibles TODOS los casos, a pesar que la variable

filter_$ permanezca.

Es muy frecuente observar que quienes se inician en el manejo de esta herramienta

olvidan reestablecer toda la data y luego obtienen resultados solo de la última muestra

seleccionada.

Page 7: Guias de Laboratorio  muestreo probabilistico spss 20

7

Muestreo Aleatorio Sistemático

La aplicación del muestreo sistemático se hará siempre sobre el mismo archivo de datos

Employee data.sav :

Ejercicio 2.

Seleccione una muestra aleatoria sistemática de 50 empleados

Recuerde que para l aplicación de un muestreo sistemático debemos determinar el valor

de K correspondiente al salto sistemático o período de selección.

948,950

474 K

n

NK

Luego, de los primeros 9 registros del archivo de datos seleccionaremos uno,

aplicando el mismo procedimiento del muestreo aleatorio simple, a este elemento

seleccionado se le conoce como punto de arranque que se le puede denotar como A.

Posteriormente debemos seleccionar a partir de A, incluyendo A, cada 9 registros uno

para la muestra hasta completar los 50 registros solicitados para la muestra.

Por ejemplo: si A = X7 este sería el primer elemento seleccionado.

Luego seleccionamos: X16 , X25 , X34 , … , X439 , X448

Para lograr esto con ayuda del SPSS, se debe seguir los pasos siguientes:

Elección del Punto de Arranque. Aplicaremos un muestreo aleatorio simple para

seleccionar un caso de los primeros nueve registrados en el archivo de datos.

Datos → Seleccionar casos → Muestra aleatoria de casos

Page 8: Guias de Laboratorio  muestreo probabilistico spss 20

8

En nuestro caso se ha seleccionado como Punto de arranque el caso 7: A = X7

Ahora viene la parte más importante para la selección automática de los siguientes

elementos de la muestra.

Primero recuperamos la selección de Todos los casos

Page 9: Guias de Laboratorio  muestreo probabilistico spss 20

9

Luego elegimos la opción condicional para la selección de casos.

Page 10: Guias de Laboratorio  muestreo probabilistico spss 20

10

Al hacer picar en el botón Sí la op… se mostrará la siguiente ventana, que ofrece una

serie de funciones dentro del Grupo de funciones

Page 11: Guias de Laboratorio  muestreo probabilistico spss 20

11

Dentro del Grupo de funciones Aritméticas podemos encontrar la función Mod

(Módulo) que como señala el cuadro explicativo permite determinar el resto o residuo

de dividir una expresión numérica entre el módulo.

Para subir la función elegida picamos en la flecha

Luego debemos indicar para cada signo de interrogación lo que mostramos en el

siguiente cuadro.

Page 12: Guias de Laboratorio  muestreo probabilistico spss 20

12

Tenga en cuenta que:

id: es el código del empleado asignado en el archivo de datos

K = 9 : es el periodo de selección o salto sistemático

A = 7 : es el punto de arranque

n = 50 : es el tamaño de la muestra

Page 13: Guias de Laboratorio  muestreo probabilistico spss 20

13

Lo que se busca en la primera expresión es encontrar los registros cuya división con el

valor de K nos de residuo CERO. La segunda expresión busca establecer un tope hasta

donde se debe verificar estos cocientes. Dado que el valor de K, al ser redondeado al

menor entero, suele ocasionar que sobren casos para realizar más selecciones, esta

segunda expresión evitará que se tomen más observaciones que las establecidas para la

muestra.

Observe que:

Si id = 1 1 + (9 – 7) entre 9 no muestra resto CERO el registro 1 no será

seleccionado

……

Si id = 7 7 + (9 – 7) entre 9 si muestra resto CERO el registro 7 si será

seleccionado

……

Si id = 447 447 + (9 – 7) entre 9 no muestra resto CERO el registro 447 no será

seleccionado

Si id = 448 448 + (9 – 7) entre 9 si muestra resto CERO el registro 448 si será

seleccionado

Picamos en: Continuar Aceptar

Page 14: Guias de Laboratorio  muestreo probabilistico spss 20

14

Observe en el cuadro siguiente que el primer registro seleccionado corresponde al punto

de arranque A = X7 seguido del X7 + 9 = X16

Observe que los dos últimos casos seleccionados son precisamente: X439 y X448

Muestreo Aleatorio Estratificado

Recuerde que para l aplicación de esta técnica de muestreo debemos separar la

población en sub-poblaciones homogéneas. En nuestro caso generaremos un archivo

Page 15: Guias de Laboratorio  muestreo probabilistico spss 20

15

para cada estrato. El archivo de datos ha utilizar sigue siendo Employee data.sav. No

olvide que primero debe observar que tenga todos los casos del archivo disponibles.

Ejercicio 3.

Seleccione una muestra aleatoria estratificada de 50 empleados con asignación

proporcional a la categoría laboral.

Dado que la muestra se desea asignar proporcionalmente a la categoría laboral podemos

solicitar una tabla de frecuencias para esta variable y así conocer el tamaño de cada

estrato

En seguida hacemos los cálculos para la determinación del tamaño de muestra para cada

estrato (categoría laboral)

Categoría Laboral Frecuencia Proporción ni = ( Ni / N ) * n

Administrativo 363 ,7658 38,3 38

Seguridad 27 ,0570 2,8 3

Directivo 84 ,1772 8,9 9

Total 474 1,0 50

Para la conformación de los estratos hacemos uso de la selección condicional:

Datos → Seleccionar casos → Si se satisface la condición → Si la op…

Page 16: Guias de Laboratorio  muestreo probabilistico spss 20

16

Seleccionamos la variable catlab y la igualamos a 1 esto permitirá seleccionar todos

los casos cuya categoría laboral sea Administrativo (1).

Algo muy importante con el Resultado, ahora solicitaremos que Copie los casos

seleccionados a un nuevo conjunto de datos que llamaremos Administrativo,

obteniendo de esta manera nuestro primer estrato.

Page 17: Guias de Laboratorio  muestreo probabilistico spss 20

17

El resultado será un nuevo archivo de datos que considera solo los 363 casos

correspondientes a Administrativos.

Repetimos el procedimiento anterior para generar el segundo y tercer estrato que

llamaremos respectivamente: Seguridad (catlab = 2) y Directivo (catlab = 3)

Page 18: Guias de Laboratorio  muestreo probabilistico spss 20

18

Page 19: Guias de Laboratorio  muestreo probabilistico spss 20

19

Observe que hasta aquí se ha logrado conformar el estrato que llamaremos Seguridad

que cuenta con 27 casos registrados.

Page 20: Guias de Laboratorio  muestreo probabilistico spss 20

20

Tenemos el estrato llamado Directivo conformado por 84 casos.

Muestra por estrato. Ahora estamos en condición de aplicar un muestreo aleatorio

simple por cada estrato, seleccionando el número de observaciones calculado al inicio.

Page 21: Guias de Laboratorio  muestreo probabilistico spss 20

21

ADMINISTRATIVO

Page 22: Guias de Laboratorio  muestreo probabilistico spss 20

22

Ahora puede hacer uso de la tercera opción de Resultados: Eliminar casos no

seleccionados

Es importante que esté conciente que al elegir esta opción los casos no seleccionados

serán eliminados sin posibilidad de volverles a recuperar.

Page 23: Guias de Laboratorio  muestreo probabilistico spss 20

23

Observe que el archivo correspondiente a la muestra seleccionada del estrato de

Administrativos cuenta con 38 casos.

SEGURIDAD

Del estrato Seguridad seleccionaremos con una muestra aleatoria simple de 3 de los 27

casos

No olvide elegir en Resultados la opción de Eliminar casos no seleccionados. El

resultado debe ser un archivo correspondiente a Seguridad reducido a 3 casos.

Page 24: Guias de Laboratorio  muestreo probabilistico spss 20

24

DIRECTIVO

Si hacemos lo propio para el estrato de Directivos lograremos obtener este archivo

reducido a 9 casos de los 84 que muestra inicialmente.

Finalmente puede unir los tres archivos en uno solo teniendo la muestra total de 50

registros

Page 25: Guias de Laboratorio  muestreo probabilistico spss 20

25

Solicite un reporte de frecuencias para este último archivo

Page 26: Guias de Laboratorio  muestreo probabilistico spss 20

26

Este resultado confirma que la muestra ha sido seleccionada conforme se ha solicitado,

respetando la asignación proporcional a la categoría laboral.