15
República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Universidad Fermín Toro Ingenieras Unificadas Integrantes: Layneker Seijas Stephany Colmenarez Jean Carlos Segovia

estadistica muestreo

Embed Size (px)

Citation preview

Page 1: estadistica muestreo

República Bolivariana de Venezuela

Ministerio del Poder Popular para la Educación

Universidad Fermín Toro

Ingenieras Unificadas

Integrantes:

Layneker Seijas

Stephany Colmenarez

Jean Carlos Segovia

Page 2: estadistica muestreo

El muestreo es una herramienta de la

investigación científica. Su función básica

es determinar que parte de una realidad en

estudio (población o universo) debe

examinarse con la finalidad de hacer

inferencias sobre dicha población. El error

que se comete debido a hecho de que se

obtienen conclusiones sobre cierta realidad

a partir de la observación de sólo una parte

de ella, se denomina error de muestreo.

Obtener una muestra adecuada significa

lograr una versión simplificada de la

población, que reproduzca de algún modo

sus rasgos básicos.

Muestra: En todas las ocasiones en que no

es posible o conveniente realizar un censo,

lo que hacemos es trabajar con una

muestra, entendiendo por tal una parte

representativa de la población. Para que

una muestra sea representativa, y por lo

tanto útil, debe de reflejar las similitudes y

diferencias encontradas en la población,

ejemplificar las características de la misma.

Cuando decimos que una muestra es

representativa indicamos que reúne

aproximadamente las características de la

población que son importantes para la

investigación.

Población Los estadísticos usan la palabra

población para referirse no sólo a personas si

no a todos los elementos que han sido escogidos

para su estudio. Muestra Los estadísticos

emplean la palabra muestra para describir una

porción escogida de la población.

Matemáticamente, podemos describir muestras

y poblaciones al emplear mediciones como la

Media, Mediana, la moda, la desviación

estándar. Cuando éstos términos describen una

muestra se denominan estadísticas. Una

estadística es una característica de una

muestra, los estadísticos emplean letras latinas

minúsculas para denotar estadísticas y

muestras.

Los autores proponen diferentes criterios de

clasificación de los diferentes tipos de

muestreo, aunque en general pueden dividirse

en dos grandes grupos: métodos de muestreo

probabilísticos y métodos de muestreo no

probabilísticos.

Page 3: estadistica muestreo

A. En estudios que implican técnicas destructivas o de uso que imposibilidad de utilización posterior de lo

analizado.

B. El trabajo con una muestra y no con el universo implica eficiencia, pues significa ahorro de recursos,

esfuerzos y tiempo

C. Con el uso del muestreo se pueden obtener resultados razonablemente más precisos que el estudio de todo el

universo, pues para el estudio de sólo una muestra, el personal mínimo necesario puede ser mejor preparado

para recoger información más detallada y elaborada.

D. Como desventaja se debe mencionar el error de muestreo, producto de la variabilidad intrínseca que poseen

los elementos de todo universo o población. El término error no debe entenderse como sinónimo de equivocación

Ejemplo:

Estatura de niños: 117, 120, 125, 125, 130

Tamaño Valores muestrales Media muestral

2 117, 120 118.50

2 125, 130 127.50

2 125, 120 122.50

3 125, 130, 125 126.66

3 125, 125, 120 123.33

3 125, 117, 125 122.33

4 120, 117, 125, 125 123.00

4 130, 117, 125, 125 124.25

4 117, 125, 125, 120 121.75

Media poblacional 123.4

Page 4: estadistica muestreo

Muestreo probabilístico

Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos de

muestreo:

Muestreo aleatorio simple

Para obtener una muestra, se numeran los elementos de la población y se seleccionan al

azar los n elementos que contiene la muestra.

Muestreo aleatorio sistemático

Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás

hasta completar la muestra.

Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una

muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección que

será igual a 100/25 = 4. A continuación elegimos el elemento de arranque, tomando

aleatoriamente un número entre el 1 y el 4, y a partir de él obtenemos los restantes

elementos de la muestra.

2, 6, 10, 14,..., 98

Page 5: estadistica muestreo

Muestreo aleatorio estratificado

Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de

individuos de cada estrato proporcional al número de componentes de cada estrato.

En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20.

Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.

Un muestreo puede hacerse con o sin

reposición, y la población de partida puede ser

infinita o finita.

En todo nuestro estudio vamos a limitarnos

a una población de partida infinita o a

muestreo con reposición.

Si consideremos todas las posibles muestras de

tamaño n en una población, para cada muestra

podemos calcular un estadístico (media,

desviación típica, proporción, ...) que variará

de una a otra.

Así obtenemos una distribución del estadístico

que se llama distribución muestral.

Page 6: estadistica muestreo

Muestreo por cuotas: También denominado en ocasiones, "accidental". Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la población y/o de los individuos más

"representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con

el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen

unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y

residentes en Trujillo. Una vez determinada la cuota, se eligen los primeros que se encuentren que

cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

Por ejemplo, la Dirección Regional de Salud desea estudiar la incidencia de las drogas en la

adolescencia. Lo que deberíamos hacer sería: conocer por los informes de la Dirección Regional de

Educación cuáles son los centros más afectados por el problema, fijar un número de sujetos a

entrevistar proporcional a cada uno de los estratos (cuotas) y finalmente dejar en manos de los

responsables del trabajo de campo a qué sujetos concretos se deberá entrevistar.

Muestreo no probabilístico:

A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se

acude a métodos no probabilístico, aun siendo conscientes de que no sirven para realizar

generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no

todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se

seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa

Page 7: estadistica muestreo

Muestreo Opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo

deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de

grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de

zonas que en anteriores votaciones han marcado tendencias de voto.

Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona

directa e intencionadamente los individuos de la población. El caso más frecuente de este

procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los

profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso

particular es el de los voluntarios.

Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a

otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy

frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes,

sectas, determinados tipos de enfermos, etc.

Page 8: estadistica muestreo

El fórmula para la distribución del muestreo depende de distribución de la población, la estadística

que era considerada, y el tamaño de muestra utilizaron. Una formulación más exacta hablaría de la

distribución de la estadística como ésa para todas las muestras posibles de un tamaño dado, no

apenas “bajo muestreo repetido”.

Por ejemplo, considere un muy grande normal población (una que sigue el supuesto curva de la

campana). Asuma que tomamos en varias ocasiones muestras de un tamaño dado de la población y

calcule medio de la muestra (, medio aritmético de los valores de los datos) para cada muestra.

Diversas muestras conducirán a diversos medios de la muestra. La distribución de estos medios es la

“distribución del muestreo del medio de la muestra” (para el tamaño de muestra dado). Esta

distribución será normal puesto que la población era normal. (Según teorema de límite central, si la

población está no normal sino “suficientemente bien comportada”, la distribución del muestreo del

medio de la muestra todavía es aproximadamente normal proporcionó el tamaño de muestra es

suficientemente grande.)

Así, el medio de la distribución del muestreo es equivalente a valor previsto de cualquier estadística.

Para el caso donde está el medio la estadística de la muestra:

desviación de estándar del muestreo la distribución de la estadística se refiere como error de

estándar de esa cantidad. Para el caso donde está el medio la estadística de la muestra, el error de

estándar está:

donde σ es la desviación de estándar de la distribución de la población de esa cantidad y n es el

tamaño (número de artículos) en la muestra

Page 9: estadistica muestreo

Una implicación muy importante de este fórmula es que usted debe cuadruplicar el tamaño de

muestra (4 ) para alcanzar la mitad (el 1/2) del error de medida. Al diseñar estudios estadísticos

donde está un factor el coste, esto puede tener un factor en entender compensaciones de costes y

beneficios.

Alternativamente, considere la muestra mediano de la misma población. Tiene una diversa

distribución del muestreo que no sea generalmente normal (pero puede estar cercano bajo ciertas

circunstancias).

Ejemplo:

En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela primaria se usará una muestra aleatoria de

20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen una distribución normal. El promedio de los

pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras que el promedio de

los pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si representa el

promedio de los pesos de 20 niños y es el promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el

promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de las 25 niñas.

Solución:

Datos:

1 = 100 libras

2 = 85 libras

1 = 14.142 libras

2 = 12.247 libras

n1 = 20 niños

n2 = 25 niñas

= ?

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20 libras más grande que el de la muestra

de las niñas es 0.1056.

Page 10: estadistica muestreo

El objetivo principal de la estadística inferencial es la estimación, esto es que mediante el estudio de una muestra

de una población se quiere generalizar las conclusiones al total de la misma. Como vimos en la sección anterior,

los estadísticos varían mucho dentro de sus distribuciones muestrales, y mientras menor sea el error estándar de un

estadístico, más cercanos serán unos de otros sus valores.

Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una estimación puntual es un

único valor estadístico y se usa para estimar un parámetro. El estadístico usado se denomina estimador.

Una estimación por intervalo es un rango, generalmente de ancho finito, que se espera que contenga el

parámetro.

Estimación Puntual

La inferencia estadística está casi siempre concentrada en obtener algún tipo de conclusión acerca de uno o más

parámetros (características poblacionales). Para hacerlo, se requiere que un investigador obtenga datos muestrales

de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores

calculados de varias cantidades muestrales . Po ejemplo, representamos con (parámetro) el verdadero promedio

de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podría

tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de cada una, y la media

muestral de la resistencia a la ruptura se podía emplear para sacar una conclusión acerca del valor de . De forma

similar, si es la varianza de la distribución de resistencia a la ruptura, el valor de la varianza muestral s2 se podría

utilizar para inferir algo acerca de .

Cuando se analizan conceptos generales y métodos de inferencia es conveniente tener un símbolo genérico para el

parámetro de interés. Se utilizará la letra griega para este propósito. El objetivo de la estimación puntual es

seleccionar sólo un número, basados en datos de la muestra, que represente el valor más razonable de .

Page 11: estadistica muestreo

Una muestra aleatoria de 3 baterías para calculadora podría presentar duraciones observadas en horas de x1=5.0,

x2=6.4 y x3=5.9. El valor calculado de la duración media muestral es = 5.77, y es razonable considerar 5.77 como

el valor más adecuado de .

Una estimación puntual de un parámetro es un sólo número que se puede considerar como el valor más

razonable de . La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular su valor a

partir de datos de la muestra dada. La estadística seleccionada se llama estimador puntual de .

El símbolo (theta sombrero) suele utilizarse para representar el estimador de y la estimación puntual resultante

de una muestra dada. Entonces se lee como "el estimador puntual de es la media muestral.

un estimador es un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de

la población. Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro desconocido) se

recogerán observaciones del precio de dicho artículo en diversos establecimientos (la muestra) y la media

aritmética de las observaciones puede utilizarse como estimador del precio medio.

Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea

mejores propiedades que los restantes, como insesgadez, eficiencia, convergencia y robustez (consistencia).

El valor de un estimador proporciona lo que se denomina en estadística una estimación puntual del valor del

parámetro en estudio. En general, se suele preferir realizar una estimación mediante un intervalo, esto es, obtener

un intervalo [a,b] dentro del cual se espera esté el valor real del parámetro con un cierto nivel de confianza. Utilizar

un intervalo resulta más informativo, al proporcionar información sobre el posible error de estimación, asociado con

la amplitud de dicho intervalo. El nivel de confianza es la probabilidad de que a priori el verdadero valor del

parámetro quede contenido en el intervalo.

En la práctica, los intervalos suelen indicarse dando el valor del estimador puntual utilizado como centro del

intervalo y un valor que debe sumarse y restarse para obtener el límite superior e inferior; por ejemplo:

equivale a

Page 12: estadistica muestreo

se llama intervalo de confianza a un par de números entre los cuales se estima que estará cierto

valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números

determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es

un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se

denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de

significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal

intervalo.

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo

más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un

intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.

Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución

teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro presente una distribución

normal. También pueden construirse intervalos de confianza con la desigualdad de Chebyshov.

En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro

poblacional θ que sigue una determinada distribución de probabilidad, es una expresión del tipo

[θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.

Page 13: estadistica muestreo

De una población de media μ y desviación típica σ se pueden tomar muestras de n elementos. Cada una

de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias

muestrales coincide con la media poblacional:2

Pero además, si el tamaño de las muestras es lo suficientemente grande,3 la distribución de medias

muestrales es, prácticamente, una distribución normal (o gaussiana) con media μ y una desviación

típica dada por la siguiente expresión: . Esto se representa como sigue: . Si estandarizamos, se sigue

que:

En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un

determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] =

1 - α, donde (1 - α)·100 es el porcentaje deseado (véase el uso de las tablas en una distribución

normal).

Se desea obtener una expresión tal que

En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará

la media poblacional si sólo se conoce una media muestral ( ), con una confianza determinada.

Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamará 1

− α (debido a que α es el error que se cometerá, un término opuesto).

Para ello se necesita calcular el punto Xα / 2 —o, mejor dicho, su versión estandarizada Zα / 2 o valor

crítico— junto con su "opuesto en la distribución" X − α / 2. Estos puntos delimitan la probabilidad para

el intervalo, como se muestra en la siguiente imagen:

Dicho punto es el número tal que:

Page 14: estadistica muestreo

*http://html.rincondelvago.com/conceptos-y-muestreo.html*http://www.angelfire.com/sc/matasc/EyD/bioesta/muestreo.htm*http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html*http://www.multilingualarchive.com/ma/enwiki/es/Sampling_distribution*http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html

Page 15: estadistica muestreo

La utilidad de muestreo y estimación abarca muchos campos tales como:1- Política: Las muestras de las opiniones de los votantes se usan para que los candidatos

midan la opinión pública y el apoyo en las elecciones.

2- Educación: Las muestras de las calificaciones de los exámenes de estudiantes se usan

para determinar la eficiencia de una técnica o programa de enseñanza.

3- Industria: La muestras de los productos de una línea de ensamble sirve para controlar

la calidad.

4- Medicina: Las muestras de medidas de azúcar en la sangre de pacientes diabéticos

prueban la eficacia de una técnica o de un fármaco nuevo.

5- Agricultura: Las muestras del maíz cosechado en una parcela proyectan en

la producción los efectos de un fertilizante nuevo.

6- Gobierno: Una muestra de opiniones de los votantes se usaría para determinar los

criterios del público sobre cuestiones relacionadas con el bienestar y la seguridad nacional