Upload
layneker18
View
2.754
Download
2
Embed Size (px)
Citation preview
República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
Universidad Fermín Toro
Ingenieras Unificadas
Integrantes:
Layneker Seijas
Stephany Colmenarez
Jean Carlos Segovia
El muestreo es una herramienta de la
investigación científica. Su función básica
es determinar que parte de una realidad en
estudio (población o universo) debe
examinarse con la finalidad de hacer
inferencias sobre dicha población. El error
que se comete debido a hecho de que se
obtienen conclusiones sobre cierta realidad
a partir de la observación de sólo una parte
de ella, se denomina error de muestreo.
Obtener una muestra adecuada significa
lograr una versión simplificada de la
población, que reproduzca de algún modo
sus rasgos básicos.
Muestra: En todas las ocasiones en que no
es posible o conveniente realizar un censo,
lo que hacemos es trabajar con una
muestra, entendiendo por tal una parte
representativa de la población. Para que
una muestra sea representativa, y por lo
tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población,
ejemplificar las características de la misma.
Cuando decimos que una muestra es
representativa indicamos que reúne
aproximadamente las características de la
población que son importantes para la
investigación.
Población Los estadísticos usan la palabra
población para referirse no sólo a personas si
no a todos los elementos que han sido escogidos
para su estudio. Muestra Los estadísticos
emplean la palabra muestra para describir una
porción escogida de la población.
Matemáticamente, podemos describir muestras
y poblaciones al emplear mediciones como la
Media, Mediana, la moda, la desviación
estándar. Cuando éstos términos describen una
muestra se denominan estadísticas. Una
estadística es una característica de una
muestra, los estadísticos emplean letras latinas
minúsculas para denotar estadísticas y
muestras.
Los autores proponen diferentes criterios de
clasificación de los diferentes tipos de
muestreo, aunque en general pueden dividirse
en dos grandes grupos: métodos de muestreo
probabilísticos y métodos de muestreo no
probabilísticos.
A. En estudios que implican técnicas destructivas o de uso que imposibilidad de utilización posterior de lo
analizado.
B. El trabajo con una muestra y no con el universo implica eficiencia, pues significa ahorro de recursos,
esfuerzos y tiempo
C. Con el uso del muestreo se pueden obtener resultados razonablemente más precisos que el estudio de todo el
universo, pues para el estudio de sólo una muestra, el personal mínimo necesario puede ser mejor preparado
para recoger información más detallada y elaborada.
D. Como desventaja se debe mencionar el error de muestreo, producto de la variabilidad intrínseca que poseen
los elementos de todo universo o población. El término error no debe entenderse como sinónimo de equivocación
Ejemplo:
Estatura de niños: 117, 120, 125, 125, 130
Tamaño Valores muestrales Media muestral
2 117, 120 118.50
2 125, 130 127.50
2 125, 120 122.50
3 125, 130, 125 126.66
3 125, 125, 120 123.33
3 125, 117, 125 122.33
4 120, 117, 125, 125 123.00
4 130, 117, 125, 125 124.25
4 117, 125, 125, 120 121.75
Media poblacional 123.4
Muestreo probabilístico
Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos de
muestreo:
Muestreo aleatorio simple
Para obtener una muestra, se numeran los elementos de la población y se seleccionan al
azar los n elementos que contiene la muestra.
Muestreo aleatorio sistemático
Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás
hasta completar la muestra.
Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una
muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección que
será igual a 100/25 = 4. A continuación elegimos el elemento de arranque, tomando
aleatoriamente un número entre el 1 y el 4, y a partir de él obtenemos los restantes
elementos de la muestra.
2, 6, 10, 14,..., 98
Muestreo aleatorio estratificado
Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de
individuos de cada estrato proporcional al número de componentes de cada estrato.
En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20.
Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.
Un muestreo puede hacerse con o sin
reposición, y la población de partida puede ser
infinita o finita.
En todo nuestro estudio vamos a limitarnos
a una población de partida infinita o a
muestreo con reposición.
Si consideremos todas las posibles muestras de
tamaño n en una población, para cada muestra
podemos calcular un estadístico (media,
desviación típica, proporción, ...) que variará
de una a otra.
Así obtenemos una distribución del estadístico
que se llama distribución muestral.
Muestreo por cuotas: También denominado en ocasiones, "accidental". Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con
el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen
unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y
residentes en Trujillo. Una vez determinada la cuota, se eligen los primeros que se encuentren que
cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.
Por ejemplo, la Dirección Regional de Salud desea estudiar la incidencia de las drogas en la
adolescencia. Lo que deberíamos hacer sería: conocer por los informes de la Dirección Regional de
Educación cuáles son los centros más afectados por el problema, fijar un número de sujetos a
entrevistar proporcional a cada uno de los estratos (cuotas) y finalmente dejar en manos de los
responsables del trabajo de campo a qué sujetos concretos se deberá entrevistar.
Muestreo no probabilístico:
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se
acude a métodos no probabilístico, aun siendo conscientes de que no sirven para realizar
generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no
todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se
seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa
Muestreo Opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo
deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de
grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de
zonas que en anteriores votaciones han marcado tendencias de voto.
Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona
directa e intencionadamente los individuos de la población. El caso más frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los
profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso
particular es el de los voluntarios.
Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a
otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes,
sectas, determinados tipos de enfermos, etc.
El fórmula para la distribución del muestreo depende de distribución de la población, la estadística
que era considerada, y el tamaño de muestra utilizaron. Una formulación más exacta hablaría de la
distribución de la estadística como ésa para todas las muestras posibles de un tamaño dado, no
apenas “bajo muestreo repetido”.
Por ejemplo, considere un muy grande normal población (una que sigue el supuesto curva de la
campana). Asuma que tomamos en varias ocasiones muestras de un tamaño dado de la población y
calcule medio de la muestra (, medio aritmético de los valores de los datos) para cada muestra.
Diversas muestras conducirán a diversos medios de la muestra. La distribución de estos medios es la
“distribución del muestreo del medio de la muestra” (para el tamaño de muestra dado). Esta
distribución será normal puesto que la población era normal. (Según teorema de límite central, si la
población está no normal sino “suficientemente bien comportada”, la distribución del muestreo del
medio de la muestra todavía es aproximadamente normal proporcionó el tamaño de muestra es
suficientemente grande.)
Así, el medio de la distribución del muestreo es equivalente a valor previsto de cualquier estadística.
Para el caso donde está el medio la estadística de la muestra:
desviación de estándar del muestreo la distribución de la estadística se refiere como error de
estándar de esa cantidad. Para el caso donde está el medio la estadística de la muestra, el error de
estándar está:
donde σ es la desviación de estándar de la distribución de la población de esa cantidad y n es el
tamaño (número de artículos) en la muestra
Una implicación muy importante de este fórmula es que usted debe cuadruplicar el tamaño de
muestra (4 ) para alcanzar la mitad (el 1/2) del error de medida. Al diseñar estudios estadísticos
donde está un factor el coste, esto puede tener un factor en entender compensaciones de costes y
beneficios.
Alternativamente, considere la muestra mediano de la misma población. Tiene una diversa
distribución del muestreo que no sea generalmente normal (pero puede estar cercano bajo ciertas
circunstancias).
Ejemplo:
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela primaria se usará una muestra aleatoria de
20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen una distribución normal. El promedio de los
pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras que el promedio de
los pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si representa el
promedio de los pesos de 20 niños y es el promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el
promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de las 25 niñas.
Solución:
Datos:
1 = 100 libras
2 = 85 libras
1 = 14.142 libras
2 = 12.247 libras
n1 = 20 niños
n2 = 25 niñas
= ?
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20 libras más grande que el de la muestra
de las niñas es 0.1056.
El objetivo principal de la estadística inferencial es la estimación, esto es que mediante el estudio de una muestra
de una población se quiere generalizar las conclusiones al total de la misma. Como vimos en la sección anterior,
los estadísticos varían mucho dentro de sus distribuciones muestrales, y mientras menor sea el error estándar de un
estadístico, más cercanos serán unos de otros sus valores.
Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una estimación puntual es un
único valor estadístico y se usa para estimar un parámetro. El estadístico usado se denomina estimador.
Una estimación por intervalo es un rango, generalmente de ancho finito, que se espera que contenga el
parámetro.
Estimación Puntual
La inferencia estadística está casi siempre concentrada en obtener algún tipo de conclusión acerca de uno o más
parámetros (características poblacionales). Para hacerlo, se requiere que un investigador obtenga datos muestrales
de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores
calculados de varias cantidades muestrales . Po ejemplo, representamos con (parámetro) el verdadero promedio
de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podría
tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de cada una, y la media
muestral de la resistencia a la ruptura se podía emplear para sacar una conclusión acerca del valor de . De forma
similar, si es la varianza de la distribución de resistencia a la ruptura, el valor de la varianza muestral s2 se podría
utilizar para inferir algo acerca de .
Cuando se analizan conceptos generales y métodos de inferencia es conveniente tener un símbolo genérico para el
parámetro de interés. Se utilizará la letra griega para este propósito. El objetivo de la estimación puntual es
seleccionar sólo un número, basados en datos de la muestra, que represente el valor más razonable de .
Una muestra aleatoria de 3 baterías para calculadora podría presentar duraciones observadas en horas de x1=5.0,
x2=6.4 y x3=5.9. El valor calculado de la duración media muestral es = 5.77, y es razonable considerar 5.77 como
el valor más adecuado de .
Una estimación puntual de un parámetro es un sólo número que se puede considerar como el valor más
razonable de . La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular su valor a
partir de datos de la muestra dada. La estadística seleccionada se llama estimador puntual de .
El símbolo (theta sombrero) suele utilizarse para representar el estimador de y la estimación puntual resultante
de una muestra dada. Entonces se lee como "el estimador puntual de es la media muestral.
un estimador es un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de
la población. Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro desconocido) se
recogerán observaciones del precio de dicho artículo en diversos establecimientos (la muestra) y la media
aritmética de las observaciones puede utilizarse como estimador del precio medio.
Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea
mejores propiedades que los restantes, como insesgadez, eficiencia, convergencia y robustez (consistencia).
El valor de un estimador proporciona lo que se denomina en estadística una estimación puntual del valor del
parámetro en estudio. En general, se suele preferir realizar una estimación mediante un intervalo, esto es, obtener
un intervalo [a,b] dentro del cual se espera esté el valor real del parámetro con un cierto nivel de confianza. Utilizar
un intervalo resulta más informativo, al proporcionar información sobre el posible error de estimación, asociado con
la amplitud de dicho intervalo. El nivel de confianza es la probabilidad de que a priori el verdadero valor del
parámetro quede contenido en el intervalo.
En la práctica, los intervalos suelen indicarse dando el valor del estimador puntual utilizado como centro del
intervalo y un valor que debe sumarse y restarse para obtener el límite superior e inferior; por ejemplo:
equivale a
se llama intervalo de confianza a un par de números entre los cuales se estima que estará cierto
valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números
determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es
un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se
denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de
significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal
intervalo.
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo
más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un
intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.
Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución
teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro presente una distribución
normal. También pueden construirse intervalos de confianza con la desigualdad de Chebyshov.
En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro
poblacional θ que sigue una determinada distribución de probabilidad, es una expresión del tipo
[θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.
De una población de media μ y desviación típica σ se pueden tomar muestras de n elementos. Cada una
de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias
muestrales coincide con la media poblacional:2
Pero además, si el tamaño de las muestras es lo suficientemente grande,3 la distribución de medias
muestrales es, prácticamente, una distribución normal (o gaussiana) con media μ y una desviación
típica dada por la siguiente expresión: . Esto se representa como sigue: . Si estandarizamos, se sigue
que:
En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un
determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] =
1 - α, donde (1 - α)·100 es el porcentaje deseado (véase el uso de las tablas en una distribución
normal).
Se desea obtener una expresión tal que
En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará
la media poblacional si sólo se conoce una media muestral ( ), con una confianza determinada.
Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamará 1
− α (debido a que α es el error que se cometerá, un término opuesto).
Para ello se necesita calcular el punto Xα / 2 —o, mejor dicho, su versión estandarizada Zα / 2 o valor
crítico— junto con su "opuesto en la distribución" X − α / 2. Estos puntos delimitan la probabilidad para
el intervalo, como se muestra en la siguiente imagen:
Dicho punto es el número tal que:
*http://html.rincondelvago.com/conceptos-y-muestreo.html*http://www.angelfire.com/sc/matasc/EyD/bioesta/muestreo.htm*http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html*http://www.multilingualarchive.com/ma/enwiki/es/Sampling_distribution*http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html
La utilidad de muestreo y estimación abarca muchos campos tales como:1- Política: Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinión pública y el apoyo en las elecciones.
2- Educación: Las muestras de las calificaciones de los exámenes de estudiantes se usan
para determinar la eficiencia de una técnica o programa de enseñanza.
3- Industria: La muestras de los productos de una línea de ensamble sirve para controlar
la calidad.
4- Medicina: Las muestras de medidas de azúcar en la sangre de pacientes diabéticos
prueban la eficacia de una técnica o de un fármaco nuevo.
5- Agricultura: Las muestras del maíz cosechado en una parcela proyectan en
la producción los efectos de un fertilizante nuevo.
6- Gobierno: Una muestra de opiniones de los votantes se usaría para determinar los
criterios del público sobre cuestiones relacionadas con el bienestar y la seguridad nacional