Upload
jeff-guzman
View
223
Download
0
Embed Size (px)
Citation preview
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 1/54
PONTIFICIA UNIVERSIDAD CATOLICA MADRE Y MAESTRA
FACULTAD DE CIENCIAS DE LAS INGENIERIAS
DEPARTAMENTO DE INGENIERIA INDUSTRIAL
FOLLETO DE CLASE
ASIGNATURA:
Estadística I para ingenieros
PREPARADO POR:Juan F. Féliz Peña
Santiago de los caballeros
República Dominicana
2015
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 2/54
1
INDICE
Contenidos: Página 1. Definiciones de estadística. 4
2. Clasificación de la estadística.2.1 Estadística descriptiva.2.2 Estadística inferencial.
444
3. Variables.3.1 Variable cualitativa.3.2 Variable cuantitativa.
555
4. Tipos de población.4.1 Población grande.
4.2 Población pequeña.
55
5
5. Algunas simbologías a usar en estadística. 6
6. Recopilación de información.6.1 Censo.6.2 Muestreo.
666
7. Tipos de muestreos 7
8. Muestreo aleatorio simple. 7
9. Muestreo estratificado. 7
10. Muestreo sistemático. 8
11. Muestreo por conglomerados. 8
10. Gráficos estadísticos.10.1 Gráfico lineal.10.2 Gráfico de barras.10.3 Gráfico circular o de pastel.
89
1010
11. Distribución de frecuencia.11.1 Datos cualitativos.11.2 Datos cuantitativos.11.3 Frecuencia absoluta.
11111111
12. Tabla de frecuencia o distribución de frecuencia. 12
13. Intervalos de clase. 12
14. Pasos para construir una tabla de frecuencia para
Datos cuantitativos.
12
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 3/54
2
INDICE
Contenidos: Página
15. Representación gráfica de las distribuciones dede frecuencia.15.1 Histograma.15.2 Polígono de frecuencia.15.3 Ojiva.
14
141516
16. Distribución de frecuencia para datos cualitativos. 16
17. Medidas de tendencia central. 17
18. Medidas de tendencia central para no agrupados. 17
19. Medidas de tendencia central para datos agrupados. 19
20. Medidas de variabilidad o dispersión. 21
21. Medidas de dispersión para datos no agrupados. 21
22. Medidas de dispersión para datos agrupados. 23
23. Cuartiles. 24
24. Coeficiente de variación. 24
25. Coeficiente de sesgo. 24
26. Coeficiente de curtosis. 26
27. Media de medias. 28
28. Características de las medidas de tendencia central. 29
29. Características de las medidas de dispersión. 30
30. Probabilidad. 32
31. Experimento probabilístico. 32
32. Eventos mutuamente excluyentes. 32
33. Definiciones de probabilidad. 33
34. Eventos independientes. 34
35. Leyes elementales de la probabilidad. 34
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 4/54
3
INDICE
Contenidos: Página
36. Eventos conjuntos. 35
37. Diagrama de árbol. 36
38. Probabilidad condicional. 36
39. Teorema de Bayes. 37
40. Muestras ordenadas sin repetición. 37
41. Permutación con repetición. 37
42. Muestras no ordenadas sin repetición. 38
43. Distribución de probabilidad empírica. 38
44. Aplicación del valor esperado a cálculos de costo. 40
45. Distribución de probabilidad empírica continua. 41
46. Distribución de probabilidad teórica. 41
47. Distribución binomial. 42
48. Distribución multinomial. 43
49. Distribución hipergeométrica.49.1 Distribución hipergeométrica multivariada
4445
50. Distribución geométrica. 45
51. Distribución poisson. 46
52. Aproximación de la distribución poisson a la binomial 48
53. Distribución normal. 48
54. Distribución uniforme. 50
55. Distribución exponencial. 51
56. Distribución T o T-student.. 52
57. Distribución Chi-cuadrada. 52
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 5/54
4
Definiciones de estadística:
1- Es la ciencia, pura y aplicada, que crea, desarrolla y aplica técnicas de
modo que pueda evaluarse la incertidumbre derivada de inferencias
inductivas.
2- Campo de la ciencia que se encarga de la recopilación, organización,
presentación, análisis e interpretación de los datos o información.
3- Es el campo de la ciencia que trata de la recolección, presentación,
análisis y uso de los datos para tomar decisiones, solucionar problemas y
diseñar productos y procesos.
Clasificación de la estadística.
I- Estadística descriptiva. Esta parte de la estadística trata del resumen
y descripción de los datos. Dicho resumen puede ser tabular, gráfico o
numérico. El análisis se limita en sí mismo a los datos coleccionados y no
se realiza inferencia alguna o generalizaciones acerca de la totalidad
(población) de donde provienen esas observaciones.
II- Estadística inferencial. Esta parte se utiliza para hacer predicciones
acerca de un todo (población) o tomar decisiones basándose en la
información contenida en una muestra.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 6/54
5
Variables.
Variable. Es una característica que puede asumir cualquier valor; las
variables pueden ser cuantitativas o cualitativas.
Cualitativa
Variable Discreta
Cuantitativa
Continua
Variable cualitativa. Una variable es cualitativa cuando no es medible,
pero puede ser numerable. Tales como nivel educativo, estatus social,
entre otras.
Variable cuantitativa. Es aquella que asume valores acompañados
por una unidad de medida. Pueden ser discretas o continuas; es
cuantitativa continua cuando admite decimales y es cuantitativa discreta
cuando no admite decimales. Ejemplo: peso, estatura.
Tipos de poblaciones.
Población pequeña (población finita). Está compuesta o constituida por
una cantidad limitada o determinada de elementos.
Población grande (población infinita). Está compuesta por una
cantidad ilimitada o indeterminada de elementos.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 7/54
6
Algunas de las simbologías que se usan en estadística.
N : Tamaño de la población.
n : Tamaño de la muestra.
Si n ≥ 10% N, entonces el tamaño de la muestra se considera como
grande.
Si n ≥≥≥≥ 30, el tamaño de la muestra es grande.
Recopilación de información o datos.
La recopilación de datos o información puede efectuarse a través de
censos o muestreos.
Censo.
Es la recopilación de datos de una población “completa”. Se
recomiendan:
1- En poblaciones pequeñas.
2- Cuando no hay limitaciones de recursos.
3- Cuando la prueba no es destructiva.
Muestreo.
Es la recopilación de datos de una parte de la población mediante la cual
se emiten conclusiones de la población total. Se recomiendan:
1- En poblaciones grandes o pequeñas.
2- Cuando hay limitaciones de recursos.
3- Cuando la prueba es destructiva.
4- Cuando la prueba es muy monótona.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 8/54
7
Tipos de muestreos.
1- Muestreo aleatorio simple.
2- Muestreo aleatorio estratificado.
3- Muestreo aleatorio sistemático.
4- Muestreo aleatorio por conglomerados o áreas.
Muestreo aleatorio simple.
Es aquel en que cada elemento de la población tiene la misma
probabilidad de ser seleccionado en la muestra. Se recomienda:
1- En poblaciones homogéneas.
2- Para poblaciones pequeñas.
3- Cuando se tiene algún listado, una base de datos o un conocimiento
muy específico acerca de los elementos que constituyen la población.
Muestreo aleatorio estratificado.
Se utiliza en poblaciones heterogéneas, la cual se pueda subdividir por
categorías o estratos homogéneos entre sí. Dicho muestreo puede ser
proporcional o no proporcional. El muestreo es proporcional si cada estrato
aparece en la muestra en la misma proporción que se encuentra en la población;
el muestreo es no proporcional si no guarda dicha relación. Se recomienda:
1- En poblaciones heterogéneas.2- En poblaciones pequeñas.
3- Conocer la composición de la población, categorías o estratos, cantidad de
elementos en cada una.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 9/54
8
Muestreo aleatorio sistemático.
El muestreo sistemático es aquel en el cual cada k-ésimo se selecciona de
una lista que representa una población o un estrato de la población. El
primer elemento se escoge al azar de los primeros K elementos. Se utiliza
en poblaciones moderadamente homogéneas y pequeñas. El muestreo
sistemático asegura que los elementos muestreados se esparcirán de
manera uniforme en la población.
K = N / n.
Muestreo aleatorio por conglomerados.
Es el procedimiento por el cual la población se divide en varios grupos o
conglomerados. Luego se extraen muchos de esos conglomerados para
formar la muestra, y se selecciona una submuestra (posiblemente 100%)
de elementos componentes de cada uno de los conglomerados
especificados. En este tipo de muestreo se pueden combinar el muestreo
aleatorio estratificado y/o el aleatorio simple. Este muestreo por lo general
se realiza en varias etapas, se denomina bietápico si se efectúa en dosetapas y si se realiza en más de dos etapas se le llama multietápico.
Gráficos estadísticos.
Una forma de presentar los datos, bien sea recopilados mediante censo o
muestreo, son los gráficos estadísticos. Su objetivo principal es
provocar un impacto visual en los usuarios. Se recomiendan cuando
se desea obtener conclusiones rápidas, siempre y cuando la precisión
numérica no sea de extrema importancia.
Un gráfico estadístico está compuesto por tres partes o elementos:
1- Título. Este debe responder a las preguntas ¿qué?, ¿cómo?,
¿cuándo? Y ¿dónde?
¿Qué? Lo que se está representando en el gráfico.
¿Cómo? En que unidades están expresados los datos.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 10/54
9
¿Cuándo? La fecha a la que corresponde la información.
¿Dónde? El lugar de procedencia de la información.
2- Cuerpo del gráfico. Es el esqueleto o gráfico en sí.
3- La fuente. De dónde se obtuvieron los datos o informaciones.
Clasificación de los gráficos estadísticos:
Gráfico lineal.
Se utiliza para variables cuantitativas, generalmente continuas, en él se
pueden representar una o más variables. En un sistema de coordenadas
cartesianas los puntos “x, y” se unen por segmentos de recta. A cada
variable “x” le corresponde un valor a una altura “y”. Pueden ser simples o
compuestos.
Variación en los vólumenes de ventas de unidades de cigarros
de la empresa "La Aurora" para el periodo del 2002 - 2004.
0
2000000
4000000
6000000
8000000
10000000
12000000
14000000
2002 2003 2004
Local
Extranjero
Fuente: La Aurora, Santiago. República Dominicana.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 11/54
10
Gráfico de barras.
Está formado por una serie de rectángulos en el cual el ancho de la base
es arbitrario, pero la altura es proporcional al valor de la variable que se
quiere representar. Pueden ser simples, compuestos, verticales u
horizontales.
horizontales.
Los doce países con los Índice de Desarrollo Humano más altos en el año 2014
0.944
0.933
0.917
0.915
0.914
0.911
0.910
0.902
0.901
0.900
0.899
0.898
0.870 0.880 0.890 0.900 0.910 0.920 0.930 0.940 0.950
Noruega
Australia
Suiza
Países Bajos
Estados Unidos
Alemania
Nueva Zelanda
Canadá
Singapur
Dinamarca
Irlanda
Suecia
Fuente: informe de Desarrollo Humano 2014 (ONU)
Gráfico circular.
Se utiliza cuando nos interesa resaltar la proporción (porcentaje) en queaparece una característica o atributo respecto al total. Para construir el
diagrama circular partimos del hecho de que un círculo encierra un total de
360 grados, luego repartimos los 360° en distintos sectores circulares de
acuerdo con cada porcentaje.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 12/54
11
Distribución porcentual del nivel escolar de los empleados y trabajadores
de la "ABC Electronic Industries Inc." para el año 2006.
Básico
13%
Medio
37%Superior
29%
Tecnología
13%
Licenciatura3%
Con postgrado
5%
Fuente: Departamento de Recursos Humanos, ABC Electronic Industries Inc.
Distribución de frecuencia.
Es un arreglo ordenado para hacer más comprensible un conjunto de
observaciones y para que adquieran significado. Al agrupar los datos se
logra una mayor síntesis, los datos pueden ser cuantitativos y cualitativos.
Datos cuantitativos. Son aquellos cuya determinación está asociada a
una unidad de medida.
Datos cualitativos. Son aquellos que se refieren a atributos o
características no medibles; tales como gusto, sabor, religión, entre otras.
Frecuencia absoluta (fi). Es el número de veces que se repite un dato
particular o fenómeno.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 13/54
12
Tabla de frecuencia o distribución de frecuencia.
Es un arreglo de las frecuencias con que ocurre cada característica en
que se han dividido los datos. Esta característica puede estar
determinada por una cualidad o un intervalo, llamado intervalo de clase.
La tabla de frecuencia también es conocida con el nombre de distribución
de frecuencia. Cuando hacemos un resumen de este tipo se obtiene una
mayor aproximación en la identificación de las características
sobresalientes de los datos, pero se pierde información por el proceso
llamado condensación.
Intervalos de clase.
Es cada uno de los intervalos en que se ha decidido agrupar parcialmente
los datos con el propósito de hacer un resumen de ellos. El número de
mediciones que quedan dentro del intervalo se llama frecuencia del
intervalo y se denota fi. La diferencia entre extremo mayor y el extremo
menor de un intervalo se llama longitud o ancho del intervalo.
Pasos para construir una tabla de frecuencia para datos
cuantitativos:
1- Verificar que el conjunto posee 20 ó más observaciones.
2- El número de intervalo debe escogerse de acuerdo con el número de
datos del conjunto. El número K de intervalo que se aconseja, pero no
siempre resulta adecuado, tomar de acuerdo con el número de datos es el
dado por la fórmula de Sturges (Si n < 500):
K = 1 + (3.322 * log n)
5≤ K ≤ 15
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 14/54
13
3- Una vez escogido el valor K de intervalos, se determina la longitud L
que deben tener los intervalos.
L = (DM – Dm) / K = R / K
R = DM – Dm
El número resultante de la diferencia entre el dato mayor y el dato menor
se llama amplitud o rango. El valor de la longitud se toma con un grado de
aproximación no mayor a aquel con el que se registran los datos.
Redondear L al impar más próximo (más cercano).
4- El primer intervalo debe contener o incluir al menor de los datos y el
último intervalo al dato mayor.
LSi = LIi + L – ∆
LSu = LS1 + (L * Km)
Frecuencia acumulada (Fi). Es aquella que totaliza las frecuencias
absolutas anteriores al intervalo deseado incluyendo a él mismo.
Fi = Fi-1 + fi = ∑fi
Frecuencia relativa absoluta (fri). Es el cociente entre cada frecuencia
absoluta y el número total de observaciones (datos), puede expresarse en
decimal o porcentaje.
fri = fi / n
Frecuencia relativa acumulada (FRi). Es el cociente entre cada
frecuencia acumulada y el número total de datos, puede expresarse en
decimal o porcentaje.
FRi = FRi-1 + fri = ∑fri = Fi / n
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 15/54
14
Marca de clase (Xi).
Es un valor representativo de un intervalo de clase, cuya magnitud
coincide con el punto medio de dicho intervalo.
Xi = (LIi + LSi) / 2
Donde:
LIi : límite de clase inferior.
LSi : límite de clase superior.
Límites reales de clase (LR).
Es otra manera de expresar los intervalos de clase, su característica
principal consiste en que el límite real superior de un intervalo dado
coincide con el límite real inferior del intervalo siguiente.
LRSi = (LSi + LIi+1) / 2.
LRIi = LRSi – L.
Representaciones gráfica de las distribuciones de frecuencia.
Existen tres tipos de gráficos mediante los cuales podemos representar
una distribución de frecuencia. Tales gráficos son: histograma, polígono
de frecuencia y ojiva.
Histograma.
Es una sucesión de rectángulos construidos sobre un sistema de
coordenadas cartesianas de la manera siguiente:
1- Las bases de los rectángulos (límites reales) se localizan en el eje
horizontal. El ancho de las bases es igual a la longitud de los intervalos.
2- Las alturas de los rectángulos se registran sobre el eje vertical y
corresponden a las frecuencias de las clases.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 16/54
15
Las áreas de los rectángulos son proporcionales a las frecuencias de las
clases. Los histogramas se pueden construir con las frecuencias
absolutas, las acumuladas, las relativas absolutas o las relativas
acumuladas. Pero normalmente se construye con las frecuencias
absolutas.
Distribución de las calificaciones de estudiantes de ingeniería en Estadística I para ingenieros
5
8
16
21
15
7
3
0
5
10
15
20
25
1
50,5-57,5 57,5-64,5 64,5-71,5 71,5-78,5 78,5-85,5 85,5-92,5 92,5-99,5
Polígono de frecuencia.
Se construye sobre un sistema de coordenadas cartesianas al colocar
sobre cada marca de clase, localizada en el eje “X”, un punto a una altura
igual al valor de la frecuencia absoluta o relativa absoluta asociada a esa
clase; luego se unen dichos puntos por segmentos de recta.
Distribución de las calificaciones de estudiantes de ingeniería en Estadística I para ingenieros
5
8
16
21
15
7
3
0
2
4
6
8
10
12
14
16
18
20
22
52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 17/54
16
Ojiva.
Es un gráfico lineal en el que los puntos X, Y representan en el eje “X” los
límites reales superiores (LRSi) y en el eje “Y” las frecuencias acumuladas
en términos absolutas (Fi) o las relativas (FRi). Luego se unen los puntos
por una línea continua suavizada.
Distribución acumulada de las calificaciones de estudiantes de ingeniería en Estadística I para ingenieros
5
13
29
50
65
72
75
0
10
20
30
40
50
60
70
80
56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100
Distribución de frecuencia para datos cualitativos.
La construcción de una tabla de frecuencia para datos cualitativos
requiere sólo del conteo del número de elementos o individuos que caen
dentro de cierta clase o tienen determinadas características. La
distribución se construye de la manera siguiente:
1- En la primera columna se anotan las cualidades o características.
2- En la segunda columna se registran las frecuencias absolutas.
3- En la tercera columna se registran las frecuencias relativas absolutas.
En una distribución de frecuencia para datos cualitativos no existen
intervalos de clase, ni frecuencia acumulada por carecer éstos de sentido.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 18/54
17
Medidas de tendencia central.
Consiste en un valor único que representa a un conjunto de datos, el cual
tiende a localizarse en la posición media de dicho conjunto cuando éste ha
sido ordenado según su magnitud, generalmente en forma descendente.
Su principal ventaja consiste en que resume en un solo dato un conjunto
completo. Las medidas de tendencia central se harán acompañar por una
medida de dispersión la cual indicará que tan eficiente es la medida de
tendencia central como valor representativo de conjunto, es decir mide el
grado en el que los diferentes elementos del conjunto difieren de la
medida de tendencia central.
Algunas medidas de tendencia central.
Media aritmética.
Mediana.
Moda.
Media ponderada.
Medidas de tendencia central para datos no agrupados (datos
sueltos):
Media aritmética.
La media para un conjunto de datos sueltos representa el centro físico del
conjunto de datos, y se define como la suma de los valores observados
dividida entre el total de observaciones.
X = ∑∑∑∑xi . n
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 19/54
18
Mediana.
Es el valor que divide el conjunto de observaciones ordenadas respecto a
su magnitud, de tal manera que el número de datos por encima de la
mediana sea igual al número de observaciones por debajo de la misma.
∼∼∼∼ Xp = (n + 1) / 2
∧∧∧∧ Moda (X).
La moda es el valor o fenómeno que se repite con mayor frecuencia.
Media ponderada.
Se utiliza cuando se quiere destacar las diferencias que existen entre un
dato y otro para lo cual se utiliza un factor de ponderación o peso que
suele ser un valor cualquiera, pero con cierta lógica. A mayor coeficiente
de ponderación más relevante o importante es el dato asociado.
X = ∑∑∑∑(xi . wi)
∑∑∑∑wi
Wi: factor de peso o de ponderación.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 20/54
19
Medidas de tendencia central para datos agrupados.
Media muestral.
Cuando se trata de datos agrupados la media se calcula como sigue:
X = ∑∑∑∑(fi . xi )∑∑∑∑fi
Mediana.
Para datos agrupados la mediana se obtiene mediante interpolación. Esta
interpolación se basa en el supuesto de que los datos en cada intervalo
están igualmente distribuidos. La mediana está dada por:
∼
X = Lm + [[[[(n/2) – FA)]]]] . Lfm
Donde:
Lm: límite real inferior de la clase mediana.
n: número de datos observados.
FA: frecuencia acumulada anterior a la de la clase mediana.
fm: frecuencia absoluta de la clase mediana.
L: longitud del intervalo de la clase mediana.
Clase mediana: Es el entero menor tal que
C. med. ≥≥≥≥ n/2.
Nota. Cuando la clase mediana está contenida en el primer intervalo la
mediana tendrá como valor la marca de clase.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 21/54
20
Moda.
Cuando se trata de datos agrupados, para calcular la moda debemos
determinar antes que todo la clase modal en la cual se encuentra ésta.
Dicha clase modal corresponde a aquella que presente la mayor
frecuencia absoluta. La moda está dada por:
∧
1- X = Lm + ∆1 * L
∆1 + ∆2
∧
2- X = Lm + ∆1 * L * a
∆1 + ∆2
Donde:
Lm: límite real inferior de la clase modal
∆1: diferencia entre la frecuencia absoluta de la clase modal y la de la
clase anterior.
∆2: diferencia entre la frecuencia absoluta de la clase modal y la siguiente.
L: longitud del intervalo de la clase modal.
a: número de intervalos modales consecutivos.
Notas:
1- Cuando la clase modal está contenida en el primero o el último de los
intervalos, la moda tendrá como valor la marca de clase de dicho intervalo,
respectivamente.
2- Si deseamos obtener dos valores o más para la moda en vez de uno
como resulta al aplicar la fórmula (Fórmula 2), se eligen las marcas de
clase de los intervalos modales consecutivos como valores de las modas.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 22/54
21
Medidas de dispersión o variabilidad.
Una medida de variabilidad es un número que nos indica el grado de
dispersión en un conjunto de datos. Si este valor es pequeño, con
respecto a la unidad de medida (MTC), entonces existe una gran
uniformidad entre los datos. Por el contrario un gran valor nos indica poca
uniformidad; cuando es cero significa que todos los valores observados
son iguales.
Algunas medidas de dispersión.
Rango.Desviación media.
Desviación estándar.
Varianza.
Medidas de dispersión para datos no agrupados.
Rango.
Para datos no agrupados o discretos el rango se toma como la diferencia
entre el valor máximo y el valor mínimo de los datos observados.
R = XM – Xm.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 23/54
22
Desviación media.
Es la media aritmética de los valores absolutos de las desviaciones de las
mediciones del conjunto respecto a la media o la mediana. Pero su forma
general es respecto a la media.
DM = ∑(xi - x)n
DM = ∑(xi - x)n
Desviación estándar.
Es la medida de variabilidad de mayor uso. La desviación estándar para
datos sueltos está dada por:
S = √∑(xi – x)2 /n – 1
σ = √∑(xi – µ)2 /N
Varianza.
Para datos no agrupados la varianza se determina por medio de la
fórmula:
S2 = ∑(xi – x)2 /n – 1
σ2 = ∑(xi – µ)2 /N
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 24/54
23
Medidas de variabilidad para datos agrupados.
Rango.
Cuando se trata de datos agrupados el rango se toma como la diferencia
entre el límite superior de la última clase y el límite inferior de la primera
clase.
R = LSu – LI1
Desviación media.
Para datos agrupados la desviación media viene dada por:
DM = ∑[fi *xi – x ] ∑fi
Desviación estándar.
Para datos agrupados la desviación estándar se expresa como:
S = √∑[fi(xi – x)2] / ∑fi
Varianza.
Para datos agrupados la varianza está dada por:
S2 = ∑[fi(xi – x)2] / ∑fi
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 25/54
24
Cuartiles.
Cuando un conjunto de datos se divide en cuartas partes, a los puntos de
división resultante se les llama los cuartiles de la muestra. El primer
cuartil, Q1, es un valor que tiene una cuarta parte, o 25% de las
observaciones menores que él.
Para datos no agrupados.
Q1P ≤ 25% de n.
Q2P ≤ 50% de n.
Q3P ≤ 75% de n.
El nonagésimo quinto percentil (P0.95).
P0.95 ≤ 95% de n.
Para datos agrupados.
Q1 = Lm + (n/4) – FA * Lfm
Q3 = Lm + (3/4 n) – FA * Lfm
Coeficiente de variación.
Es una variable que se utiliza para determinar el grado de homogeneidad
de un conjunto de datos. Su aplicación fundamental consiste en comparar
dos o más conjuntos para determinar cual de ellos es más homogéneo. A
menor coeficiente de variación mayor homogeneidad tiene el
conjunto de datos.
CV = S * 100X
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 26/54
25
Coeficiente de sesgo.
Es una medida de asimetría de un conjunto de datos. La asimetría se
calcula tomando como referencia la media de un conjunto de datos. Una
distribución es simétrica cuando su sesgo es igual a cero, en cuyo caso la
media, la mediana y la moda coinciden y su forma es como sigue:
x = x = x
Una distribución está sesgada hacia la izquierda si sesgo es negativo y
está sesgada hacia la derecha si sesgo es positivo.
x > x > x
Asimetría hacia la derecha. Sesgo positivo.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 27/54
26
x > x > x
Asimetría hacia la izquierda. Sesgo negativo.
Para datos no agrupados el coeficiente de sesgo viene dado por:
∼ C. S = (3) (x – x) / S
Para datos agrupados el coeficiente de sesgo está dado por:
C.S = ∑[fi(xi – x)3]
(∑fi) . S3
Coeficiente de curtosis.
Mide el grado de concentración de los valores del conjunto alrededor de la
media. Es un número cuya magnitud nos indica la forma como sedistribuyen los datos:
a) en forma normal: Curva mesocúrtica.
b) más elevados de lo normal: Curva leptocúrtica.
c) más aplanados de lo normal: Curva platicúrtica.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 28/54
27
Curva mesocúrtica
K = 3
Curva platicúrtica.
K < 3
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 29/54
28
Curva leptocúrtica.
K > 3
El coeficiente de curtosis se denota y se expresa como sigue:
K = ∑(xi – x)4 Para datos no agrupados.n * S
4
K = ∑[fi(Xi – X)4] Para datos agrupados.
(∑fi) * S4
Media de medias.
Consiste en determinar la media global o total de un conjunto de medias.
Para datos sueltos o agrupados viene dada por:
X = ∑[fi . Xi] ∑fi
Donde:
fi: cantidades de valores de la media X i.
xi: valor de la media i.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 30/54
29
Características de la media.
1- La media está afectada por todos los valores del conjunto. Cuando
este es heterogéneo la media no es realmente representativa.
2- La suma de las desviaciones de los valores del conjunto respecto a la
media es cero.
3- La suma de las diferencias cuadráticas de los valores muestrales con
respecto a la media es mínima.
4- Si cada valor del conjunto se suma, resta, multiplica o divide por una
constante; la media o la nueva variable queda sumada, restada,
multiplicada o dividida por esa constante, respectivamente.
Característica de la mediana.
1- Para calcular la mediana no se toman en cuenta los valores extremos,
por lo que un cambio sustancial en ellos no en su frecuencia no altera el
valor de la mediana.
2- La suma de las desviaciones de los valores del conjunto respecto a la
mediana y tomadas en sentido absoluto es mínima.
Característica de la moda.1- La moda de un conjunto de datos agrupados puede variar según la
distribución que se hagan con los mismos.
2- Una variación en uno de los datos puede hacer variar la moda, lo que la
hace demasiado sensible y poco útil.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 31/54
30
Usos de las medidas de tendencia central.
La media es la más utilizada de las tres medidas de tendencia central. Se
recomienda en distribuciones simétricas basado en conjunto más o menos
homogéneos.
La moda se usará como medida de popularidad o cuando se desea
determinar el dato de mayor incidencia.
La mediana se recomienda para los casos en que la distribución de los
datos es asimétrica y además en el caso en que las distribuciones sean de
intervalos abiertos o semiabierto.
Característica del rango.
1- Sólo se basa en los valores extremos del conjunto, por lo que está
influenciado hasta tal punto que puede variar considerablemente al
cambiar uno de estos valores, por lo tanto no es una buena medida de
dispersión.
2- Es fácil de calcular por lo que en la práctica se prefiere a otras medidas
de dispersión.
3- A fin de asegurar su efectividad sólo se recomienda para conjuntos
pequeños. R ≤ 10.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 32/54
31
Característica de la desviación media.
1- Es buena medida de dispersión debido a que toma en cuenta todos y
cada uno de los valores del conjunto.
2- Mide el grado de dispersión respecto a una medida de tendencia central
que puede ser la media y/o la mediana, aunque su forma normal es
respecto a la media.
Característica de la desviación estándar.1- Es la más usada de las medidas de dispersión.
2- Es la mínima medida de dispersión en cuanto a desviaciones
cuadráticas se refiere.
3- Se basa en todos los valores del conjunto por lo que describe muy bien
la dispersión de los datos.
4- Si a todos los valores muestrales se les suma o se les resta un mismo
valor la desviación estándar no varía, no cambia.
5- Si a todos los valores muestrales se les multiplica o divide por una
constante la nueva desviación estándar quedará multiplicada o dividida
por el valor de dicha constante.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 33/54
32
Probabilidad.
Es el medio por el cual a partir de la información contenida en una
muestra tomamos decisiones o hacemos afirmaciones que se refieren a
toda una población mediante el proceso llamado inferencia estadística.
Es un valor entre cero (0) y uno (1) que se le asigna a un fenómeno o
evento para indicar su posibilidad de ocurrir. Es cero si el evento nunca
ocurrirá, es uno si el evento ocurre con toda certeza, y es 0.50 si existe
igual posibilidad que el evento ocurra como que no ocurra.
Experimento probabilístico.Es un proceso o actividad que conduce a un resultado u observación.
Cada uno de los resultados de un experimento se denomina evento; al
conjunto que contiene todos los posibles resultados se le llama “espacio
muestral” y se representa por la letra S.
Las características que identifican un experimento probabilístico,
distinguiéndolo de cualquier otro tipo de experimento, son:
1- Se pueden enumerar todos los posibles resultados de dicho
experimento.
2- De ante mano se conoce el resultado que arrojará el experimento.
3- Existe un modelo matemático que describe el comportamiento del
experimento.
Eventos mutuamente excluyentes.
Dos o más eventos son mutuamente excluyentes si al ocurrir uno los
demás no pueden ocurrir. Dos o más eventos son exhaustivo si su unión
es igual al espacio muestral (S).
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 34/54
33
Definiciones de probabilidad:
1- Probabilidad clásica o a priori.
Si un experimento puede concluir de N maneras mutuamente excluyente eigualmente probables y m de estas N maneras poseen una característica
E, la probabilidad de E está dada por m/N. E se llama evento o suceso y
la probabilidad se denota IP(E).
IP(E) = mN
Nota. Cuando los eventos no son igualmente probables la definición deprobabilidad a priori no se cumple, en tales casos se aplicará el concepto
de frecuencia relativa o probabilidad subjetiva.
2- Frecuencia relativa.
Suponga que un experimento estadístico se repite un número grande de
veces, digamos n, y sea m el número de veces que un evento E ocurrió; la
probabilidad de E está dada por m/n.
IP(E) = mn
3- Probabilidad subjetiva.
Es un número índice, asignado por una persona y que representa el grado
de conocimiento que ésta tiene sobre el suceso particular considerado.
Otra persona, con otros conocimientos, podría asignar un número índice
distinto.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 35/54
34
Eventos independientes.
Dos o más eventos son independientes si la probabilidad de que uno
ocurra no depende de la ocurrencia de los demás; en caso contrario son
dependientes.
Propiedades elementales (leyes) de la probabilidad.
1- Si A es el evento, entonces la probabilidad de A representa un número
entre cero y uno.
0 ≤≤≤≤ IP(A) ≤≤≤≤ 1
2- Si S es el espacio muestral asociado a un experimento, entonces la
probabilidad de S es igual a uno.
IP(S) = 1
3- Si A es el evento vacío, entonces su probabilidad es cero.
IP( ) = 0
4- Si A es el evento y A’ su complemento, entonces la probabilidad de A’
es igual a uno (1) menos la probabilidad del evento A.
IP(A’) = 1 – IP(A)
5- Si A y B son eventos mutuamente excluyentes, la probabilidad de A o B
es igual a la suma de las probabilidades individuales.
IP(A ∪∪∪∪ B) = IP(A) + IP(B) Caso particular de la adición.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 36/54
35
6- Sean A y B dos eventos cualesquiera de un espacio muestral,
entonces:
i) IP(A ∪∪∪∪ B) = IP(A) + IP(B) – IP(A ∩∩∩∩ B) Ley general de la suma.
ii) IP(A ∪ B ∪ C) = IP(A) + IP(B) + IP(C) – IP(A ∩ B) – IP(A ∩ C) –
IP(B ∩ C) + IP(A ∩ B ∩ C) Caso ampliado.
7- Si A y B son dos eventos independientes, entonces la probabilidad de
A y B es igual a la multiplicación de sus probabilidades individuales.
IP(A ∩∩∩∩ B) = IP(A) * IP(B) Caso particular de la multiplicación.
8- Sean A y B dos eventos cualesquiera de un espacio muestral,
entonces:
i) IP(A ∩ B) = IP(A) * IP(B/A).
ii) IP(A ∩ B ∩ C) = IP(A) * IP(B/A) * IP(C/AB) Ley general de la
multiplicación.
Eventos conjuntos.
Dos o más eventos constituyen un evento conjunto si están todos a la vez
(intersección). Si A, B y C son tres eventos cualesquiera, el evento
conjunto de los tres será A ∩ B ∩ C.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 37/54
36
Probabilidad condicional.
Es cuando la probabilidad de un evento se halla sujeta a ciertas
condiciones. Si denotamos A el evento condicionado y B, el
condicionante; la probabilidad condicionada es IP(A/B).
IP(A/B) = IP(A∩∩∩∩B)IP(B)
Diagrama de árbol.
Es una representación gráfica de las diferentes posibilidades que pueden
ocurrir en una situación o problema dado.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 38/54
37
Teorema de Bayes.
Si A1, A2, ..., Ai son eventos mutuamente excluyentes de los cuales uno
debe ocurrir, entonces
IP(Aj/B) = IP(Aj) * IP(B/Aj)∑∑∑∑[[[[IP(Ai) * IP(B/Ai)]]]]
Para i = 1, 2, 3, ..., i.
Muestras ordenadas sin repetición.
Resultan cuando cada observación sólo se da una vez porque cada
unidad una vez observada no se retorna a la población y el orden en que
aparecen es importante. Este tipo de muestras se llama permutaciones.
NPn = N! . (N – n)!
Donde:
N: número de elementos distintos disponibles (población).
n: número de elementos distintos escogidos (muestra).
Permutación con repetición.
Cuando se presenta el caso de hacer permutaciones a partir de elementos
repetidos, la permutación está dada por
P(N, n1, n2, ..., nk) = N! . (n1!) (n2!) ... (nk!)
Donde:
N = ∑ni.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 39/54
38
Muestras no ordenadas sin repetición.
Se obtienen cuando cada observación sólo se da una vez porque cada
unidad una vez observada no se retorna a la población y el orden en que
aparecen no es importante. Este tipo de muestras se llama combinación.
NCn = N! . (N – n)! n!
Muestras ordenadas con repetición.
Resultan cuando cada observación se da más de una vez, porque cada
unidad una vez observada se retorna a la población y el orden en que
aparecen es importante.
Nn
Distribución de probabilidad empírica.
Variable aleatoria.
Es un número generalmente arbitrario con el que identificamos los
diferentes eventos de un espacio muestral que nos servirán para operar
matemáticamente con él. Las variables aleatorias pueden ser discretas o
continuas. Una distribución de probabilidad es un arreglo tabular en el
que se muestra los valores de las variables aleatorias y sus respectivas
probabilidades.
Procedimiento:
1- Listar todos los eventos posibles de un experimento estadístico.
2- Listar los valores de las variables aleatorias que corresponde a cada
evento.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 40/54
39
3- Asignar a cada evento el valor de la variable aleatoria y su
correspondiente probabilidad; IP(x) = f(x).
4- Determinar la suma de las probabilidades correspondiente al valor de
una misma variable aleatoria, a esta suma se le denomina f(x i).
5- El conjunto de pares ordenados X i, f(xi) constituye una distribución de
probabilidad que generalmente se expresa en forma tabular o mediante
una expresión matemática. Si la variable aleatoria es discreta, la
distribución de probabilidad se conoce como una distribución de
probabilidad discreta, y si es continua la distribución de probabilidad es
continua.
6- Verificar que la suma de los f(xi) sea igual a uno. ∑f(xi) = 1.
Distribución de probabilidad empírica acumulada.
Se identifica F(xi) a la suma parcial de las probabilidades de los diferentes
valores de las variables aleatoria.
Propiedades de la distribución de probabilidad empírica.
1- Valor esperado de una distribución de probabilidad. Su valor
esperado es igual a la media poblacional. E(x) = µ.
E(x) = ∑[ xi * f(xi)]
2- Varianza para una distribución de probabilidad. Su varianza es igual a
la varianza de la población. V(x) = σ2.
V(x) = ∑ [(xi - µ)2 * f(xi)]
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 41/54
40
Aplicación del valor esperado a cálculos de costo.
En la teoría de decisiones el valor esperado tiene múltiples aplicaciones
para calcular las ganancias o pérdidas esperadas de ciertas
negociaciones; lo cual servirá de base para la toma de decisiones. En
estas circunstancias la variable aleatoria suele expresarse en función de
costo (ganancia, pérdida, otra).
Distribución de probabilidad empírica continua.
∞
∫-∞ f(x) dx = 1
Donde:
X: expresión matemática.
f(x): función de densidad.
Propiedades:
1- Valor esperado.
∞
E(x) = ∫-∞ (x * f(x)) dx
2- Varianza.
∞
V(x) = ∫-∞ [(x – µ)2 * f(x)] dx
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 42/54
41
Distribución de probabilidad teórica.
Cuando se define un experimento estadístico una de sus características
consiste en la existencia de un modelo matemático que describe el
comportamiento del experimento. Una distribución de probabilidad teórica
consiste en la definición de un modelo matemático que describe un
experimento dado.
Existen distribuciones de probabilidad teórica discretas y continuas
dependiendo del tipo de variable aleatoria definida en el experimento.
1- Algunas distribuciones de probabilidad teórica discretas.a) Binomial.
b) Multinomial.
c) Hipergeométrica.
d) Geométrica.
e) Poisson.
2- Algunas distribuciones de probabilidad teórica continuas.
a) Normal.
b) Uniforme.
c) Exponencial.
d) T-student.
e) Chi cuadrada (Ji cuadrada).
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 43/54
42
Distribución Binomial.
Una gran cantidad de problemas estadísticos manejan situaciones que se
refieren a ensayos repetidos. En los juegos de azar se quiere conocer la
probabilidad de obtener x éxitos en n ensayos, es decir x éxitos y n–x
fracasos en n intentos.
La distribución Binomial se usará cuando:
1- Existen solamente dos posibles resultados en cada ensayo.
Arbitrariamente denominado éxito o fracaso, sin implicar ello que un éxito
sea necesariamente deseable.
2- La probabilidad de éxito es la misma en cada ensayo.
3- Hay n ensayos, donde n es constante.
4- Los ensayos son independientes.
f(x) = nCx * Px * q
n-x
Donde:
P: probabilidad de éxito (en la población).
q: probabilidad de fracaso (en la población).
x: número de éxitos en la muestra.
Propiedades de la distribución Binomial.
1- Su valor esperado es igual a n.P.
E(x) = n * P.
2- Su varianza es igual a nPq.
V(x) = n * P * q.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 44/54
43
Distribución Multinomial.
Una generalización inmediata a la distribución Binomial surge cuando
cada ensayo tiene más de dos posibles resultados. Esto ocurre, por
ejemplo, cuando un producto manufacturado es calificado como de
“primera”, de “segunda” o “malo”.
La distribución Multinomial se usará cuando:
1- Existen tres posibles resultados o más en cada ensayo.
2- La probabilidad de éxito es la misma en cada ensayo.
3- Los n ensayos son constantes.
4- Los ensayos son independientes.
f(x1, x2, ..., xk, P1, P2,..., Pk, n) = n! * (P1)x
1 * (P2)x
2 * (Pk)xk
(x1!) * (x2!) * (xk!)
Donde:
Pi: probabilidad de éxito correspondiente a cada posible resultado i.
xi: número de éxitos que se desean observar de cada posible resultado i.
n = ∑xi.
Propiedades de la distribución Multinomial.
1- El valor esperado es variable e igual a n.P i . Hay un valor esperado por
cada uno de los resultados. E(Xi) = n * Pi
2- La varianza también es variable e igual a n.P i.qi. Hay una varianza por
cada uno de los resultados. V(Xi) = n * Pi * qi.
3- El rango va desde cero hasta n.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 45/54
44
Distribución Hipergeométrica.
Si se desea conocer el número de elementos exitosos presentes en una
muestra aleatoria de n elementos o unidades extraídas de una población
que contiene un total de N elementos de los cuales k son los éxitos
deseados. Si la muestra es extraída en tal forma que, en cada extracción
sucesiva (sin reemplazo), cualquier elemento que haya quedado en la
población tenga la misma probabilidad de ser elegido, la probabilidad de
que en la primera extracción aparezca un elemento exitoso es k / N, pero
en la segunda extracción es k – 1 ó k ; dependiendo de que en la
N – 1 N – 1
primera extracción se haya obtenido o no un elemento exitoso. La
distribución Hipergeométrica se usará cuando:
1- Existe sólo dos posibles resultados en cada ensayo.
2- La probabilidad de éxito varía en cada ensayo.
3- Los n ensayos son constante.
4- Los ensayos son dependientes.
K N–kh(x, n, k, N) = x n–x
Nn
Donde:
N: tamaño de la población
k: número de éxitos en la población.
n: tamaño de la muestra.
x: número de éxitos deseados en la muestra.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 46/54
45
Propiedades de la distribución Hipergeométrica.
1- El valor esperado es igual a n . k.N
E(x) = n * k.N
2- La varianza es igual a n . k . (N – k) (N – nN2 (N – 1)
V(x) = n . k . (N – k) (N – n)N2
* (N – 1)
Distribución Hipergeométrica multivariada.Si N resultados pueden dividirse en las k celdas A1, A2, ..., Ak con
a1, a2, ..., ak elementos, respectivamente; entonces la distribución de
probabilidad de las variables aleatorias x1, x2, ..., xk que representan el
número de elementos seleccionados de A1, A2, ..., Ak en una muestra
aleatoria de tamaño n, es:
a1 a2 ak f(x1, x2, ..., xk, a1, a2, ..., ak; N, n) = x1 x2 ... xk .
Nn
Distribución Geométrica.
Si repetidos intentos independientes pueden resultar en un éxito con una
probabilidad p y un fracaso con una probabilidad q, y que los supuestos de
la distribución Binomial se cumplen excepto el tercero, es decir n no es
fijo, entonces la distribución de probabilidad de la variable aleatoria x, el
número del intento en el cual ocurre el primer éxito es:
G(x; p) = p * qx-1 ,
x = 1, 2, 3, ...
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 47/54
46
Propiedades de la distribución geométrica.
1- El valor esperado es igual 1/p.
E(x) = 1/p.
2- La varianza es igual a (1 – p)/p2.
V(x) = (1 – p)/p2.
Distribución Poisson.Esta distribución se aplica a numerosos procesos en los cuales ocurren
determinados sucesos por unidad (tiempo, volumen, espacio, área). Son
casos de este tipo:
a) Ingreso per-cápita.
b) Densidad poblacional.
c) Número de hijos por familia en una determinada ciudad.
Dado un intervalo de números reales, supóngase que el conteo de
ocurrencias es aleatorio en dicho intervalo. Si éste puede dividirse en
subintervalos suficientemente pequeños, tales que:
1. La probabilidad de más de una ocurrencia en el subintervalo es
cero.
2. La probabilidad de una ocurrencia en un subintervalo es la misma
para todos los subintervalos, y es proporcional a la longitud de
éstos.
3. El conteo de ocurrencias en cada subintervalo es independiente
del de los demás subintervalos.
Entonces el experimento aleatorio recibe el nombre de proceso Poisson.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 48/54
47
Si el número promedio de ocurrencias en el intervalo es λ > 0, la
variable aleatoria X que es igual al número de ocurrencias en el intervalo
tiene una distribución Poisson con parámetro λ, y la función de
probabilidad de X es
f(x) = λx* e
-λ X!
Propiedades de la distribución de Poisson.
1- El valor esperado de la distribución Poisson es igual a lambda.
E(x) = λ.
2- La varianza para la distribución Poisson también es igual a lambda.
V(x) = λ.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 49/54
48
Aproximación de la distribución de Poisson a la Binomial.
Cuando el tamaño de la muestra aleatoria (n) es relativamente grande y la
probabilidad de éxito (P) pequeña, las probabilidades binomiales a
menudo se aproximan por medio de la fórmula:
f(x) = λx * e-λ
x!
Si n ≥ 30 y np < 5, la distribución Binomial se sustituye por la distribución
Poisson con λ = n * P.
Distribución Normal.
Una variable aleatoria seguirá una distribución normal cuando:
1- La variable aleatoria es continua.
2- Su función de densidad de probabilidad f(x) viene dada por
f(x) = e -1/2((x – µ)/ σ)2
√2πσ
Donde µ es el valor esperado o promedio de la distribución normal. Una
distribución normal estará definida entonces cuando se conocen a µ y σ.
Propiedades de la distribución normal.1- Es simétrica con respecto a un eje localizado en x = µ.
2- Es asintótica con respecto al eje de las “x”.
3- La función f(x) tiene un valor máximo en x = µ. Es unimodal.
4- Tiene dos puntos de inflexión localizados en x = µ ± σ.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 50/54
49
5- De lo descrito anteriormente se deduce que la distribución normal
tiene forma de campana.
µ
6- Si x1, x2, x3, ... son variables aleatorias con distribución normal, x = ∑xi
también seguirá una distribución normal.
7- Si se comporta normalmente, entonces Z = (x – µ)/ σ también se
comportará según una distribución normal.
A Z se le conoce como variable normalizada o estandarizada y de suma
importancia.
8- Cuando se desea calcular la probabilidad de que x se encuentre entre
un rango dado, el procedimiento común sería integrar a f(x) en el rango
deseado. La solución por este método es extremadamente compleja, pero
existen tablas de distribución normal que facilitan el trabajo. El
procedimiento sería:
a) Graficar en una campana de Gauss el área deseada.
b) Estandarizar el o los valores de X.
c) Buscar en una tabla correspondiente las probabilidades.
9- Una función de densidad normal se dice que está estandarizada
cuando µ = 0 y σ = 1. Los valores que puede asumir Z serán positivos o
negativos.
Z = X – µµµµ
σσσσ
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 51/54
50
Aproximación de la distribución normal a la Binomial.
La distribución normal sirve para aproximar a la distribución Binomial si el
tamaño de la muestra aleatoria (n) es grande y la probabilidad de éxito (P)
relativamente alta.
Si n ≥ 30 y np > 5 la distribución Binomial se sustituye por la normal con
µ = n * P y σ = √n*P*q
Z = (x ±±±± ½) – µµµµ
σ
Distribución uniforme.
Una variable aleatoria seguirá una distribución uniforme si:
1- La variable aleatoria es continua.
2- Están definidos los extremos del intervalo (α, β) entre los cuales estará
comprendida la variable aleatoria X.
3- Su función de densidad de probabilidad es:
1/(β – α) α ≤ x ≤ β f(x) =
o De otra manera
4- Cada elemento tiene la misma probabilidad de ser seleccionado en
cada ensayo.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 52/54
51
Propiedades de la distribución uniforme.
1- El valor esperado es igual a (α + β)/2.
µ = (α + β)/2.
2- La varianza es igual a (β −α)2 /12.
σ2 = (β −α)2 /12.
Distribución Exponencial.
La variable aleatoria comprendida entre la ocurrencia de dos eventos o
sucesos poissionanos consecutivos se dice que sigue una distribución
exponencial negativa con función de densidad de probabilidad:
f(x) = e-αx
Donde:
α: es el inverso del valor esperado de X e igual al lambda (λ) de la
distribución de Poisson.
Propiedades de la distribución Exponencial.
1- Su valor esperado es igual 1/ α.
µ = 1/ α.
2- La varianza es igual a 1/ α2.
σ2 = 1/ α2.
3- Su rango va desde 0 hasta +∞.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 53/54
52
Distribución T-Student.
Una variable aleatoria seguirá una distribución T-student cuando:
1- La variable aleatoria es continua.
2- La distribución de la población es aproximadamente Normal.
3- No se conoce el valor de la desviación estándar poblacional (σ) y el
tamaño de la muestra aleatoria es pequeño (n < 30).
4- Una distribución T-student estará definida si se conocen a µ, S y n.
Distribución Chi cuadrada (Ji cuadrada).
La distribución Chi cuadrada se utiliza para varianzas, cuando la variable
aleatoria es cuantitativa continua y la distribución de la población es
aproximadamente normal. Si el tamaño de la muestra aleatoria es
pequeño (n < 30), entonces:
χ2 = (n – 1) * S2
σ2
υυυυ = n – 1.
Propiedades de la distribución Chi cuadrada:
1- Es asimétrica hacia la derecha.
2- Su rango va desde 0 hasta +∞.
7/21/2019 Estadistica 1-Folleto de Clase _2015
http://slidepdf.com/reader/full/estadistica-1-folleto-de-clase-2015 54/54
53
BIBLIOGRAFIA
Bonini, Charles P. y Spurr, William A. (1978). Toma de Decisiones en
Administración Mediante Métodos Estadísticos.
Editorial Limusa. Primera edición.
Chao, Lincoln. (1994). Estadística para las Ciencias Administrativas.
McGraw-Hill, inc. Tercera edición.
Devore, Jay L. (2012). Probabilidad y Estadística para ingeniería y
ciencias.
Cengage learning. Séptima edición.
Hays, William L. (1988). Statistics.
Holt, Rinehart and Winston, Inc. international edition. Fourth Edition.
Miller, Irwin; Freund, John y Johnson, Richard. (1997). Probabilidad yEstadística para ingenieros.
Prentice-Hall hispanoamericana, S.A. Quinta Edición.
Montgomery, Douglas C. y Runger, George C. (2001). Probabilidad y
Estadística.
McGeaw-Hill interamericana editors, S. A de C. V.
Walpole, Ronald E.; Myers, Raymond H.; Myers, Sharon L. y Ye, Keying
(2012). Probabilidad y Estadística para ingenieros.
Pearson. Novena Edición.