Est Ad is Tic A

Embed Size (px)

Citation preview

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

ESTADSTICA DESCRIPTIVAGUA METODOLGICA DE INGENIERIA EN ADMINISTRACION EN EMPRESAS TURISTICAS(PERODO OCTUBRE 2010- MARZO 2011)

DATOS DEL TUTORNombre del Tutor : Mauricio Garca Oquendo

Telfonos:

2990800 Ext 2245 Universidad Tecnolgica Equinoccial (Direccin del Sistema de Educacin a Distancia)

Direccin Electrnica: [email protected]

MAT. MAURICIO GARCIA

PAG

1

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

INDICE RESUMEN HOJA DE VIDA __________________________________________________ 4 IMPORTANCIA DE LA ESTADSTICA ________________________________________ 4 A. OBJETIVO GENERAL DE LA ASIGNATURA: _______________________________ 6 B. CONTENIDOS ___________________________________________________________ 7 PRIMER BIMESTRE ________________________________________________________ 8 UNIDAD I __________________________________________________________________ 8 C. CONTENIDOS ___________________________________________________________ 8 D. ASESORA DIDCTICA I _________________________________________________ 9 1. INTRODUCCIN ________________________________________________________ 10 2. CONSTRUCCIN DE INTERVALOS DE CLASE __________________________________ 11 3. HISTOGRAMAS ____________________________________________________________ 13 4. GRFICA DE DISTRIBUCIN ACUMULADA (OJIVAS) _______________________________ 18 5. DIAGRAMAS POR SECTORES. DIAGRAMA DE PASTEL (PIE) __________________________ 19 6. DIAGRAMA DE TALLO Y HOJA ________________________________________________ 23 7. REPRESENTACIN DE LAS DISTRIBUCIONES _____________________________________ 25 8. MEDIDAS DE CENTRALIZACIN ______________________________________________ 26 8.1 Media Aritmtica _________________________________________________________ 26 8.2 Mediana________________________________________________________________ 27 8.3 Moda __________________________________________________________________ 28 8.4 Medidas de Dispersin ____________________________________________________ 31 8.5 El coeficiente de variacin ________________________________________________ 32 8.6 Diagrama de Caja y Bigote _________________________________________________ 34 ACTIVIDADES DE APRENDIZAJE I _________________________________________ 37 UNIDAD II ________________________________________________________________ 42 INTRODUCCIN A LA PROBABILIDAD _____________________________________ 42 2.1 TEORA DE LAS PROBABILIDADES ____________________________________________ 43 2.2 PROPIEDADES DE LAS PROBABILIDADES _______________________________________ 43 2.3 COMBINACIONES _________________________________________________________ 49 2.4 PERMUTACIONES _________________________________________________________ 50 ACTIVIDADES DE APRENDIZAJE II ________________________________________ 51 A. TEORA DE PROBABILIDAD: COMBINACIONES Y PERMUTACIONES _____ 51 B. PROPIEDADES DE LAS PROBABILIDADES ________________________________ 52 C. TEOREMA DE BAYES ___________________________________________________ 53 SEGUNDO BIMESTRE _____________________________________________________ 55 UNIDAD III _______________________________________________________________ 55 II. DISTRIBUCIN DE PROBABILIDADES DISCRETAS Y CONTINUAS _________ 55

MAT. MAURICIO GARCIA

PAG

2

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

A. VARIABLES DISCRETAS ________________________________________________ 56 1. DISTRIBUCIN BINOMIAL____________________________________________________ 57 2. DISTRIBUCIN DE POISSON __________________________________________________ 59 3. DISTRIBUCIN HIPERGEOMTRICA ____________________________________________ 60 B. DISTRIBUCIONES CONTINUAS __________________________________________ 62 4. DISTRIBUCIN NORMAL ____________________________________________________ 62 ACTIVIDADES DE APRENDIZAJE III _______________________________________ 67 UNIDAD IV _______________________________________________________________ 70 IV. DISTRIBUCIONES DE MUESTREO _______________________________________ 71 ASESORA DIDCTICA IV _________________________________________________ 71 A. DISTRIBUCIN DE MUESTREO ___________________________________________ 71 B. TEOREMA DEL LMITE CENTRAL _________________________________________ 72 ACTIVIDADES DE APRENDIZAJE IV _______________________________________ 74 FORMA DE EVALUACIN _________________________________________________ 75 BIBLIOGRAFIA: __________________________________________________________ 89

MAT. MAURICIO GARCIA

PAG

3

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

RESUMEN HOJA DE VIDAEl tutor de esta materia se llama Mauricio Garca Oquendo, su profesin es Matemtico. En el sistema modalidad a distancia trabaja desde hace 8 aos, ha dictado las asignaturas de Matemtica Bsica, Matemtica Superior, Estadstica Descriptiva y Estadstica Inferencial varias veces en este lapso de tiempo. Durante siete aos fue Jefe del Departamento de Ciencias Exactas, de la Universidad Tecnolgica Equinoccial. Actualmente es el Subdirector del Sistema de Educacin a Distancia de la Universidad Tecnolgica Equinoccial. Tiene una experiencia de 20 aos en la Universidad Tecnolgica Equinoccial dictando las ctedras de Matemtica Bsica, Matemtica Superior, Estadstica Descriptiva, Estadstica Inferencial, Estadstica Matemtica, Probabilidad y Estadstica, Clculo Diferencial e Integral, lgebra Lineal, Clculo Aplicado, Estadstica Aplicada. Ha dictado por varias ocasiones las asignaturas de Matemticas Aplicadas y de Estadstica Aplicada, en la Maestra de Contabilidad y Auditora que ofrece la Universidad Tecnolgica Equinoccial. Maneja el programa estadstico computacional SPSS, existiendo varias versiones, la ltima versin 18, y potencia el uso de la hoja electrnica Excel. Trabaj por cerca de cinco aos en el Consejo Nacional de Ciencia y Tecnologa, como Tcnico IV en Ciencia y Tecnologa, en dicha dependencia, suscrito a la Vicepresidencia de la Repblica.

INFORMACIN DE LA ASIGNATURA Estamos seguros de que al finalizar este curso, el estudiante ser capaz de manejar los conceptos de Estadstica Descriptiva que le permitirn realizar posteriormente la toma de decisiones. IMPORTANCIA DE LA ESTADSTICA Histricamente el crecimiento y desarrollo de la estadstica moderna puede trazarse desde dos fenmenos separados: la necesidad del gobierno de obtener informacin sobre los ciudadanos y el desarrollo de las matemticas, de la teora de las probabilidades. A lo largo de la historia registrada se han recabado datos. Durante las civilizaciones egipcia, griega y romana, los datos se obtenan principalmente con fines de impuestos y reclutamiento militar. En la Edad Media, las instituciones eclesisticas a menudo mantenan registros de nacimientos, muertes y matrimonios. En Amrica se mantuvieron diversos registros y comenzando en 1790, la Constitucin de E.E.U.U requiri el levantamiento de censo cada diez aos. Actualmente estos datos se usan para muchos propsitos, incluyendo, prorrateo del Congreso y la asignacin para fondos del presupuesto nacional.

MAT. MAURICIO GARCIA

PAG

4

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

La complejidad de nuestro mundo, se hace ms difcil tomar decisiones informadas e inteligentes. Con frecuencia, estas decisiones se han de tomar con un conocimiento imperfecto de la situacin y un grado considerable de incertidumbre, sin embargo, las soluciones pertinentes son esenciales para nuestro bienestar e incluso para nuestra supervivencia. Estamos expuestos a la presin constante de problemas econmicos angustiosos, como una inflacin galopante, un sistema fiscal engorroso, oscilaciones excesivas del ciclo econmico, una deuda externa opresiva, un alto ndice de delincuencia, tipos de inters impredecibles. UTILIDAD PRCTICA DE LA MATERIA Casi todos los campos de la investigacin se pueden beneficiar del anlisis estadstico. Los responsables de la toma de decisiones sobre poltica econmica asesores del presidente y de otros cargos pblicos, tienen en la estadstica una herramienta muy til. nicamente con ayuda del anlisis estadstico pueden tomar decisiones inteligentes en relacin con los tipos tributarios, los programas de desarrollo social, los subsidios, los salarios y muchas cuestiones ms. Es fundamental tambin para los empresarios, en su bsqueda incansable del beneficio. Las actividades de control de calidad, minimizacin de costes, combinacin de productos y existencias, y multitud de otros aspectos empresariales se pueden gestionar con eficacia mediante procedimientos estadsticos contrastados. Otra de las aplicaciones de la estadstica, es en la investigacin de mercados, para determinar el grado de posicionamiento de un producto y determinar si tendr xito, as como tambin para asesores financieros que han de evaluar las oportunidades de inversin. Contadores, jefes departamentales, fabricantes utilizan tambin el anlisis estadstico y la medicina, se beneficia de esta disciplina. 1Las respuestas suelen ser muy evidentes una vez que se han hecho las preguntas correctas. El anlisis estadstico demostrar ser de gran utilidad en la formulacin adecuada de esas preguntas esenciales . En trminos de reas funcionales de negocios, la estadstica puede aplicarse en: Contabilidad

Seleccionar muestras con propsitos de auditora Para comprender los derroteros de costos en contabilidad de costosFinanzas

Para estar al tanto de medidas financieras en el transcurso del tiempo Para desarrollar formas de pronsticos de valores de estas medidas en momentos futurosAdministracin

Para describir caractersticas de empleados dentro de una organizacin Para mejorar la calidad de los productos o de los servicios procurados en la organizacin

1

Tomado del libro Estadstica aplicada a la Empresa y Economa de Allen Webster, 1998

MAT. MAURICIO GARCIA

PAG

5

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Mercadeo

Para estimar la proporcin de clientes que prefieren un producto en vez del otro y la razn deesto Para sacar conclusiones respecto a estrategias de publicidad que sera ms til para el incremento de ventas de un producto Los empresarios saben que los complejos problemas con que se enfrentan en el mundo de hoy exigen soluciones cuantitativas y que tienen que estar acompaadas de dichos datos para tomar decisiones en casi todas las disciplinas se exigen el empleo del razonamiento estadstico tales como en la economa, en la investigacin operativa, en las finanzas (los financieros aplican tcnicas estadsticas para hallar soluciones viables y realizar la toma de decisiones), marketing, ingenieros industriales. En el mercado actual de trabajo los empresarios se resisten a emplear o retener a analfabetos estadsticos. En sus aspiraciones profesionales se encaminan tanto a la industria privada como a la administracin. Se encontrarn respaldados si tienen fundamentos slidos de anlisis estadsticos. Algunos pueden creer que el tipo de trabajo que aspiran no exige el conocimiento del anlisis estadstico, se deber tener un mnimo de conocimientos en la formacin de este campo con la finalidad de disear soluciones adecuadas para la mejor toma de decisin. Una vez conocidos estos aspectos del anlisis estadstico se sorprender de las variadas formas de que ste puede ayudar a resolver conflictos que se producen en el mundo laboral. Dentro de pocos aos se dejar la seguridad relativa de nuestro entorno acadmico y se deber lanzar al mundo competitivo. El empresario esperar que el profesional que queremos formar para una empresa haga dos cosas: 1. Tomar decisiones. 2. Resolver problemas. Estos dos aspectos pueden llevarse a cabo siguiendo procedimientos estadsticos.

A. OBJETIVO GENERAL DE LA ASIGNATURA: Resolver problemas de recoleccin, organizacin, presentacin e interpretacin de datos numricos con la finalidad de realizar una toma de decisiones ms efectiva. Esto es: Manejar los conceptos estadsticos eficientemente. Disear cuestionarios eficientemente, con la mayor claridad posible. Procesar una encuesta realizada, con la ayuda de al menos un paquete estadstico computacional. Interpretar los resultados obtenidos de una encuesta para la mejor toma de decisiones.

MAT. MAURICIO GARCIA

PAG

6

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

B. CONTENIDOS I. RECOLECCIN DE DATOS

Al finalizar el presente captulo los estudiantes estarn en capacidad de:

Organizar datos originales en una distribucin de frecuencias. Organizar un conjunto de datos en una distribucin de frecuencias Construir los distintos diagramas y grficos estadsticos Determinar el mtodo ms eficiente para presentar un conjunto de datos Representar la distribucin de frecuencias en un histograma, o polgono de frecuencias acumuladas Desarrollar una representacin de tallo y hoja Calcular las medidas de centralizacin : la media aritmtica, la mediana, la moda. Explicar las desventajas y ventajas de cada una de las medidas de centralizacin. Identificar la posicin de la media aritmtica, la mediana y la moda, tanto para distribucionessimtricas como asimtricas o sesgadas

Explicar varias medidas de dispersin (rango, rango intercuartlico, desviacin media, desviacinestndar ) para datos agrupados y no agrupados

Calcular varias medidas de dispersin para datos agrupados y sin agruparII. INTRODUCCIN A LA PROBABILIDAD

Al finalizar el presente captulo los estudiantes estarn en capacidad de:

Utilizar las propiedades de las probabilidades para hallar determinada probabilidad Conocer los principios bsicos de la Probabilidad Distinguir entre eventos mutuamente excluyentes y no excluyentes Establecer la diferencia entre eventos dependientes e independientes Manejar las reglas de adicin y multiplicacin de probabilidades Aplicar el teorema de Bayes Distinguir entre Permutaciones y Combinaciones Determinar el nmero de posibles permutaciones y combinaciones.

MAT. MAURICIO GARCIA

PAG

7

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

III.

DISTRIBUCIN DE PROBABILIDADES DISCRETAS Y CONTINUAS

Al finalizar el presente captulo los estudiantes estarn en capacidad de: Definir una distribucin de probabilidad o probablistica Distinguir entre una distribucin probablistica discreta y una distribucin probabilstica continua Elaborar una distribucin binomial, una distribucin hipergeomtrica, una de Poisson, una Uniforme y una Exponencial Determinar que distribucin emplear en una situacin dada Explicar y aplicar la distribucin normal Usar la tabla de la curva normal Manejar el parmetro Z

IV.

DISTRIBUCIONES DE MUESTREO

Al finalizar el presente captulo los estudiantes estarn en capacidad de:

Explicar por qu en muchas situaciones una muestra es la nica forma posible de tener conocimientoacerca de una poblacin

Definir una distribucin de muestreo de medias muestrales Elaborar una distribucin de muestreo de medias muestrales Explicar el teorema del lmite central y su importancia en la inferencia estadstica. Describir las caractersticas, forma, propiedades de las distribuciones T de student, F de Fisher yChi- Cuadrado

Manejar las tablas de las distribuciones continuas T de student, F de Fisher y Chi- Cuadrado.PRIMER BIMESTRE UNIDAD I C. CONTENIDOS I. 1.1. RECOLECCIN DE DATOS Introduccin a la estadstica: Tipos de muestra Edicin, Codificacin Recoleccin de datos

MAT. MAURICIO GARCIA

PAG

8

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

1.2.

1.3. 1.4.

1.5. 1.6.

1.7.

Distribucin de frecuencias de una muestra: Clasificacin ordenada Tabulacin de datos Construccin de tablas de frecuencia: Nmero apropiado de agrupamientos de clase Representacin grfica de datos agrupados y sin agrupar: Histogramas Polgonos de frecuencia Diagrama de tallo y hojas Medidas de Tendencia Central: Media aritmtica, Mediana, Moda Medidas de dispersin y asimetra: Diagrama de Pareto Diagrama de caja y bigote Percentiles

D. ASESORA DIDCTICA I PREGUNTAS DE AUTOEVALUACION(Las respuestas estn al final del captulo) 1. La poblacin es el conjunto de todos los elementos en estudio a) Verdadero b) Falso 2. Para construir un polgono de frecuencia es necesario primero realizar un Histograma a) Verdadero b) Falso 3. Cuando se construye una tabla de frecuencias, el nmero de clases de intervalos depende del a) tamao de la muestra b) de que sean nmeros reales o enteros. 4. Una parte de la poblacin en estudio recibe el nombre de 5. Una grfica cuya distribucin es acumulativa recibe el nombre de 6. Indique con sus propias palabras la diferencia entre variables aleatorias continuas y discretas. Ponga un ejemplo de cada uno. 7. Se desea tomar una muestra de las opiniones del desempeo de los 130 asambleistas sobre la nueva constitucin. Indique a) cul es la muestra? b) Cul es la poblacin? 8. El valor que recibe ms frecuentemente se repite se conoce como mediana a) Verdadero b) Falso 9. Las medidas de dispersin de un conjunto de datos mide el punto central de stos. a) Verdadero b) Falso 10. Ordene los siguientes pasos para el clculo de la mediana de un conjunto de datos a) Obtener la media aritmtica de los valores centrales b) ordenar de menor a mayor los datos c) Ninguno de los anteriores. 11. Cul de las siguientes medidas son de centralizacin: a) mediana b) moda c) media d) todas las anteriores 12. Puede darse el caso de que la media aritmtica sea negativa a) Verdadero b) Falso. Porqu?

MAT. MAURICIO GARCIA

PAG

9

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

13. Puede darse el caso de que la desviacin tpica sea negativa a) Verdadero b) Falso. Porqu? 14. La diferencia entre el valor ms alto y ms bajo recibe el nombre de . 15. Bajo que condicin es ms confiable la mediana que la media en lo que respecta a sus datos a) por el tamao de la muestra b) por la gran dispersin que presenta la muestra c) por ser tener variables cualitativas

1. INTRODUCCION Definicin. FRECUENCIA ABSOLUTA O FRECUENCIA ( f) Representa el nmero de veces que ms frecuentemente aparece un valor determinado x del conjunto de datos, previamente deben ordenarse dicho conjunto de datos. Definicin. FRECUENCIA RELATIVA ( fr) Se obtiene dividiendo cada valor de la columna de la frecuencia por el tamao de muestra. Definicin. FRECUENCIA ACUMULADA (fa.) En esta columna van todos aquellos valores de X que corresponden a la frecuencia, y que se van acumulando o sumando con los valores anteriores Definicin. FRECUENCIA RELATIVA ACUMULADA (f.r.a) Se obtiene dividiendo cada valor de la frecuencia acumulada por el tamao de la muestra. Ejemplos. 1. Una de las preguntas realizadas en una encuesta a 36 personas, se refiere al nmero de telfonos mviles que ha tenido, y los resultados son los siguientes: 1 5 1 3 3 2 3 3 0 3 2 2 3 0 1 1 0 2 1 4 2 3 3 0 4 4 2 1 2 3 3 2 1 4 5 2

Determine la distribucin de frecuencias f, fr y fra, de los siguientes datos sin agrupar, pero antes, especifique el tipo de variable que se estudia. Solucin: La variable que se estudia es el nmero de telfonos que posee cada encuestado. A continuacin se tiene el siguiente cuadro de frecuencias, previamente ordenado dicho conjunto de datos:

MAT. MAURICIO GARCIA

PAG 10

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

NMERO DE TELEFONOS MOVILESFRECUENCIA RELATIVA ACUMULADA0,11 0,31 0,56 0,83 0,94 1,00

MUESTRA0 1 2 3 4 5

FRECUENCIA4 7 9 10 4 2

FRECUENCIA RELATIVA0,11 0,19 0,25 0,28 0,11 0,06

FRECUENCIA ACUMULADA4 11 20 30 34 36

TOTAL

36

1

Se puede observar claramente que existen 10 personas que manifestaron poseer hasta tres telfonos mviles, esto representa el 27.8%, adems el 83.35% de los encuestados indic que tuvieron entre 0 a 3 telfonos mviles. Los dems resultados se interpretan de manera anloga. Observaciones: a) Se puede indicar del ejercicio anterior que la suma de la columna de la frecuencia siempre deber ser igual a tamao de la muestra, a manera de comprobacin. b) Adems la suma de la columna de la frecuencia relativa, debe dar siempre uno. c) El ltimo valor de la frecuencia acumulada debe ser siempre igual al del tamao de la muestra d) El ltimo valor de la columna de la frecuencia relativa acumulada, siempre, debe ser de 1 o 100%. 2. Construccin de Intervalos de Clase En el caso que se deseen agrupar los datos, datos agrupados, existen varias maneras de elegir los lmites de clase. Indicaremos un conjunto de pasos para la eleccin del nmero de clases. Se decidir el nmero de clases que interesa, esto depender del nmero del tamao de la muestra. 1. Nmero recomendado de clases de acuerdo al tamao de la muestra,

Tamao de la Muestra Menos de 16 De 16 - 31 De 32 63 De 64 127

No de Clases Datos insuficientes 5 6 7

MAT. MAURICIO GARCIA

PAG 11

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

De 128 255 De 256 - 511 De 512 - 1023 De1024 - 2047 De 2048 - 4095 De 4096 - 8190

8 9 10 11 12 13

2. Se calcula el rango de los datos que es la diferencia entre el mximo y el mnimo. 3. Se divide el rango para el nmero de intervalos elegidos aproximndolo al entero

inmediatamente superior, llamado h. Luego se sugiere que si los datos son enteros, se deben disminuir 0.5 al valor mnimo y aumentar 0.5 al valor ms alto, con la finalidad de asegurar que todos los datos se encuentren en dichos intervalos. En caso de que los datos contengan un decimal, se sugiere disminuir al valor mnimo 0.05 y aumentar 0.05 al valor ms alto, y as sucesivamente. 4. Los lmites de cada clase restante, se obtienen al sumar el valor mnimo restado 0.5 con el valor de h y as sucesivamente hasta llegar al valor mximo sumado 0.5, claro est si el conjunto de datos es enteros.

Utilice los datos del ejemplo siguiente, para realizar una tabla de datos agrupados. 2. Los siguientes datos representan el nmero de horas semanal, trabajadas por 50 personas encuestadas. 35 40 39 38 31 31 38 48 39 38 38 34 47 36 38 31 32 45 44 43 40 36 48 39 40 47 39 38 43 35 40 45 33 39 36 38 34 46 47 34 40 42 40 42 41 38 44 40 40 42

MAT. MAURICIO GARCIA

PAG 12

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Para nuestro caso tenemos: que el valor superior es 48 y el valor inferior es 31, de acuerdo a los pasos anteriormente descritos, tenemos,(48 31) 6 2.83 3 . Por tanto se puede comenzar en 30.5 a 33.5,

luego de33.5 a 36.5, etc., disminuimos 0.5 en el primer valor, para asegurarnos de que ste se incluya, asimismo al ltimo valor le sumamos 0.5 con el mismo fin, adems debemos ir sumando tres en cada nuevo intervalo de clase, obteniendo:

Datos agrupados de las horas trabajadas sem analm ente Porc entaje valido 10,0 16,0 26,0 24,0 12,0 12,0 100, 0 Porc entaje acumulativo 10,0 26,0 52,0 76,0 88,0 100, 0

30.5 a 33.5 33.5 a 36.5 36.5 a 39.5 39.5 a 42.5 42.5 a 45.5 45.5 a 48.5 Total

Frequencia 5 8 13 12 6 6 50

Porc entaje 10,0 16,0 26,0 24,0 12,0 12,0 100, 0

Los comandos para transformar datos sin agrupar a datos agrupados son : TransformeRecodeInto Different VariableSe selecciona (Servicio) la lista de variables por ejemplo

En Output VariableSe escribe el nuevo nombre de la variable por ejemplo (horas1) Change Luego hacer clic en Old and New Values.... Recodificamos la variable con los siguientes intervalosEn Range hacemos clic Va el lmite inferior hasta luego lmite superior, va de 30.5 incluido el 33.5 por ejemplo, en New ValuePoner 1, luego lmite inferior 33.5 Through luego lmite superior 36.5 en New ValuePoner 2 y as sucesivamentecontinueOK 3. Histogramas Si se tiene un gran conjunto de datos, se puede utilizar los llamados histogramas, que son una representacin grfica de barras verticales u horizontales. Consiste en una serie de rectngulos que tienen su base en el eje horizontal con centros en las marcas de clase, de longitud de igual tamao y que son superficies proporcionales a las frecuencias de clase. Definicin: La marca de clase se obtiene sumando el lmite inferior y superior dividindolos por dos.

MAT. MAURICIO GARCIA

PAG 13

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Con slo observar la forma del histograma permite una idea de la familia de variables aleatorias a la cual pertenece la variable que se analiza. 3. Utilice los datos de la tabla de datos agrupados anteriormente, para realizar un Histograma, para lo cual tenemos:14 13 12

12

10

8

8

6 5 4

6

6

2 0 1,0 2,0 3,0 4,0 5,0 6,0

Datos agrupados de las horas trabajadas semanalmenteEn el SPSS se tiene: El comando sera: GraphsHistogra.... Variable (Servic4) OK

MAT. MAURICIO GARCIA

PAG 14

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL30

GUIA DE ESTADISTICA DESCRIPTIVA

26

20 18 14 10 10 8 18

Percent

6

0 1,00 2,00 3,00 4,00 5,00 6,00 7,00

VAR00001

Interpretacin: Se puede observar que el 26% de los departamentos pagan entre $160 a $ 180 mensualmente. AnalyzeDescriptive StatisticsExplorePlotsMarcar histogram y eliminar grfico de tallo y hojaOK

MAT. MAURICIO GARCIA

PAG 15

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

y luego el siguiente cuadro:

y se obtiene el mismo grfico anterior. Adems se puede graficar el polgono de frecuencia que consiste en unir los puntos medio de las bases de los rectngulos, obtenindose14

12

10

8

6

4 30.5-33.5

33.5-36.5

36.5-39.5

39.5-42.5

42.5-45.5

45.5-48.5

DATOS AGRUPADOS

MAT. MAURICIO GARCIA

PAG 16

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Para realizar el polgono de frecuencia en el SPSS tenemos: GraphsLine..

DefineCategoria (Servic4) OK

30

20

10

0 1,00

2,00

3,00

4,00

5,00

6,00

7,00

SERVICIO4

MAT. MAURICIO GARCIA

PAG 17

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

4. Grfica de Distribucin Acumulada (Ojivas) Se puede estar interesado en utilizar la distribucin de frecuencia acumulada de los datos. Para aproximar una funcin de distribucin acumulativa (fa), se puede usar la distribucin acumulativa de una variable aleatoria.

A partir de esta grfica se puede responder preguntas como: cul es el porcentaje aproximado de la variable en estudio durante las primeras n horas, n kilos, etc?., para lo cual se puede localizar dicho punto en el eje horizontal y proyectar una lnea horizontal hasta la ojiva y luego otra horizontal hasta el eje vertical. Pero tambin se puede preguntar el proceso inverso, es decir, qu tiempo o cantidad, etc, representa el punto medio en el sentido de que la mitad de la variable en estudio falla en dicho momento antes de llegar a l?

4. Cul es el porcentaje aproximado de horas trabajadas semanalmente durante las primeras 35 horas de trabajo, del ejercicio anterior?

Solucin: Al localizar el punto 35 en el eje horizontal y proyectar una lnea vertical hasta la ojiva y luego otra horizontal hasta el eje vertical como se ilustra en el grfico, el porcentaje que interesa es aproximadamente el 42%.

Adems qu tiempo representa el punto medio en el sentido de que la mitad de las horas trabajadas antes de llegar a 35 horas . Esta pregunta se contesta al localizar 0.5 ( o 50%) en el eje vertical e invertir el proceso, la respuesta es un poco ms de 38 horas.

MAT. MAURICIO GARCIA

PAG 18

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL120

GUIA DE ESTADISTICA DESCRIPTIVA

100

80

60

40

20

0 30.5 a 33.5 33.5 a 36.5 36.5 a 39.5 39.5 a 42.5 42.5 a 45.5 45.5 a 48.5

Horas trabajadas a la semana datos agrupados

5. Diagramas por Sectores. Diagrama de Pastel (Pie) Se utilizan para representar distribuciones de frecuencia de variables cualitativas. Se representan en un crculo cuyas porciones o sectores circulares tienen un rea proporcional a las frecuencias absolutas a las modalidades de la variable. Se lo obtiene el ngulo central alfa de la modalidad i-sima cuya frecuencia absoluta es ni, y puede expresarse como i = 360 fi. Otra forma habitual de construir grficos de sectores consiste en asignar al sector circular un porcentaje igual al tanto por ciento, que se puede expresar de la siguiente manera: pi = 100 fr. 5. Realice un diagrama de pastel para el siguiente conjunto de datos:

Pas de destino No. Hombres Espaa 49.5 Estados Unidos 21.9 Italia 7.4 Otros pases 13.9

MAT. MAURICIO GARCIA

PAG 19

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

y el resultado es:

Total de migrantes durante los ltimos cinco aos ( en porcentaje)

Otros 13,90 Italia 7,40 49,50 21,90 EEUU Espaa

Grafico 1

Para realizar el grfico en el SPSS, debemos tener en cuenta: 1. 2. Ingresar los datos esto es :

MAT. MAURICIO GARCIA

PAG 20

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Nos vamos a:

Luego

MAT. MAURICIO GARCIA

PAG 21

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

y luego tenemos:

y el resultado es:

Total de migrantes durante los ltimos cinco aos ( en porcentaje)

Otros 13,90 Italia 7,40 49,50 21,90 EEUU Espaa

Grafico 1

MAT. MAURICIO GARCIA

PAG 22

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

5. Diagrama de Tallo y Hoja El diagrama de tallo y hoja permite determinar la idea de cmo se comporta ese conjunto de datos, especialmente cuando el tamao de muestra es moderado. Existen varias formas de construir la distribucin de una variable aleatoria continua. Una de ellas es el diagrama de tallo y hoja creado por J. Tukey, el mismo que consta de una serie de filas horizontales de nmeros el cual tiene como rtulo un nmero llamado tallo, en tanto que los dems nmeros de las filas se llaman hojas. Existen distintas maneras de construir este tipo de diagramas, para su construccin se sugiere: 1. Tratar que el primer dgito o los dos primeros dgitos de la muestra sean los que trabajen como tallos. 2. Se escriben las filas con los tallos seleccionados. 3. Se reproduce grficamente el conjunto de datos mediante el registro del dgito que sigue al tallo como una hoja. 4. Para darse cuenta de la forma de la distribucin se acuesta la grfica sobre uno de sus lados. Cuando los conjuntos de datos son grandes o no existe mucha variabilidad en los datos se utilizan diagramas llamados de doble tallo y hoja, es decir, se trata de usar dos veces cada tallo. 6.. Los siguientes datos representan la cantidad de tiempo (en segundo) para llegar de 0 a 60 mph durante una prueba de caminos para una muestra de 22 modelos de automviles alemanes y una muestra de 30 modelos de automviles japoneses: a) Desarrolle la clasificacin ordenada b) Forme el diagrama de tallo y hoja. Automviles Alemanes 10 6.4 8.5 5.5 5.1 10.9 7.9 6.9 6.4 6 4.9 8.9 7.1 8.7 7.5 5.4 8.5 8.6 8.3 6.7 6.9 8.8

MAT. MAURICIO GARCIA

PAG 23

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Automviles japoneses 9.4 8.9 6.7 7.2 8.5 12.5

9.3 6.3 9.1 6.8 7.1

5.7 8.3 9.5 8 9.5

8.2 9.7 11.7 6.5 10.5

Solucin: Escogeremos a los nmeros enteros, como el tallo y los decimales como la hoja, casos como valores 6.3, 6.5, 6.7 y 6.8. Se escoge el nmero 6 como tallo y se agrupa a los decimales 3,5,7 y 8 como se muestra en la grfica . MODELO JAPONS FREC. TALLO & HOJA 1,00 4,00 2,00 5,00 6,00 1,00 1,00 1,00 5. 7 6 . 3578 7 . 12 8 . 02359 9 . 134557 10 . 5 11 . 7 12 . 5

MODELO AMERICANO FREC. TALLO & HOJA 1,00 3,00 6,00 3,00 7,00 ,00 2,00 4. 9 5 . 145 6 . 044799 7 . 159 8 . 3556789 9. 10 . 09

Interpretacin: De este diagrama de tallo y hojas se pueden sacar varias conclusiones:

MAT. MAURICIO GARCIA

PAG 24

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

1. El menor nmero de segundos que se demora para llegar de 0 a 60 millas por hora durante una prueba de caminos de un carro japons es de 5.7 segundos y el de mayor es de 12.5 segundos, en tanto el del americano es de 4.9 segundos y 10.9 segundos respectivamente. Siete carros japoneses se demoraron menos de 8 segundos en tanto 13 carros americanos se demoraron menos de 8 segundos. La mayor concentracin de autos que se demoraron es de entre 8 a 9 segundos para los japoneses, y los americanos de 8 segundos. Se observa tambin que 6 carros japoneses se demoraron entre 9.1 a 9.7 segundos en tanto existieron 7 carros americanos que se demoraron entre 8.3 y 8.9 segundos

En el SPSS, debemos hacer: AnalyzeDescriptive StatisticsExploreEscoger variablesPlotsstem and leafcontinueOK 7. Representacin de las Distribuciones Existen trminos especficos para mostrar diversos comportamientos de los datos, entre las que tenemos: a) Llamada curva normal ( o tambin campana de Gauss sombrero de guardin). Esta distribucin es la ms importante de las distribuciones, en Estadstica, pues en la mayora de situaciones reales, los datos, se comportan de esta manera, en la que la media, mediana y moda tienen los mismos valores. Como ejemplos podemos citar las estaturas de los hombres en una determinada universidad, la edad de las mujeres de todos los colegios de un pas, el peso de los nios de primer ciclo bsico, en las escuelas pblicas. b) Distribucin rectangular Tiene una frecuencia constante o igual en un intervalo dado, adems de ser simtrica. Como ejemplos tenemos: El nmero de nacimientos registrados en un pas determinado, es aproximadamente igual, para cada da de la semana. Asimismo el nmero de nacimientos registrados en los distintos meses del ao, es aproximadamente igual, del nmero de lanzamientos de una moneda cuando es lanzada miles de veces, el nmero de caras va a ser aproximadamente el mismo que de sellos. c) Existen aproximadamente dos tipos de distribuciones asimtricas, la una es llamada asimtrica positiva. Se dice positiva cuando la curva se extiende hacia la derecha. Ejemplos de aquellos valores altos de la distribucin podrn ser la edad de los graduados, ya que la mayora se gradan en una MAT. MAURICIO GARCIA PAG 25

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

determinada edad, pero existen muy pocos que se gradan posteriormente a esa edad. Tambin podra mencionarse el ingreso familiar anual, pues la mayora gana muy poco y unos pocos ganan mucho.

Se dice negativa cuando la curva se extiende hacia la izquierda. Ejemplos de aquellos valores bajos de la distribucin podrn ser las notas obtenidas, de un examen muy elemental, pues la mayora tendra buena calificacin y unos pocos tendran mala calificacin.

1. Medidas de Centralizacin Analizaremos a continuacin tres medidas. Las ms importantes con la media, mediana y moda que permitirn determinar los valores centrales de un conjunto de datos. El smbolo Xj se lee X sub j, y representa cualquier valor de las frecuencias de un conjunto de nmeros dados. La variable j se llama subndice o ndice o variable muda y puede ser cualquier letra del alfabeto, es decir Xr, Xk, Xp, etc. As en la serie de nmeros 8,4,5,7, la posicin X3 es 5, y as sucesivamente. Se utiliza la letra griega mayscula sigma, que representa la suma de un conjunto de nmeros dados,n

, ademsi 1

xi

se lee sumatoria de i= 1 hasta n, de X sub i, donde i toma valores enteros desde 1 ,

2, .., n. PROPIEDADES DE LAS SUMATORIASn n n

1.i 1 n

xi axii 1 n

yii 1 n

xii 1

yi

2. 3.i 1

ai 1

xi

n

8.1 Media Aritmtica La media aritmtica en general resulta la medida de centralizacin ms confiable, pues permite obtener el promedio de un conjunto de datos. a) La frmula para la media aritmtica de datos sin agrupar, viene dada por:

MAT. MAURICIO GARCIA

PAG 26

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Se representa x , se lee media aritmtica y se define como las suma de todos sus valores y est dividida por el nmero de elementos, esto es:n

xi xi 1

x1

x2 n

... x n

n

b) La frmula para la media aritmtica de datos agrupados, viene da por:n

f i xi n de clase. xi 1

f1 x1

f 2 x2 ... n

f n xn

donde fi representa las frecuencias, la xi representa las marcas

8.2 Mediana Representa la mediana. El 50% de los datos estn por debajo de un valor especfico y el otro 50% por encima, de dicho valor dado. Se deben primeramente ordenar los valores en forma ascendente. a) La frmula para la mediana de datos sin agrupar, viene dada por: Si los datos son impares , la mediana viene dada por :

n 1 2

Si los datos son pares, la mediana es el promedio de las posiciones: b) La frmula para la mediana de datos agrupados, viene dada por:

n y 2

n 2

1

Me

Li

n f 2 * h donde f clase med

Primeramente se debe calcular la clase mediana, para lo cual dividimos frecuencia sumamos acumuladamente, hasta que supere dicho valor.

n y de la columna de la 2

Li representa el lmite real inferior, el mismo que se obtiene calculando el promedio entre el lmite inferior de la clase mediana y el lmite superior anterior a la clase mediana.

f representa la suma acumulada antes de la frecuencia de la clase mediana.

f clase med representa la frecuencia de la clase mediana.h representa la diferencia del lmite inferior y superior de la clase mediana.

MAT. MAURICIO GARCIA

PAG 27

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

8.3 Moda La moda nos indica el nmero de veces que ms se repite en un conjunto de datos dados. Se simboliza con Mo, es decir no necesita de frmula. Adems la moda no puede existir. Pueden haber una moda (unimodal), dos modas (bimodal), etc. a) La frmula para la moda de datos agrupados, viene dada por:

Mo

Li1

1 2

* h donde

Primeramente se debe calcular la clase modal para lo cual se deber tomar el valor ms alto de la frecuencia, asimismo Li representa el lmite real inferior, el mismo que se obtiene calculando el promedio entre el lmite inferior de la clase modal y el lmite superior anterior a la clase modal. representa la diferencia de la frecuencia de la clase modal con el valor de la frecuencia inmediatamente anterior.1

representa la diferencia de la frecuencia de la clase modal con el valor de la frecuencia inmediatamente posterior.2

h representa la diferencia del lmite inferior y superior de la clase modal. Ejemplos: 1. Halle la media, moda y mediana de las preguntas realizadas en una encuesta a 36 personas en lo que se refiere al nmero de telfonos mviles que ha tenido, y los resultados son los siguientes: 1 5 1 3 3 2 3 3 0 3 2 2 3 0 1 1 0 2 1 4 2 3 3 0 4 4 2 1 2 3 3 2 1 4 5 2 Solucin: Podemos resumir en el siguiente cuadro, los ndices estadsticos, de los datos sin agrupar, obtenindose:

MAT. MAURICIO GARCIA

PAG 28

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

NDICES ESTADSTICOS telfonos N Media Mediana Moda Mnimo Mximo Muestra

36 2,25 2,00 3 0 5

La interpretacin nos indica que el promedio de nmero de celulares que han tenido los 36 encuestados es de aproximadamente 2, adems menos del 50% de los encuestados han tenido 2 celulares y ms del 50% de los encuestados ha tenido ms de dos celulares. El nmero de celulares que ms veces han tenido los encuestados es de 3. El mnimo de celulares de los encuestados ha sido ninguno y el mximo que han tenido es de 5 celulares. 2. La siguiente tabla representa los ingresos mensuales, en dlares, de 20 trabajadores de una empresa. a) halle la media moda y mediana b) Qu conclusiones puede sacar? c) Qu tipo de distribucin representa?.

Intervalo de clase (en dlares) 100,5 120,5 120,5 140,5 140,5 160,5 160,5 180,5 180,5 200,5 200,5 220,5

frecuencia 2 3 5 5 3 2

Solucin: a) Calcularemos previamente la media aritmtica para estos datos agrupados, para lo cual tenemos los siguientes clculos:

MAT. MAURICIO GARCIA

PAG 29

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Intervalo de clase (en dlares) 100,5 120,5 120,5 140,5 140,5 160,5 160,5 180,5 180,5 200,5 200,5 220,5

frecuencia fi 2 3 5 5 3 2 20

Marca de clase Xi 110,5 130,5 150,5 170,5 190,5 210,5

fi*Xi221 391,5 752,5 852,5 571,5 421 3210

n

3210 160.5 , esto nos indica que en promedio los salarios de los encuestados es n 20 de 160.5 dlares mensualmente.Luego xi 1

f i xi

n 20 10 por lo que tenemos la suma 2 2 acumulativa en la columna de la frecuencia que cae en el intervalo 160.5 a 180.5, es decir quePara hallar la mediana, calcularemos la clase mediana, esto es:

Li

160.5 160.5 160.5 , adems 2n f 2 * h 160.5 f clase med

f

2 3 5 10 , tambin f clase med

5

Finalmente, h= 180.5-160.5=20 , reemplazndolo en la frmula respectiva, esto es:10 10 * 20 160.5 , esto nos indica que el 50% de los 5

Me

Li

encuestados gana hasta 160.5 dlares mensuales y el otro 50% gasta ms de 160.5 dlares mensuales.

Ahora calcularemos la moda. Para ello encontraremos la clase modal de la tabla. Se puede observar que existen 2 modas, que seran el 5 en los intervalos de 140.5 a 160.5 y de 160.5 a180.5 respectivamente, por lo que se puede escoger cualquiera de ellos, en nuestro caso escogemos como clase modal el intervalo entre 140.5 a 160.5 , luego tenemos:

140.5 140.5 140.5 , adems 2 reemplazndolo tenemos: Li

1

5 3

2 y

2

5 5

0 con h= 160.5-140.5=20,

MAT. MAURICIO GARCIA

PAG 30

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Mo

Li1

1 2

* h 140.5

2 2 0

* 20 160.5 , esto nos indica que el valor que ms ganan los

trabajadores es de 160.5 dlares. b) La conclusin es que los tres ndices estadsticos de centralizacin son los mismos. c) Como la media, mediana y moda dieron exactamente los mismos resultados la forma de la distribucin de los datos se comporta en forma normal simtrica. 8.4 Medidas de Dispersin La dispersin permite medir el grado de variacin que tiene un conjunto de datos con respecto a la media aritmtica. Dentro de los ndices estadsticos de dispersin, el ms importante y confiable es la desviacin estndar para datos sin agrupar que viene dada de la siguiente manera:n

xi si 1

x

2

n 1

Donde xi representa, la posicin de las frecuencias del conjunto de datos, x representa la media aritmtica de los datos sin agrupar. La frmula para datos agrupados de la desviacin estndar viene dada por:n

f i xi si 1

x

2

donde fi representa las frecuencias, la xi las marcas de clase, x representa la media n 1 aritmtica de los datos agrupados. La varianza no es sino el cuadrado de la desviacin estndar, esto es s2. 2. Calcule la desviacin estndar de los ingresos mensuales del ejemplo anterior. Realizando los clculos pertinentes, utilizando la frmula de la desviacin estndar de datos agrupados tenemos:

MAT. MAURICIO GARCIA

PAG 31

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Intervalo de clase (en dlares) 100,5 120,5 120,5 140,5 140,5 160,5 160,5 180,5 180,5 200,5 200,5 220,5

frecuencia fi 2 3 5 5 3 2 20

Marca de clase Xi 110,5 130,5 150,5 170,5 190,5 210,5

(XI-media) 2500 900 100 100 900 2500

fi (XI-media) 5000 2700 500 500 2700 5000 16400

n

f i xi

x

2

Luego, s

i 1

n 1

16400 20 1

29.38

Esto nos indica que la mayora de los empleados encuestados gana entre 131.12 y 189.88 dlares mensuales. ( x s .

8.5

El coeficiente de variacin

Permite medir el grado de variacin de un conjunto de datos, especialmente si se compara dos tipos de datos con unidades distintas, se expresa en tanto por ciento y viene dada por:

CV

S *100 X

Ahora explicaremos las medidas de posicin relativa para datos sin agrupar, que no es sino el inters que se tiene en hallar un determinado valor con un porcentaje dado dentro del conjunto de datos, previamente deben ser ordenados de menor a mayor. Entre estas tenemos: El primer cuartil Q1 , representa el 25% de la posicin, es decir que el 25% de los datos se encuentra n 1 por debajo del valor encontrado. Se calcula Q1 , si la divisin cae en la mitad redondee al 4 entero ms prximo. El segundo cuartil Q 2 o mediana, representa el 50% de la posicin, es decir cuando el 50% de los datos se encuentra por debajo del valor encontrado y el otro 50% por encima de un valor especfico, medida est analizada. El tercer cuartil Q3 , representa el 75% de la posicin, es decir el 75% de los datos se encuentra por 3 n 1 debajo del valor hallado. Se calcula Q3 , si la divisin cae en la mitad, hay que redondear al 4 entero inmediato inferior.

MAT. MAURICIO GARCIA

PAG 32

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Los centiles ( o percentiles) son nmeros que dividen en 100 partes iguales un conjunto de datos ordenados, dicho conjunto tiene 99 centiles. El k-simo centil, Pk., representa un valor tal que el k% de los datos, es menor o igual que un valor hallado. La frmula para determinar cualquier percentil para datos agrupados viene dado por:Pk Li n* p f f * h , donde

frec del int ervalo k

Primeramente se debe hallar el intervalo de clase k, para lo cual multiplicamos n*p y sumamos acumulativamente en la columna de la frecuencia, el valor que supere a dicho valor, ste ser el intervalo de clase k.Li representa el lmite real inferior, el mismo que se obtiene calculando el promedio entre el lmite inferior de la clase del intervalo k y el lmite superior anterior a la clase del intervalo k.

p

k 100

f representa la suma acumulada antes de la frecuencia de la clase del intervalo k f clase med representa la frecuencia de la clase del intervalo k y

h representa la diferencia del lmite inferior y superior de la clase del intervalo k. Ntese que, a ms de pedir el punto percentil k, se puede realizar tambin el proceso inverso. Dada una cantidad, encuentre el valor de k menor o igual a dicho valor dado. 3. La siguiente tabla representa los ingresos mensuales, en dlares, de 20 trabajadores de una empresa. a) halle el percentil 80 b) Qu porcentaje de trabajadores ganan menos de 150 dlares mensuales ?.Intervalo de clase (en dlares) 100,5 120,5 120,5 140,5 140,5 160,5 160,5 180,5 180,5 200,5 200,5 220,5 frecuencia 2 3 5 5 3 2

Solucin:

k 80 0.8 100 100 Luego n*p=20*0.8=16, por tanto dicho valor se encuentra en el intervalo 180.5 a 200.5, as 16 15 P 80 180.5 * 20 187.16, es decir el 80% de los empleados gana hasta 187.333333 3 dlares.a) Tenemos que calcular el percentil 80, esto es k= 80, n=20. p

MAT. MAURICIO GARCIA

PAG 33

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

b) Como el valor de 150 dlares se encuentra en el intervalo de 140.5 a 160.5, entonces tenemos que k 20 * 5 n* p f 100 P k Li * h esto implica que, 150 140.5 * 20 .Despejando k, f frec del int ervalo k 5 tenemos que k=36.875%, es decir, el 36,875% de los encuestados gana hasta 150 dlares. Para obtener los ndices estadsticos bsicos, en SPSS, se pueden realizar por varios procedimientos; 1. Analyze Descriptive StatisticsFrequenciesEscoger las variables cualitativas que uno desee, puede escoger varias o una sola StatisticsMarcar los que uno desee ContinueOK. 2. Analyze Descriptive StatisticsDescriptiveEscoger las variables cualitativas que uno desee, puede escoger varias o una sola Options ContinueOK. 3. Analyze Descriptive StatisticsExploreEscoger las variables cualitativas que uno desee, puede escoger varias o una sola ContinueOK. Ntese que adems aqu nos calcula el intervalo de confianza para la media poblacional.

8.6 Diagrama de Caja y Bigote Analiza y resume un conjunto de datos de una variable dada. Permite describir si existe o no la simetra de los datos, adems permite hallar valores que no son comunes al conjunto de datos, y asimismo, se analiza si se ajusta dicho conjunto de datos a una distribucin de frecuencias determinadas. Se utilizan cinco nmeros, que son el mnimo, el primer cuartil, la mediana, el tercer cuartil y el mximo, de izquierda a derecha. Pueden existir valores atpicos (outliers) que pueden estar a la izquierda del bigote izquierdo y a la derecha del bigote derecho. La interpretacin indica que si la mediana est en el centro de la caja (entre el primer cuartil y el tercer cuartil) los datos se comportan en forma normal, esto es:

Asimtrica hacia la derecha

Asimtrica hacia la izquierda

Simtrica

4. Utilice los siguientes datos, para realizar un diagrama de caja y bigote. Los siguientes datos representan el nmero de horas trabajadas semanalmente por 50 personas encuestadas.

MAT. MAURICIO GARCIA

PAG 34

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

35 40 39 38 31 31 38 48 39 38

38 34 47 36 38 31 32 45 44 43

40 36 48 39 40 47 39 38 43 35

40 45 33 39 36 38 34 46 47 34

40 42 40 42 41 38 44 40 40 42

Calculando los ndices estadsticos respectivos tenemos:

ndices estadsticos NUMEROS N

Muestra Valores perdidos

50 0 31 48 36,00 39,00 42,25

Mnimo Mximo Percentiles

25 50 75

.

MAT. MAURICIO GARCIA

PAG 35

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Y cuyo grfico es:

20

30

40

50

El grfico de caja y bigotes presenta una caja central dividida en dos reas por una lnea vertical y dos segmentos horizontales (bigotes) que parten del centro de cada lado vertical de la caja. La caja central encierra el 50% de la frecuencia. El sistema dibuja la mediana como una lnea vertical en el interior de la caja. Si la lnea est en el centro de la caja no hay asimetra de la variable, que es este nuestro caso, por lo tanto los datos se comportan como una distribucin simtrica o normal. Para realizar los grficos de caja y bigote en SPSS debe tomar en cuenta : Graph Boxplot... Summaries of separate variables Define... Escoger las variables cualitativas que uno desee graficar, puede escoger una o varias variables OK, o tambin: Analyze Descriptive StatisticsExploreEscoger las variables cualitativas que uno desee, puede escoger varias o una sola PlotMarcar caja y bigoteBorrar las dems opciones ContinueOK

MAT. MAURICIO GARCIA

PAG 36

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

ACTIVIDADES DE APRENDIZAJE IRealice los siguientes ejercicios y problemas:

1. Los siguientes datos representan el nmero de das, que se demoraron en obtener trabajo, 100 personas encuestadas, en el sector informal en la ciudad de Quito.64 32 72 54 118 89 136 91 133 45 68 122 124 115 41 91 103 49 77 46 36 144 134 120 146 33 132 84 94 138 76 83 131 91 95 74 137 91 39 88 32 63 41 69 130 79 94 118 97 64 55 47 106 37 120 52 105 144 36 59 133 126 150 31 49 51 112 47 74 85 130 146 108 142 43 49 49 142 87 30 49 79 58 133 62 113 30 31 144 106 42 82 86 31 114 80 110 97 42 116

Conteste: a. Se pide realizar la tabla de frecuencias, fr, fa, fra. Interprete el resultado de la fila ms alta. a. Cuntos personas consiguieron trabajo no ms de 70 das? b. Qu porcentaje de individuos consiguieron trabajo cuando mucho esperando 120 das? c. Cuntos individuos consiguieron trabajo ms de 71 pero no ms de 122 das? d. Qu porcentaje de individuos consiguieron trabajo a lo sumo 115 das? e. Cuntos individuos consiguieron trabajo menos de 65 das ms de 123 das? f. Realice el grfico de datos no agrupados de la frecuencia y fra. Interprete el grfico. g. Calcule los ndices estadsticos, de la tabla para datos no agrupados, esto es la media, mediana, moda, desviacin estndar, primer y tercer cuartil, interprete los resultados. h. Calcule el coeficiente de variacin e interprete el resultado. i. Construya slo los intervalos de clase de acuerdo a la metodologa enseada. j. Construya una tabla de datos agrupados desde el 29 a 40, de 40 a 51, 51 a 62, etc. k. Calcule la tabla completa de las frecuencias, esto es f, fr, fr, fra l. Realice el Histograma y Polgono de frecuencia. m. Grafique la ojiva o frecuencia relativa acumulada.

MAT. MAURICIO GARCIA

PAG 37

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

n. De acuerdo a este ltimo grfico, indique aproximadamente el monto de los ingresos semanales de menos del 50%. o. As mismo de acuerdo a este ltimo grfico, indique aproximadamente el porcentaje de personas que consiguieron trabajo en 100 das? p. Calcule los ndices estadsticos, de la tabla para datos agrupados, del literal k), esto es, la media, mediana, moda, desviacin estndar, primer y tercer cuartil, interprete los resultados. q. Calcule el porcentaje de personas, que consiguieron trabajo en menos de 110 das, de los datos de la tabla de datos agrupados, del literal k). Interprete el resultado. r. Calcule el tiempo mnimo de las personas del 90% que consiguieron trabajo, de los datos de la tabla de datos agrupados, del literal k). Interprete el resultado. 2. En la tabla de frecuencias que se da a continuacin faltan algunos datos. Compltela y represente grficamente la frecuencia acumulada. VALORES f f.r. f.a. f.r.a. 0 1 2 3 4 5 0.2 2 5 9 14 0.7

3. En la tabla de frecuencias que se da a continuacin faltan algunos datos. Compltela y represente grficamente la frecuencia acumulada. VALORES f f.r. f.a. f.r.a. 0 1 2 3 2 5 9 14 0.7

MAT. MAURICIO GARCIA

PAG 38

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

4 5

0.2

4. Los datos que a continuacin aparecen son los datos generales de la juventud en Ecuador de acuerdo al censo de la poblacin del 2001. En base al siguiente cuadro:

Grupo de Edad 15 a 19 aos 20 a 24 aos 25 a 29 aos Total grupo de 15 a 29 Total Pas

No. Mujeres 623.444 597.619 490.086 1.711.149 6.138.255

No. Hombres 617.087 571.018 457.309 1.645.414 6.018.353

Fuente: Censo de poblacin 2001 INEC Conteste las preguntas: a. Especificar la poblacin, las variables indicadas y el tipo de variable. b. Calcular el porcentaje de hombres y mujeres para cada una de las categoras o grupo de edad. c. Representar grficamente la distribucin de hombres y mujeres por grupos de edad (histograma). d. Calcule el promedio de edad de acuerdo al sexo, interprete el resultado. e. Dnde existe mayor variabilidad, en hombres o mujeres de acuerdo a su edad. f. Halle la moda y mediana de las mujeres. Interprete el resultado. g. Calcule el 30%, 60% Q1 y Q3 cuartil de las mujeres. Interprete los resultados. h. Realice el diagrama de caja y bigote de la variable hombres. Interprete el resultado de los hombres. 5. La siguiente tabla representa un cuadro comparativo a nivel nacional del primer semestre, causas de detencin (las diez principales causas) entre los aos 2000 y 2003. En base al siguiente cuadro:Causas Robo Asalto y robo 2000 1049 279 2001 821 407 2002 557 295 2003 467 266 Total 2894 1247

MAT. MAURICIO GARCIA

PAG 39

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL Escndalo pblico Tenencia de arma Libar en la va pblica Investigacin Operativo antidelincuencial Tenencia de droga Agresin fsica Violacin

193 154 --24 47 31 16 14

349 142 4 46 21 37 49 30

GUIA DE ESTADISTICA DESCRIPTIVA 245 397 1184 138 42 57 59 46 26 20 116 316 64 119 61 47 40 550 362 191 246 175 138 104

a. Especificar la variable y poblacin que se han considerado. b. Determinar los porcentajes correspondientes a toda la informacin expresada del ao 2002 y 2003. As como su fa y fra. c. Comparar grficamente los datos de los dos aos (2002 y 2003) para dos de las causas de detencin, cualesquiera. Interprete los resultados. d. Dnde existe mayor variabilidad de las causas de delitos entre los aos 2000 y 2003? 6. La informacin que se expresa a continuacin corresponde al gasto mensual (en dlares) en llamadas de telfono mvil, a lo largo de una semana, de 50 Organismos No Gubernamentales (ONG).

67 63 64 57 56 55 53 53 54 54 45 45 46 47 37 23 34 44 27 44 45 34 34 15 23 43 16 44 36 36 35 37 24 24 14 43 37 27 36 26 25 36 26 5 44 13 33 33 17 33

Conteste:

a. Calcule las f, fr, fa y fra. b. Realice el grfico de las f, fa. c. Indique cuntas ONG tienen gastos menores a 43 dlares. d. Indique qu porcentaje de ONG tiene gastos entre 23 a 36 dlares mensuales. MAT. MAURICIO GARCIA PAG 40

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

e. Cuntas ONG tienen gastos de ms de 24 dlares pero no ms de 37 dlares? f. Cuntas ONG tienen a lo sumo 44 dlares de gastos semanales? g. Realice una tabla de datos agrupados comenzando por 4.5 a 15.5; de 15.5 26.5, as sucesivamente. h. Realice un histograma y el diagrama del polgono de frecuencia. Interprete los resultados. i. Cul es el valor que tienen que pagar las ONG por gasto mensual en llamadas de telfono mvil? j. Calcule la moda, media, mediana, la desviacin estndar, e interprete los resultados.k.

Calcule el primer y tercer cuartil e interprete los resultados La siguiente tabla muestra la distribucin de costes de 10000 empleados de una multinacional.Salarios (en dlares) 0-15000 15000-20000 20000-25000 25000-30000 30000-35000 35000-40000 40000-50000 50000-100000 100000-300000 No. de Empleados 1945 1430 1140 1005 1140 2422 590 228 100

7..

a) Halle la media del salario por trabajador, el salario tal que la mitad de los restantes sea inferior a l. b) Calcule el percentil 40 y el cuartil inferior salarial. c) Realice el grfico del histograma y polgono de frecuencia. En base a este grfico indique el porcentaje de personas que ganan aproximadamente menos de 32000 dlares. d) Halle el percentil 80 e interprete el resultado. e) Qu porcentaje de los empleados gana menos de 38000 dlares? f) Indique el porcentaje de empleados que ganan entre 32000 y 60000 dlares anuales 9. Se van a comparar la variabilidad en los precios anuales de las acciones que se venden a menos de$10 dlares y la dispersin en los precios de aquellas que se venden por arriba de $60 dlares. El precio medio de las acciones que se venden a menos de $10 dlares es de $5,25 y la desviacin estndar es de $1,52. El precio medio de las acciones que se venden a ms de $60 es de $92,5 y la desviacin estndar es de $5,28. a) Qu pasa con sus precios? y b) Compare la variabilidad de ambas acciones e interprete el resultado. 8. Se ha recogido informacin de los Organismos No Gubernamentales (ONG), sobre los salarios de

los empleados, clasificados segn el tipo de contrato que tienen formalizado. Tipo de Contrato Salario (dlares/mes)

MAT. MAURICIO GARCIA

PAG 41

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Pasanta Eventual Indefinido

400-800 10 13 2

800-1200 14 34 12

1200-2000 1 18 46

Halle a) La moda, la mediana de los que ganan entre 400 a 800, e interprete los resultados, b) Realice el grfico del histograma de los que ganan entre 800 -1200 c) Calcule el porcentaje de trabajadores con contratos de Pasanta que cobran ms de 450 dlares, d) Realizar el estudio comparativo del salario de los empleados con contrato Indefinido y con contrato Eventual, interprete los resultados e) Indique la poblacin y las variables que se consideran.

RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION1. VERDADERO 2. VERDADERO 3. a) 4, MUESTRA 5. OJIVA 7. a) NO EXISTE b) 130 8. FALSO 9. FALSO 10. b) a) 11. d) 12. a) 13. b) NO EXISTEN RACES DE NMEROS NEGATIVOS EN LOS REALES 14. RANGO. 15. b) UNIDAD II INTRODUCCIN A LA PROBABILIDAD

PREGUNTAS DE AUTOEVALUACION1. El conjunto de todos los resultados posibles se llama 2. Una probabilidad subjetiva se puede decir que es una hiptesis bien estructurada a) Verdadero b) Falso 3. La notacin de una probabilidad condicionada viene dada por P(AB) a) Verdadero b) Falso 4. Dos sucesos son mutuamente excluyentes si cumple P(AB)=P(A)P(B) a) Verdadero b) Falso 5. La probabilidad de que al lanzar una moneda que caiga de filo es: a) 0 b) 1 c) Ninguno de los anteriores 6 .Un suceso es una condicin particular de un . 7. Al lanzar un par de dados, halle el evento de que su suma sea siete y su producto 12 a) (3,4) b) (4,3) c) (4,3) (3,4) d) (5,2)(2,5) e) Ninguna de las anteriores 8. La probabilidad de un evento se define como

2.1.

2.2. 2.3.

2.4. 2.5. 2.6.

Rol de la probabilidad en la estadstica: Definicin de eventos y espacio muestral Definicin de probabilidad, Propiedades Tablas de frecuencia, Tablas de probabilidades, Tablas de contingencia Probabilidad condicional: rboles de decisin Independencia estadstica Eventos independientes: Regla de la multiplicacin Participaciones, Probabilidad total y teorema de Bayes: Anlisis combinatorio: Combinaciones y Permutaciones

MAT. MAURICIO GARCIA

PAG 42

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

ASESORA DIDCTICA IILa teora de probabilidades nace a principios del siglo XVII como resultado de investigaciones sobre distintos tipos de juego de azar. Entre los ms destacados exponentes se encuentran Fermat, Bernoulli, Gauss y Laplace, que dan la mayor formalidad y rigurosidad matemtica a la teora de las Probabilidades. Esta teora de Probabilidades, analiza las leyes que gobiernan ciertos tipos de fenmenos llamados fenmenos aleatorios, que buscan un modelo matemtico que se acerque o se aproxime al comportamiento de dichos fenmenos. Se define el suceso o evento, de un experimento aleatorio, como una caracterstica o particularidad del mismo, se lo denota con cualquier letra mayscula. En tanto un espacio muestral, es el conjunto de todos los resultados posibles de un experimento, lo simbolizaremos como la letra E. Existe una manera alternativa de representar un conjunto de resultados posibles, mediante lo que se conoce como diagrama de rbol, el mismo que se encuentra trazado como un crculo pequeo a la izquierda, representado por el tronco del rbol. 2.1 Teora de las Probabilidades Definicin.- Sea E un espacio muestral, mediante una funcin P, a todo evento de A se le asocia un nmero real, llamado probabilidad de A, que se lo denota P(A), es decir1. P: A 0,1 A P( A) Esto nos indica que la probabilidad siempre variar entre 0 y 1 o entre 0% y 100%.

2. 3.

P( E ) = 1, esto nos indica que la probabilidad del espacio muestral siempre ser 1 o 100%. P A B P A P( B) si A B

2.2 Propiedades de las Probabilidades En base a los tres axiomas anteriores se pueden deducir las siguientes propiedades: 1. P 0 , esto nos indica que la probabilidad de un evento imposible es cero. 2. Sea A un evento cualquiera, P A C 1 P ( A) , es decir la probabilidad de calcular 1 mas eventos hasta n, se puede calcular el evento contrario y restar de 1. 3. Sean A y B, eventos cualesquiera, se tiene que: P A B C P( A B) P( A) P( A B) 4. P A B P A P( B) P( A B) si A B 5. Si A, B, C son eventos cualesquiera se tiene que:

P A B C P A P( B) P(C ) P( A B) P( A C ) P( B C ) P( A B C ) 6. Muchas veces se necesita calcular la probabilidad de un evento Una vez que se ha producido otro, en expresiones en un experimento, tales como dado, si, si se conoce, si se sabe,etc,

MAT. MAURICIO GARCIA

PAG 43

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

se debe utilizar la probabilidad condicional, la expresin P(A/B), se lee la probabilidad de A dado B y se define P( A B) P A/ B si P( B) 0 P( B ) 7. Dos sucesos son mutuamente excluyentes si se cumple que PA B 0

8.

Dos sucesos son independientes si la ocurrencia del uno no incide en la ocurrencia del otro evento, esto es

P A B P A * P( B) P A / B P( A) P B / A

P( B)

EJERCICIOS1. Se lanza una moneda y se observa si cae por cara, se lanza una moneda, si cae por sello se lanza por segunda vez. De acuerdo a las condiciones del problema, tenemos que:

C C S C C S S S C

Luego el espacio muestral sera: E

CC , CS , SCC, SCS , SSC, SSS

2. Se lanza un par de dados. Encontrar la probabilidad de que el mximo de los dos

MAT. MAURICIO GARCIA

PAG 44

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

nmeros resultantes sea mayor que 4 3. Se saca al azar de una caja que contiene 6 bolas rojas, 4 blancas y 5 azules. Determine la probabilidad de que la bola a) no sea roja b) sea roja o blanca 4. Encuentre la probabilidad de no obtener un 7 u 11 en la suma del lanzamiento de dos dados. 5. Si P( A B) 0.9 y P( B) 0.6, halle P( A B)

6. Los siguientes datos representan el tiempo en segundos que se demoran 50 programas en ser compilados:

Valores Frecuencia 12 2 14 1 15 1 16 2 17 2 18 4 19 2 20 4 21 4 22 5 23 4 24 3 25 3 28 2 29 1 30 1 31 2 33 1 35 2 36 1 37 1 39 1 40 1 Halle la probabilidad de que un programa escogida al azar Dure entre 15 a 24 seg.

cf 31 0.62 62% cp 50 Existe, por tanto, un 62% de probabilidades de que el programa dure entre 15 a 24 seg.Solucin: definimos el evento A. Dure entre 15 a 24 seg, luego P( A) Sea mayores de 25 seg,

MAT. MAURICIO GARCIA

PAG 45

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Solucin: definimos el evento B, Mayor de 25 seg, luego cf 13 P( B) 0.26 26% cp 50 Existe, por tanto, un 22% de probabilidades de que el programa dure ms de 25 seg.

Dure entre 16 a 23 seg. Solucin: definimos el evento C Dure entre 16 a 23 seg, luego cf 27 P(C ) 0.54 54% cp 50 Existe, por tanto, un 54% de probabilidades de que el programa dure entre 16 a 23 segundos. 7. En un experimento para estudiar la diferencia entre hombres y mujeres que fuman o no, se obtuvieron los siguientes datos:

No fuman Hombres Mujeres 21 48

Fumadores moderados 36 26

Grandes fumadores 30 19

Si se elige al azar a una de estas personas, encuentre la probabilidad de que la persona a) Sea mujer b) Sea gran fumador c) Sea hombre y no fume d) Sea mujer o sea un fumador moderado e) Si es hombre, cul es la probabilidad de que sea fumador moderado? Solucin: a) De acuerdo a las condiciones definimos el evento A sea mujer cf 93 P( A) 0.516 51.6% cp 180 Luego, existe un 51.6% de probabilidades de que la persona escogida al azar sea mujer. cf 49 b) Definimos el evento B sea gran fumador P( B) 0.27 27% cp 180 Luego, existe un 27% de probabilidades de que la persona escogida al azar sea un gran fumador.

cf 21 0.116 11.6% cp 180 Luego, existe un 11.6% de probabilidades de que la persona escogida al azar sea hombre y no fume.c) Definimos el evento C sea hombre y no fume P(C ) d) Definimos el evento D sea mujer y definimos el evento F sea un fumador moderado , por tener la conjuncin o, esto nos indica unin, por tanto tenemos: 93 62 26 P ( D F ) P ( D) P ( F ) P ( D F ) 0.72 72% 180 180 180 MAT. MAURICIO GARCIA PAG 46

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Luego, existe un 72% de probabilidades de que la persona escogida al azar sea mujer o sea un fumador moderado.

e) Definimos el evento dado que G es hombre y definimos el evento H sea un fumador moderado , por tanto es una probabilidad condicional, esto es: 36 PH G 180 0.416 P( H / G ) 87 PG 180 Por lo tanto, existe un 41,6% de probabilidades de que sabiendo de que es hombre, sea un fumador moderado.

TEOREMA DE BAYES Una generalizacin para que el espacio muestral se divida en k subconjuntos, utiliza la llamada regla de eliminacin, mediante el siguiente: Teorema. Si existen B1, B2. . . , Bk, y forman una particin o divisin del espacio muestral E, y cumple que P( Bi ) 0 para i 1, 2,..., k , luego si A es cualquier evento del espacio muestral E, se tienek k

P Ai 1

P( Bi

A)i 1

P( Bi ) P( A / Bi )

Obsrvese que este teorema se aplica cuando se pide solamente la probabilidad de un evento simple cualquiera. Si ahora se considera encontrar la probabilidad condicional, se utiliza el llamado teorema de Bayes, esto es: Teorema. Si existen B1, B2. . . , Bk, y forman una particin o divisin del espacio muestral E, y cumple que P( Bi ) 0 para i 1, 2,..., k , luego si A es cualquier evento del espacio muestral E, tal que

P(A)

0 se tiene P Br / A

P( Brk

A) A)

P( Br ) P A / Brk

para r 1 ,2,...k

P( Bii 1

P( Bi ) P( A / Bi )i 1

EJERCICIOS 8. Dentro de un grupo de empresas 2/5 son compaas annimas y 3/5 son limitadas. De las annimas la mitad tiene utilidades menores a 5000 dlares, mientras que 2/3 de las limitadas estn en el mismo caso. Calcule la probabilidad de que: a) Una empresa elegida al azar tenga

MAT. MAURICIO GARCIA

PAG 47

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

ms de 5000 dlares de utilidades, b) Una empresa elegida al azar tenga menos de 5000 dlares, sea compaa limitada. Solucin: Realizaremos el diagrama de rbol,

$5000

2/3

$5000

De acuerdo al grfico tenemos: a) Ntese que nos pide solamente un evento simple, por lo que aplicando el teorema de eliminacin, definiendo el evento A ms de 5000 dlares de utilidades, buscamos el camino que nos lleva a ms de 5000 dlares de utilidades, luego k k 2 1 3 1 2 P A P( Bi A) P( Bi ) P( A / Bi ) * * 0.40 5 2 5 3 5 i 1 i 1 Por lo que existe un 40% de probabilidades, de que la empresa tenga ms de 5000 dlares de utilidades. b) Definamos el suceso A menos de 5000 dlares y el evento B sea compaa limitada , es una probabilidad condicionada, por lo que, aplicamos el teorema de Bayes, de acuerdo al grfico tenemos: 3 2 * P ( B A) 2 5 3 P B/ A 0.66 66% 2 1 3 2 P ( A) 3 * * 5 2 5 3 Luego existe un 66% de probabilidades de que la empresa elegida al azar tenga menos de 5000 dlares sea compaa limitada.

MAT. MAURICIO GARCIA

PAG 48

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

i.

Una compaa compra tubos de cemento a cuatro proveedores diferentes, la compaa A proporciona 25% de los tubos, B 25%, C 35% y D 15%. La compaa A ofrece tubos de buena calida con apenas el 4% de defectuosos, B con el 5% de defectuosos, C con el 2% y D con el 6% de defectuosos. A) Cul es el porcentaje de tubos defectuosos? b) En el ltimo envi, se hall un defectuoso. Cul es la probabilidad de que sea de la compaa C?

ii.

El departamento de crdito, report que el 40% de sus ventas, se pagan en efectivo, 25% con cheque en el momento de la compra y 35% con tarjeta de crdito. Se realizan compras por ms de 80 dlares, pagndose el 30% de las compras en efectivo, 70% se las pagan con cheque y 55% con tarjeta de crdito, usted ha comprado un artculo que cuesta $ 100. a) Cul es la probabilidad de que haya pagado en cheque? b) en efectivo? c) con tarjeta de crdito?

iii. Los registros de asalto en una ciudad nos indican que el 25% de ellos son muy violentos y el 75% no lo son. Se sabe tambin que se denuncian 90% de los muy violentos y el 70% de los no violentos. a) cul es la proporcin total de delitos que se denuncian en la ciudad? b) si se conoce que se realiz un delito, cul es la probabilidad de que el delito sea violento? Y cul que no sea violento? 2.3 COMBINACIONES Definicin. Si de n objetos tomamos r a la vez, se denota

n , en el que el orden no importa. Este r

denomina combinacin, y se define

n r

n! r! n r !

n! se lee n factorial y se define n! =n*(n-1)*(n-2)**3*2*1. De acuerdo con la definicin de combinacin, se puede deducir las siguientes propiedades: 1.

2.

3.

4.

5.

n 1 0 n n 1 n 1 n n n r n r n n 1 r r

n 1 r 1PAG 49

MAT. MAURICIO GARCIA

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

EJERCICIOS 1. De un grupo de 15 contadores y 12 Financieros cuntos comits de 5 contadores y 3 financieros se pueden formar?

Solucin: Se observa que el orden no importa por tanto, es una combinacin, esto es:

15 12 5 3

15! 12! * 5! 15 5 ! 3! 12 3 !

660660

Por tanto existen 660660 formas de elegir 5 contadores de entre 15 y 3 financieros de entre 12. 2. De un grupo de 15 empresas cuntos grupos de dos tres cuatro se pueden formar? Solucin: Obsrvese que el orden no importa, por tanto es una combinacin, como dice la expresin se suma esto es:

15 2

15 3

15 4

15! 2! 15 2 !

15! 3! 15 3 !

15! 4! 15 4 !

49140

Por tanto existen 49140 maneras de escoger 2 3 4 empresas de entre 15.

18. De cuntas maneras pueden seleccionarse, 3 contadores, 4 financieros, 5 economistas con 7 contadores, 10 financieros y 8 economistas. 19. En un Campeonato de ftbol participan doce equipos, cuntos partidos deben jugarse si cada equipo debe jugar con todos los otros?. 2.4 PERMUTACIONES Definicin: Una permutacin es un arreglo de todos o parte de un conjunto de objetos o personas, en el que el orden importa, se define as:

P (n, r )

n! n r !

De aqu se pueden deducir las siguientes propiedades: 1. El nmero de permutaciones de n objetos distintos es: P (n, n) n ! 2. El nmero de permutaciones de n objetos, dispuestos en forma de crculo es (n -1) !

EJERCICIOS iv. En una carrera intervienen 18 atletas. de cuntas maneras pueden distribuirse los cinco primeros puestos?

MAT. MAURICIO GARCIA

PAG 50

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Solucin: Obsrvese que el orden si importa, por tanto es una permutacin, luego tenemos:

P (18,5)

18 ! 1028160, 18 5 !

luego existen 1028160 formas de llegar a los cinco primeros lugares.

v.

vi. vii.

Hallar cuntos nmeros enteros de tres cifras pueden formarse con los 9 dgitos 1,2,3, , 9 si a) los tres dgitos usados son diferentes b) los tres dgitos usados no son necesariamente diferentes c) los enteros formados deben ser pares , permitindose la repeticin de dgitos. De cuntas maneras posibles se pueden seleccionar 10 carpetas para un trabajo si solamente hay cuatro vacantes posibles? En cuntas formas diferentes se pueden formarse 8 nios alrededor en un crculo

PROBABILIDAD USANDO EL ANALISIS COMBINATORIO 20. Se escoge al azar 3 empresas, de entre 15, de las cuales 5 son pequeas empresas, hallar la probabilidad de que: a) Ninguna sea pequea empresa b)Exactamente una sea pequea empresa c) Por lo menos una sea pequea empresa 21. En una urna existen 9 bolas numeradas del 1 al 9, se extrae aleatoriamente dos bolas, cul es la probabilidad de que a) los dos nmeros sean pares b) los dos sean impares c) el uno par y el otro impar. 22. De un grupo de empresas 8 limitadas y 6 annimas se escoge un comit de 4 para un trabajo especfico. Cul es la probabilidad de que el comit conste de de 2 compaas limitadas y 2 annimas?

ACTIVIDADES DE APRENDIZAJE IIA. TEORA DE PROBABILIDAD: COMBINACIONES Y PERMUTACIONES1.

Calcular lo siguiente: a. 6! *4! 15 b.

13 19 4

MAT. MAURICIO GARCIA

PAG 51

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL 2. Una empresa que tiene 13 accionistas

GUIA DE ESTADISTICA DESCRIPTIVA

va a elegir, en votacin secreta, cuatro directivos, esto es, un presidente, un vicepresidente, un secretario y un tesorero. Los trece miembros son elegibles y desean participar en la votacin. Cuntos grupos posibles de cuatro miembros pueden formarse, si no se tiene en cuenta el tipo de trabajo? Quince contadores han pasado las pruebas de contabilidad intermedia. De estos se escogern seis para que conformen un comit, Cuntos comits diferentes se pueden formar con estos 15?

3.

4.

Una empresa tiene 14 candidatos como contadores entre los cuales debe seleccionar nueve para ocupar dichos cargos. Cuntos grupos de nueve se pueden hacer? Una profesora debe nombrar un comit de cuatro muchachos y tres muchachas entre los estudiantes. Debe escogerlos entre un grupo de ocho hombres y seis mujeres. Cuntos comits diferentes se pueden nombrar?

5.

B. PROPIEDADES DE LAS PROBABILIDADES

6.

Se lanza un par de dados. Encontrar la probabilidad de que el mximo de los dos nmeros resultantes sea mayor que 4. Sea P (A) = 0.3, P (A B)= 0.40, P(Bc) = 0.9

7.

Halle a) P (B/A) b) A y B son eventos independientes, indique Por qu? c) P A B En una ciudad grande, el 70% de las empresas compra revistas econmicas y el 90% revistas de finanzas. Suponer que estos dos eventos son independientes. Qu probabilidad hay que una empresa escogida al azar sea una de las que compra ambas revistas? 9. Una facultad tiene los datos sobre la edad y el estado civil de 140 estudiantes.8.

Edad (aos) < 30 30 a 40 > 40 a. b. c. d.

Soltero(a) 77 49 10

Estado Civil Casado(a) Divorciado(a) 14 20 28 56 91 46

Cul es la probabilidad de cada uno de los estados maritales de los estudiantes? Cul es la probabilidad de que un estudiante seleccionado al azar, tenga menos de 30 aos o sea divorciado? Cul es la probabilidad de que un estudiante seleccionado al azar, tenga ms de 40 aos y sea soltero? Si un estudiante nos dice que es casado, cul es la probabilidad de que tenga entre 30 a 40 aos? PAG 52

MAT. MAURICIO GARCIA

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

C. TEOREMA DE BAYES10.

Una empresa tiene dos fbricas en Guayaquil y otra en Quito. La fbrica de Guayaquil produce el 40% del total de unidades, con un ndice de defectos del 10%. La de Quito tiene un ndice de defectos del 20%. Si una unidad suelta se encuentra defectuosa, de dnde es ms probable que proceda, de Guayaquil o de Quito?

11.

En el departamento de contabilidad de una empresa, tres empleados tienen la tarea de procesar los registros de los clientes. El primer empleado, A, procesa el 45% de los registros, el segundo B el 30% y el tercero C el 25%. El primer empleado tiene un porcentaje de error en su trabajo del 3%, el segundo del 5% y el tercero del 2%. Se selecciona un registro al azar entre los que se procesaron durante una semana y se encuentra que tiene un error. El auditor desea verificar la probabilidad de que el registro haya sido procesado por el empleado C. En un grupo de hombres adultos, el 10% presenta educacin primaria, el 70% tiene educacin secundaria y el 20% educacin universitaria. El 5% de los que presentan educacin primaria pertenece al grupo de ingresos altos. Por su lado, el 15% de los que tienen educacin secundaria y el 75% de los que tienen educacin universitaria pertenece al grupo de ingresos altos. Se selecciona un individuo al azar entre esta poblacin y se encuentra que est en el grupo de ingresos altos. Encontrar la probabilidad de que este individuo slo presente educacin primaria, de que presente educacin secundaria y de que presente educacin universitaria. Un mdico ha descubierto, en una gran empresa industrial, que el 20% de los casos de emergencia que examina, proviene del departamento A, el 10% provienen del departamento B, el 45% del departamento C y el 25% del departamento D. Tambin ha descubierto que el 10% de los casos de emergencia del departamento A, el 5% del departamento B, el 15% del departamento C y el 12% del departamento D son accidentes debidos a aparente descuido. Se presenta en la clnica un caso de accidente ocasionado por descuido. Qu probabilidad hay que ese paciente pertenezca al departamento A?, B?, C?, D?

12.

13.

En el paquete estadstico SPSS se puede realizar el cruce de variables de la siguiente manera: Analyze Descriptive Statistics Croostabs Row (variable 1) Column (variable 2) OK Adems se puede hacer el cruce de ms de dos variables, por ejemplo de una base de datos tenemos: 1) Haga una clasificacin cruzada de la sindicalizacin ( pregunta 14) con la satisfaccin en el trabajo (pregunta 9) en lo que respecta al sexo. Analyze Descriptive Statistics Crosstabs

MAT. MAURICIO GARCIA

PAG 53

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Continue y luego OK, los resultados son:

Interpretacin: Ntese que existen 89 hombres que no son miembros del sindicato y que estn muy satisfechos con susati sfaccion con el trabajo * sexo de l encuestado * MIEMBRO DEL SI NDICATO Crosstabulation Count MIEMBRO DEL SINDICATO SI satisfaccion con el trabajo sex o del encuestado mas culino femenino 19 9 20 7 2 48 89 80 12 4 185 8 1 3 21 68 63 7 8 146 Total 28 28 8 5 69 157 143 19 12 331

MUY SATISFECHO MODERADAMENTE SATISFECHO UN POCO SATISFECHO MUY INSATISFECHO MUY SATISFECHO MODERADAMENTE SATISFECHO UN POCO SATISFECHO MUY INSATISFECHO

NO

Total satisfaccion con el trabajo

MAT. MAURICIO GARCIATotal

PAG 54

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

trabajo. Advirtase que existe una sola mujer que pertenece al sindicato y esta un poco satisfecha con su trabajo, adems existen tan slo 21mujeres en total que pertenecen al sindicato.

RESPUESTAS A LAS PREGUNTAS DE AUTOEVALUACION1. ESPACIO MUESTRAL 2. VERDADERO 3.FALSO 4, FALSO 5.a) 6. EXPERIMENTO 7. c)

SEGUNDO BIMESTRE UNIDAD IIIII. DISTRIBUCIN DE PROBABILIDADES DISCRETAS Y CONTINUAS

PREGUNTAS DE AUTOEVALUACIONviii. Determine la diferencia en lo que corresponde a sus parmetros, al aplicar la Distribucin Binomial y la Hipergeomtrica ix. Es la distribucin de Poisson una variable aleatoria continua? a) verdadero b) Falso x. Como tambin es llamada la Distribucin Normal xi. Para que un conjunto de datos se considere que es normal, la media, mediana y moda deben ser iguales a) Verdadero b) Falso xii. El rea bajo cualquier curva es 1 100% a) verdadero b) Falso xiii. La distribucin que se analiza fracasos y xitos es la distribucin xiv. La distribucin en que el suceso es constante para cada intervalo temporal es llamado xv. La probabilidad de que el evento no es constante entre ensayos se llama .. 3.1. Variables aleatorias: Definicin Tipos Propiedades Distribucin de probabilidad para una variable aleatoria discreta: Definicin. Propiedades Valor esperado y desviacin estndar Distribucin de probabilidad binomial: de Poisson, Hipergeomtrica y Binomial Negativa. Definiciones, propiedades y caractersticas Modelos matemticos Caractersticas y propiedades PAG 55

3.2.

3.3.

MAT. MAURICIO GARCIA

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

3.4.

Variables aleatorias continuas: Definicin Funcin de densidad de probabilidad Propiedades

3.5.

Distribucin normal: Naturaleza e importancia Propiedades y modelo matemtico Manejo de la tabla Aplicaciones de la curva normal: Clculo de probabilidades con la variable tipificada

3.6.

ASESORA DIDCTICA IIIExisten las llamadas variables aleatorias (va), que son funciones que asocian un nmero real a cada elemento del espacio muestral. Las variables aleatorias se clasifican en discretas y continuas. Las variables aleatorias discretas (vad), son aquellas variables que toman valores enteros, y se presentan generalmente por medio de una tabla. En cambio las variables aleatorias continuas ( vac), son aquellas variables que toman valores en una escala continua, es decir cualquier nmero real en un intervalo dado, no es posible representarlas en forma tabular. Existen adems funciones de densidad de probabilidades (fdp) tanto para vad como para vac, que deben cumplir bsicamente dos cosas: que la probabilidad vare siempre entre 0 y 1 y que la suma de las probabilidades sea 1 para las vad, y en el caso de las vac que el rea bajo cualquier curva de siempre 1. Analizaremos las siguientes variables aleatorias discretas:

A. VARIABLES DISCRETAS

Definicin. Se dice que una variable aleatoria (v.a) es una funcin f: A espacio muestral y los nmeros reales. Existen dos tipos de variables aleatorias, las discretas y continuas.

, donde A representa el

Definicin. Un espacio que contienen un nmero finito de posibilidades o infinita con igual nmero de elementos que nmeros enteros, se conoce como espacio muestral discreto. Definicin. Un espacio que contienen un nmero infinito de posibilidades iguales nmero de elementos de los nmeros reales, se conoce como espacio muestral continuo.

MAT. MAURICIO GARCIA

PAG 56

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Una variable aleatoria discreta toma cada uno de sus valores con alguna probabilidad, por lo que se puede dar la siguiente: Definicin. Una funcin de densidad es llamada de probabilidades (f.d.a) si cumple:

n

a)

Para una variables aleatoria discreta X si :

1) 0

P( A) 1

2)i 1

p ( x) 1

b)

Para una variable aleatoria continua X, si:b

1) 0

P( A) 1b,

2)

p( x)dx 1 , recordar que

p( x)dxa

a

x

1. Distribucin Binomial Definicin: Sea x una variable aleatoria discreta (vad), en la que se realizan n pruebas independientes y la probabilidad de que sucedan k veces un suceso viene dado por la siguiente funcin de densidad de probabilidades (fdp)

n P n, k , p k

p k (1 p) n k , k

0,1,2,3..., n

0 en otro caso Donde n representa el tamao de la muestra, k es el nmero de veces que ocurre un suceso, p la probabilidad de ocurrencia. Esta distribucin Binomial, se aplica a) cuando cada ensayo tiene dos resultados posibles (xito o fracaso; si o no; verdadero o falso, etc) b) adems existen n ensayos independientes repetidos c) la probabilidad de xitos o aciertos , permanece constante de un experimento a otro d) los experimentos son independientes. La v.a binomial k es la cuenta del nmero de ensayos exitosos que ocurren, k toma valores entre 0 y n.Adems se pueden deducir las siguientes propiedades: 1. La esperanza matemtica o media promedio viene dado por E(x)=np n * p * (1 p) 2. La desviacin estndar, es S Utilice La tabla de la distribucin Binomial del apndice I, es acumulativa La distribucin binomial que presenta el programa es acumulativo es decir va desde k=0 hasta el k que se desee. TransformeCompute y

MAT. MAURICIO GARCIA

PAG 57

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

Obsrvese que CDF nos permite calcular el rea acumulativa dado el punto.

Ejemplo: 1. La probabilidad de que una empresa pague sus utilidades a tiempo, es de 0.3. a) Determine la probabilidad que de 6 empresas escogidas al azar hasta 2 paguen a tiempo. b) Calcule el promedio de empresas que paguen sus utilidades a tiempo. Solucin: De acuerdo a las condiciones de los datos tenemos: n=6; p=0.3 y k=0,1,2. Utilizando la distribucin Binomial, tenemos:

P n, k , p

n k

p k (1 p) n

k

P(6;0;0.3)+ P(6;1;0.3)+ P(6;2;0.3)= 6 6 6 0.30 (1 0.3) 6 0.31 (1 0.3) 5 0.32 (1 0.3) 4 0.7443 0 1 2 Por tanto existe un 74.43% de las probabilidades de que hasta 2 empresas paguen sus utilidades a tiempo.

b) Nos pide la esperanza matemtica, esto es: E(x)=np= 6*0.3=1.8, por tanto el promedio del nmero de empresas que paguen sus utilidades a tiempo es aproximadamente 2.

ACTIVIDADES DE APRENDIZAJE IIIEJERCICIOS DE DISTRIBUCION BINOMIAL

1. El diez por ciento de los contadores tienen hbitos de realizar peridicamente anlisis financieros de la situacin de la empresa. Hallar la probabilidad de que de una muestra de 10 contadores elegidos al azar sean exactamente 2 los que tengan hbitos. 2. Un paquete contable, se diseo, para que sea 99% confiable, se sabe que 9 empresas compraron este paquete. Encuentre la probabilidad de que : a) Por lo menos una empresa esta contenta con este paquete b) Por lo menos 6 empresas, este contentas con este paquete c) A lo sumo 5 empresas estn satisfechas d) como mximo 2 empresas, estn satisfechas. 3. Se sabe que en el 10% de las compaas, trabajan personas discapacitadas, si se selecciona al azar 40 empresas, cual es la probabilidad de que a) Cuando mucho trabajen 2 personas

MAT. MAURICIO GARCIA

PAG 58

UNIVERSIDAD TECNOLOGICA EQUINOCCIAL

GUIA DE ESTADISTICA DESCRIPTIVA

discapacitadas b) Mas de tres pero no mas de 7 personas discapacitadas c) como mnimo cuatro personas discapacitadas. d) Halle el nmero esperado de compaas que laboran personas discapacitadas.

2. Distribucin de Poisson Definicin: Si el tamao de la muestra es demasiado grande y la probabilidad muy pequea, utilizar la distribucin binomial resulta bastante tedioso, por lo que se aconseja utilizar la distribucin de Poisson que viene dada por:e P k, k!k

,k

0,1,2,3....

0 en otro caso Donde = np, e=2.718281., k es el nmero de veces que ocurre un suceso. Adems, para tener un mayor grado de seguridad, en la aplicacin de la Distribucin de Poisson se sugiere utilizar la siguiente regla emprica, esto es: 1. Si se cumple que np 5 y si n50, se aplica la distribucin d