64
Estadística General Mg. María Vallejos Atalaya Estadística General Mg. María Vallejos Atalaya

Estadística General 2012

Embed Size (px)

Citation preview

  • Estadstica General Mg. Mara Vallejos Atalaya

    Estadstica General

    Mg. Mara Vallejos Atalaya

  • Estadstica General Mg. Mara Vallejos Atalaya

    PRESENTACIN

    El mdulo de Estadstica General tiene la naturaleza terico- prctica, pertenece al rea de

    Formacin Bsica, en el I ciclo, con un total de 4 horas y 3 crditos. Asimismo, responde a las

    exigencias curriculares de los programas acadmicos y de los diseos curriculares de la Facultad de

    Ciencias Empresariales y sus respectivas carreras acadmicas profesionales, en el contexto de los

    perfiles, las visiones y las misiones institucionales educativas y profesionales.

    Tiene el propsito de proporcionar al futuro profesional los conocimientos necesarios de la estadstica,

    que le permitir investigar y resolver problemas con el quehacer de su carrera profesional. El mundo

    actual que vivimos, ha provocado incertidumbre en las personas que tienen que tomar decisiones en

    las diferentes funciones que les toca desempear, ya sea en las instituciones gubernamentales,

    comerciales, de negocios pblicos y privados. La estadstica es una herramienta intelectual que ayuda

    a tomar decisiones racionales, porque sabemos que El pasado puede evaluarse, el presente puede

    ser descrito y el futuro puede ser previsto.

    El sistema modular no es sino un encuentro de los alumnos y profesores en espacios diseados y

    establecidos previamente, con mucha inteligencia, seleccin adecuada y pertinente de los contenidos,

    instrumentos y metodologa, cuyos alcances de autoaprendizajes sern coronados en la grandeza de

    los alumnos participantes, especialmente de quienes quedan inmersos en los programas acadmicos a

    distancia, cuya dinmica acadmica se ha estandarizado y responde al uso de las tecnologas

    modernas. En este sentido, el mdulo ha sido diseado para desarrollarlo en dos fases: una a distancia

    y la otra presencial (tutorial) que comprende 10 tutoras presenciales.

    Este mdulo contiene la sumilla, las competencias, los contenidos agrupados en 5 unidades. Unidad 1: Conceptos fundamentales y la organizacin de la informacin, Unidad 2: Medidas de resumen: anlisis e interpretacin de los resultados, Unidad 3: Nociones de probabilidad: propiedades, anlisis combinatorio, Unidad 4: Distribuciones de probabilidad y Unidad 5: Distribuciones muestrales. Adems, en el mismo mdulo se encuentra la metodologa, la evaluacin y la bibliografa. Por ejemplo, se trabajar la metodologa activa, adems, se ejercer la evaluacin de acuerdo con los indicadores, criterios y condiciones registrados en el desarrollo de cada unidad. Este mdulo comprende una bibliografa bsica y especializada.

  • Estadstica General Mg. Mara Vallejos Atalaya

    NDICE

    UNIDAD I: TEORA ESTADSTICA Sesin N1 CONCEPTOS FUNDAMENTALES Y ORGANIZACIN DE LA INFORMACIN

    1.1 Generalidades 1.1.1 Definicin de estadstica 1.1.2. Ramas de la estadstica 1.1.3. Poblacin 1.1.4. Muestra 1.1.5. Unidad estadstica 1.1.6. Dato estadstico 1.1.7. Parmetro 1.1.8. Estadstico o estadgrafo 1.1.9. Variable estadstica

    Sesin N 2 ETAPAS DEL MTODO ESTADSTICO

    2.1. Etapas del mtodo estadstico 2.1.1. Planificacin del estudio 2.1.2. Recoleccin de la informacin

    2.1.2.1. Mtodo de recoleccin de la observacin 2.1.2.2. Muestreo 2.1.2.3. Determinacin del tamao de muestra

    2.1.3. Presentacin u organizacin de la informacin 2.1.3.1. Revisin y correccin de la informacin recogida 2.1.3.2. Presentacin de la informacin mediante cuadros 2.1.3.3. Presentacin de la informacin mediante grficos

    2.1.4. Anlisis e interpretacin de los resultados EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN Sesin N 3 ORGANIZACIN DE LA INFORMACIN: TABLAS Y GRFICOS ESTADSTICOS

    3.1. Tablas de frecuencias o distribucin de frecuencias 3.1.1. Distribucin de frecuencias de una variable discreta 2.1.2. Distribucin de frecuencias para datos agrupados

    Sesin N 4 REPRESENTACIN DE LA INFORMACIN

    4.1. Presentacin de la informacin mediante grficos EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN

    UNIDAD II: MEDIDAS ESTADSTICAS

  • Estadstica General Mg. Mara Vallejos Atalaya

    Sesin N5 MEDIDAS DE RESUMEN 5.1. Anlisis e interpretacin de los resultados

    5.2. Medidas de tendencia central 5.2.1. La media o promedio aritmtico ( x ) 5.2.1. Mediana (Me) 5.1.3. La moda (Mo)

    Sesin N 6 MEDIDAS DE POSICIN

    6.1. Medidas de posicin 6.1.1. Cuartiles (Qi ) 6.1.2. Deciles (Di ) 6.1.3. Percentiles (Pi )

    EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN Sesin N 7 MEDIDAS DE DISPERSIN

    7.1. Medidas de dispersin 7.1.1. Varianza (s2 ) 7.1.2. Desviacin estndar (s ) 7.1.3. Coeficiente de variacin (c.v. % )

    Sesin N 8 MEDIDAS DE FORMA

    8.1. Medidas de forma. 8.1.1. Asimetra (As) 8.1.2. Coeficiente de Kurtosis o apuntamiento (K)

    EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN

    UNIDAD III: PROBABILIDAD Sesin N9 PROBABILIDAD

    9.1. Introduccin 9.2. Anlisis combinatorio

    9.2.1. Factorial de un nmero (!) 9.2.2. Permutaciones 9.2.3 variaciones 9.2.4. Combinaciones 9.2.5. Propiedad

    Sesin N 10 ALGUNOS CONCEPTOS BSICOS DE PROBABILIDAD

    10.1. Algunos conceptos bsicos de probabilidad 10.1.1. Experimento 10.1.2. Espacio muestral

  • Estadstica General Mg. Mara Vallejos Atalaya

    10.1.3. Suceso o evento

    10.1.4. Operaciones con eventos 10.1.5. Eventos mutuamente excluyentes

    10.2. Probabilidad de un evento EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN Sesin N 11

    PROBABILIDAD CONDICIONAL

    11.1. Probabilidad condicional 11.2. Regla de la multiplicacin de eventos 11.4. Teorema de bayes

    EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN

    UNIDAD IV: PROBABILIDAD Y DISTRIBUCIN Sesin N12 PROBABILIDAD BSICA

    12.1. Las distribuciones de probabilidades bsicas 12.2. Las variables aleatorias 12.3. Las distribuciones de probabilidad

    12.3.1. La distribucin binomial 12.3.1.1.1. Propiedades de una distribucin binomial 12.3.1.1.2. Uso de tablas de la distribucin binomial 12.3.1.1.3. Media y desviacin estndar de una distribucin binomial

    12.3.2. La distribucin de poisson 12.3.2.1. La frmula de poisson 12.3.2.2. Uso de tablas de la distribucin acumulada de poisson

    EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN Sesin N 13 DISTRIBUCIN NORMAL

    13.1. Distribucin normal 13.1.1. Uso de tablas de distribucin acumulada normal estndar

    EJERCICIOS PROPUESTOS EVALUACIN AUTOEVALUACIN

    UNIDAD V: DISTRIBUCIONES DE MUESTREO Sesin N14 DISTRIBUCIONES MUESTRALES

    14.1. Distribuciones muestrales 14.2. Muestreo 14.3. Etapas del muestreo 14.4. Las distribuciones muestrales de probabilidad

  • Estadstica General Mg. Mara Vallejos Atalaya

    14.5. Distribuciones de muestreo de estadsticas 14.6. Distribucin muestral de la media

    Sesin N 15 DISTRIBUCIN MUESTRAL DE UNA PROPORCIN

    15.1. Distribucin muestral de una proporcin 15.2. Distribucin muestral de la diferencia de dos medias

    EJERCICIOS PROPUESTOS AUTOEVALUACIN EVALUACIN REFERENCIAS BIBLIOGRFICAS APNDICES

    Apndice N 1 Nmeros aleatorios Apndice N 2 Tabla de la distribucin acumulada binomial Apndice N 3 Distribucin de poisson - trminos acumulativos Apndice N 4 Distribucin acumulativa normal

  • Mg. Mara Vallejos Atalaya

    15

    SUMILLA

    La asignatura de Estadstica General tiene la naturaleza terico- prctico, pertenece al rea de

    Formacin Bsica, con cuatro horas, tres crditos, corresponde al I ciclo de las Carreras Acadmico

    Profesional de Administracin y Contabilidad. Pretende proporcionar los conocimientos necesarios de

    la estadstica, que le permitir investigar, analizar y resolver problemas con el quehacer de su carrera

    profesional, cuyo contenido son: conceptos fundamentales y la organizacin de la informacin, medidas

    de resumen: anlisis e interpretacin de los resultados, nociones de probabilidad, distribuciones de

    probabilidad y distribuciones muestrales.

  • Mg. Mara Vallejos Atalaya

    16

    UNIDAD I: TEORA ESTADSTICA Sesin N1: Conceptos fundamentales y organizacin de la informacin Sesin N2: Etapas del Mtodo Estadstico Sesin N3: Organizacin de la informacin: tablas y grficos estadsticos Sesin N4: Representacin de la Organizacin

  • Mg. Mara Vallejos Atalaya

    17

    CONCEPTUAL PROCEDIMENTAL ACTITUDINAL

    Reconoce los diferentes

    conceptos fundamentales y

    construye tablas y grficos de informacin

    estadstica.

    Reconocen y delimitan la poblacin, muestra y variables en estudio, y

    adems utilizan tablas y grficos adecuados.

    Analizan e interpretan los resultados obtenidos en

    las tablas y grficos estadsticos.

    COMPETENCIAS

  • Mg. Mara Vallejos Atalaya

    16

    Sesin N 1

    CONCEPTOS FUNDAMENTALES Y ORGANIZACIN DE LA INFORMACIN

    1.1 GENERALIDADES

    1.1.1 Definicin de estadstica

    La estadstica es una ciencia que nos proporciona un conjunto de mtodos y tcnicas para la

    recoleccin, clasificacin, presentacin, anlisis e interpretacin de los datos, con la finalidad de

    realizar una toma de decisin ms efectiva.

    1.1.2. Ramas de la estadstica

    Estadstica descriptiva

    Consiste en recolectar, clasificar, presentar y describir los datos vlidos nicamente para la poblacin

    objeto de estudio, utilizando tablas, grficos y algunas medidas de resumen. No se efectan inferencias

    para un grupo mayor.

    Estadstica inferencial

    Se emplea para generalizar conclusiones vlidas para una poblacin a partir de datos obtenidos de

    una muestra extrada de dicha poblacin.

    1.1.3. Poblacin

    Es el conjunto de todos los individuos, objetos u observaciones que poseen al menos una caracterstica

    comn, que son objetos de estudio. Se representa con la letra N.

    La poblacin se define de acuerdo a la caracterstica, unidad estadstica y extensin del problema

    objeto de estudio.

    Ejemplo:

    1. Las edades de los estudiantes de la UPeU.

    2. Los errores que presentan las facturas del supermercado La Unin.

    Respecto a la caracterstica objeto de estudio se puede distinguir:

    a) Poblacin objeto. Considerada como el conjunto de elementos que son objeto de estudio.

    Ejemplo.

    1. Conjunto de los alumnos de la UPeU.

    2. Conjunto de facturas del supermercado La Unin.

    b) Poblacin objetivo. Considerada como el conjunto de observaciones, medidas de la

    caracterstica que es de inters para el estudio de la poblacin objeto.

    Ejemplo.

    1. Conjunto de edades.

    2. Conjunto de errores.

    La poblacin de acuerdo al nmero de elementos que la forman puede ser finita o infinita.

    Poblacin finita: Es aquella que tiene un nmero limitado de elementos.

    Ejemplo:

  • Mg. Mara Vallejos Atalaya

    17

    1. Ventas efectuadas durante un ao en una tienda determinada.

    2. Edades de los alumnos de la UPeU.

    Poblacin infinita: Es aquella que tiene un nmero indeterminado de elementos. No se refiere a que

    no se puede contar, sino que es imposible ubicar a todos los elementos de la poblacin.

    Ejemplo:

    1. Los sntomas de los enfermos tuberculosos de Lima.

    2. Evasin de impuestos de las empresas adscritas al RUC.

    1.1.4. Muestra

    Es un subconjunto o parte de la poblacin. Se examina una muestra cuando no es posible examinar

    una poblacin, ya sea por factores econmicos, disponibilidad de personal o tiempo.

    La muestra debe cumplir dos requisitos bsicos: Debe ser representativa y adecuada.

    Es representativa cuando contiene todos los sectores o aspectos de la poblacin en la misma

    proporcin en que se hallan en la totalidad del universo. La representatividad asegura la calidad de la

    muestra.

    Es adecuada cuando el tamao de la muestra tiene una magnitud suficiente que permita confiar en la

    estabilidad de las caractersticas presentes en la muestra. La adecuacin asegura la confiabilidad de la

    muestra.

    1.1.5. Unidad estadstica

    Es el elemento que pertenece a la poblacin objeto de estudio. Dicho elemento contiene las

    caractersticas, atributos que el individuo o fenmeno puede poseer. Ejemplo:

    1. Para un ingeniero que verifica la calidad de productos elaborados por una empresa, la unidad

    estadstica son los productos terminados.

    2. Para un auditor que verifica los estados financieros de una empresa en el balance general, cuentas

    clientes, la unidad estadstica son las facturas por cobrar.

    1.1.6. Dato estadstico

    Son nmeros o medidas que han sido recopilados como resultado de observaciones que pueden ser

    comparados, analizados e interpretados. Ejemplo:

    1. Si la caracterstica de estudio es la variable X: edad de un grupo de 5 estudiantes. El conjunto de

    datos estadsticos seran los siguientes:

    x1 = 17, x2 = 18, x3 = 21, x4 = 22, x5 = 19

    2. Si la caracterstica de estudio es la variable X: n de errores ubicados en 5 facturas. El conjunto de

    datos estadsticos seran los siguientes:

    x1 = 2, x2 = 5 , x3 = 0, x4 = 4, x5 = 2

    1.1.7. Parmetro

    Es una medida de resumen que describe alguna caracterstica de toda la poblacin objeto de estudio. Para determinar el valor del parmetro se requiere informacin de toda la poblacin.

  • Mg. Mara Vallejos Atalaya

    18

    Las ms usadas son:

    i) Media poblacional ()

    ii) Varianza poblacional (2)

    iii) Desviacin estndar poblacional () iv) Proporcin poblacional (P)

    1.1.8. Estadstico o estadgrafo

    Es una medida de resumen que describe alguna caracterstica de la muestra.

    Las ms usadas son:

    i) Media Muestral ( x ) ii) Varianza muestral (s

    2)

    iii) Desviacin estndar muestral (s) iv) Proporcin muestral (p)

    1.1.9. Variable estadstica

    Es una caracterstica de la poblacin que interesa al investigador y que toma diferentes valores.

    Se denota con las letras: X, Y, Z, etc.

    Ejemplo:

    1. Edad 2. Profesin

    3. Ingreso familiar 4. Estado Civil

    5. Estatura 6. Nivel socioeconmico

    Las variables se pueden clasificar de la siguiente manera:

    a. Variables cualitativas

    Son aquellas caractersticas que no se expresan cuantitativamente, constituidas por atributos.

    Ejemplo:

    - Lugar de procedencia (norte, centro sur, oriente)

    - Estado civil (soltero, casado, viudo, divorciado, conviviente).

    Estas variables a su vez pueden clasificarse segn la escala de medicin en:

    i) Variable cualitativa nominal

    Es aquella que no lleva ninguna ordenacin en sus posibles modalidades (datos estadsticos).

    Ejemplo:

    - Estado civil: soltero, casado, viudo divorciado, conviviente (en estas clasificaciones no hay

    ordenacin jerrquica, si quisiramos forzar la ordenacin y pondramos al soltero en primer lugar,

    quin ira segundo, el casado o el conviviente y luego el viudo o el divorciado).

    - Filiacin religiosa: catlico, adventista, mormn,

    ii) Variable cualitativa ordinal

    Es aquella que busca ordenar sus casos en trminos del grado que posee una determinada

    caracterstica.

    Ejemplo:

    - Nivel socio-econmico: alto, medio, bajo

    - Rendimiento: excelente, bueno regular malo, psimo.

    b. Variables cuantitativas

  • Mg. Mara Vallejos Atalaya

    19

    Es aquella cuyos datos estadsticos son numricos y se obtiene como resultado de mediciones o

    conteos.

    Ejemplo:

    - Sueldos: 800, 1500, 935, 450, - Notas: 12, 19, 16, 08, 10,

    Las variables cuantitativas segn la escala de medicin pueden ser:

    i) Variable cuantitativa de intervalo

    Es aquella que se presenta en intervalos y no necesariamente empieza del cero racional.

    Ejemplo:

    - Temperatura corporal: 36, 37, 38 (una persona no puede tener 0 de temperatura, porque estara

    muerta).

    - Peso: 20kg, 35kg, 58kg.

    Todos los signos vitales son variables cuantitativas de intervalo.

    ii) Variable cuantitativa de razn

    Es aquella que necesariamente empieza del cero racional.

    Ejemplo:

    - Notas: 0, 1, 2, 3, , 20 (empieza desde cero) - Edad: 0, 1, 2,

    Las variables cuantitativas segn su naturaleza pueden ser:

    i) Variable discreta

    Son aquellas que toman valores numricos aislados y no pueden tomar ningn valor entre dos

    nmeros consecutivos fijados (slo asume nmeros enteros).

    Ejemplo:

    - N de hijos: 0, 1, 2, 3, (no puede existir 2.5 porque sera ilgico pensar en 2 hijos y medio) - N de facturas que presentan errores: 0, 1, 2, 3,

    ii) Variable continua Son aquellas que pueden tomar infinitos valores entre dos nmeros, por muy prximos que los fijemos,

    es decir, se presentan valores enteros as como decimales. Ejemplo:

    - Peso: 62.55 kg, 72.40 kg, 56.35 kg,...

    - Talla: 1.50 mt, 1.65 mt, 1.85 mt,

  • Mg. Mara Vallejos Atalaya

    20

    Sesin N 2

    ETAPAS DEL MTODO ESTADSTICO

    2.1. ETAPAS DEL MTODO ESTADSTICO

    De acuerdo con el orden de aplicaciones de la estadstica a un problema determinado, los mtodos

    estadsticos se dividen en cuatro etapas:

    1. Planificacin del estudio.

    2. Recoleccin de la informacin.

    3. Presentacin u organizacin de la informacin.

    4. Anlisis e interpretacin de los resultados.

    2.1.1. Planificacin del estudio

    Estudia los detalles concernientes a la recoleccin, clasificacin y anlisis de la informacin. En base a

    lo cual se definirn caractersticas de la poblacin o se negarn o confirmarn una hiptesis de trabajo.

    En esta etapa se pueden considerar los siguientes aspectos:

    - Planteamiento del problema.

    - Bsqueda y evaluacin de la informacin existente.

    - Formulacin de hiptesis.

    - Verificacin de la hiptesis.

    - Anlisis y presentacin de los resultados.

    2.1.2. Recoleccin de la informacin

    Los principales puntos que deben considerarse al recoger la informacin son: - Los errores que puedan cometerse en la recoleccin de los datos y la manera de controlarlos.

    - Las ventajas y limitaciones de los diversos mtodos empleados en la recoleccin de la informacin.

    - Las condiciones que deben reunir los individuos que se estudian y los procedimientos ms

    convenientes para su eleccin.

    - El diseo de los formularios que servirn para registrar la informacin que se recoja.

    2.1.2.1. Mtodo de recoleccin de la observacin

    a. Directa.- Cuando los datos son recolectados directamente de la fuente de origen. sta puede ser mediante la observacin o el interrogatorio. b. Indirecta.- Cuando los datos provienen de datos recogidos por otros individuos en este caso se habla de fuentes secundarias.

    En cuanto al tiempo, la recoleccin de datos puede clasificarse en: Continuas: Cuando son registradas a medida que ocurren. Ejemplo:

  • Mg. Mara Vallejos Atalaya

    21

    Registro civil de hechos vitales (nacimientos, defunciones y casamientos). Peridicas: Cuando est hecho en determinados intervalos de tiempo (forma cclica). Ejemplo: Censos hechos en el Per cada 10 aos. Ocasionales: Cuando se efecta en cualquier poca. Ejemplo: Estudios de investigacin realizados por algn investigador.

    2.1.2.2. Muestreo

    Es la tcnica mediante la cual se obtiene la muestra representativa y adecuada.

    VENTAJAS Y LIMITACIONES DEL MUESTREO

    a. Permite conocer con relativa aproximacin determinada caracterstica de una poblacin de gran

    tamao, dentro de un costo razonable y en menor tiempo.

    b. Permite mayor exactitud de los resultados, puesto que los factores artificiales de variacin pueden

    controlarse.

    c. Cuando la poblacin es infinita o muy grande, entonces, el estudio slo podr realizarse a travs de

    una muestra.

    d. Cuando se trata de ensayos destructivos o no recuperables, necesariamente se tendr que utilizar

    una muestra.

    e. Una limitacin de la muestra, es que, por buena que pueda ser la muestra y los cuidados puestos

    en ella, siempre existe el sesgo debido a factores aleatorios. Dicho riesgo debe ser establecido a

    priori por el investigador de modo que se tenga suficiente garanta de la muestra seleccionada.

    2.1.2.3. Determinacin del tamao de muestra

    Se determina el tamao de muestra utilizando la frmula siguiente, para una muestra sacada de una

    poblacin finita cuya fuente es Arkin y Colton.

    21 1N

    nN k

    NOTAS

    Donde:

    n = tamao de la muestra (nmero de elementos de la muestra)

    N = tamao de la poblacin (nmero de elementos de la poblacin)

    k = error de muestreo.

    Ejemplo:

    Seleccionar el tamao de la muestra para la poblacin que est constituida por 1500 estudiantes de la

    UPeU, utilizando un error de muestreo del 25% y 5%.

    Solucin:

    si: k = 25%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =

    25/100 = 0.25

    2

    150015.84 16

    1500 1 0.25 1n alumnos

  • Mg. Mara Vallejos Atalaya

    22

    si: k = 5%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =

    5/100 = 0.05.

    2

    1500315.96 316

    1500 1 0.05 1n alumnos

    2.1.3. Presentacin u organizacin de la informacin

    Se consideran los tres pasos siguientes:

    1. Revisin y correccin de la informacin recogida.

    2. Presentacin de la informacin mediante cuadros.

    3. Presentacin de la informacin mediante grficos.

    2.1.3.1. Revisin y correccin de la informacin recogida

    Se debe revisar y corregir:

    a) La escritura.

    b) Las respuestas inconsistentes.

    c) Las respuestas incompletas.

    d) Las unidades en las cifras son diferentes.

    2.1.3.2. Presentacin de la informacin mediante cuadros

    Despus de la revisin de los datos recopilados, es conveniente presentar la informacin, de acuerdo a

    algn sistema de ordenacin, a fin de describirlos y analizarlos.

    2.1.3.3. Presentacin de la informacin mediante grficos

    Los grficos ms usados son:

    a. Histograma de frecuencias

    b. Polgono de frecuencias

    c. Polgono de frecuencias acumuladas u ojiva

    d. Barras

    e. Bastones

    f. Sectores

    g. Series de tiempo

    2.1.4. Anlisis e interpretacin de los resultados

    Para el anlisis e interpretacin de los resultados nos basamos en los cuadros y grficos, y en las

    medidas de resumen de la serie de datos.

    EJERCICIOS PROPUESTOS

    1. Indique cules de los trminos u operaciones siguientes se relacionan con una muestra o con una

    poblacin:

    a) grupo de medidas llamados parmetros b) uso de inferencia estadstica c) hacer un censo

    d) juzgar la calidad de un embarque de fruta inspeccionando varios de los bultos incluidos en el

  • Mg. Mara Vallejos Atalaya

    23

    embarque.

    2. En los siguientes enunciados, indicar si se trata de una Muestra (M) o una Poblacin (P):

    a) Nmero de estudiantes egresados del Instituto YI en el ao 2004 b) Estudio de personas con proceso judicial por trfico de drogas en el ao 2000 c) Nmeros de nios nacidos vivos en el hospital X d) Estudio del 25% de pacientes con tuberculosis del distrito DF

    3. Elabore una lista de 10 variables. Luego:

    a. Identifique la poblacin objeto. b. Identifique la poblacin objetivo. c. Determine la unidad estadstica. d. Mencione algunos datos estadsticos.

    4. Clasificar las siguientes variables en cualitativas (nominal y ordinal) y cuantitativas (discreta y

    continua).

    a. rendimiento acadmico b. velocidad de lectura c. peso contenido en un paquete de cereales d. categora de docente e. nmero de artculos defectuosos producidos f. nmero de unidades de un artculo en existencia g. grado de desnutricin h. asistencia a los cultos devocionales i. patrn conductual j. cultura organizacional k. tipo de alimentacin l. nmero de hermanos m. grado de instruccin n. estado civil.

    5. Clasifique las variables e indique el tipo de escala en que estn medidas las siguientes caractersticas:

    a) Profesin b) Ao de nacimiento c) Nacionalidad d) Grado de instruccin e) ingreso mensual familiar promedio f) Nmero de telfono g) Grado de instruccin h) Nmero de hijos

    6. Utilizando la frmula determine el tamao de la muestra, considerando los datos que se mencionan a continuacin.

    a). N = 1 500 k = 3% b) N = 2 000 k = 10% c) N = 5 000 k = 2% d) N = 500 k = 10% e) N = 1 000 k = 5%

    7. En el siguiente enunciado identifique: poblacin, muestra, unidad estadstica, parmetro,

    estadstico, variable(s), tipo de variable(s) y d 2 ejemplos de dato estadstico.

    Con la finalidad de mejorar el servicio de la Biblioteca de la UPeU" se decidi realizar un estudio de investigacin, para lo cual se seleccion aleatoriamente a 45 estudiantes usuarios de la biblioteca obtenindose los siguientes resultados:

    - En promedio un alumno dedica 1 hora a la lectura en sala.

  • Mg. Mara Vallejos Atalaya

    24

    - El 80% afirma que la atencin es buena. - El 10% de los usuarios son recin ingresantes a la UPeU. - En promedio un alumno se lleva 1.5 libros a su casa.

    8. Identifique en cada caso: unidad elemental, variable, tipo de variable

    a) consumo mensual de electricidad b) opinin acerca de la gestin de un ministro c) peso de nios de 5 aos d) estado civil e) nmero de artculos defectuosos producidos por las mquinas de una fbrica f) nacionalidad de personas que asisten a un congreso.

  • Mg. Mara Vallejos Atalaya

    28

    Autoevaluacin

    CONCEPTUAL

    1. Seale con una V si es verdadero o F si es falso en los siguientes enunciados:

    a) ( ) Una muestra es representativa si sta contiene todas las

    caractersticas de la muestra. b) ( ) La variable es una caracterstica que asume diferentes valores. c) ( ) Para que una poblacin est bien definida, debe contener la

    caracterstica, unidad estadstica y extensin. d) ( ) Las ramas de la estadstica son: estadstica descriptiva e inferencial. e) ( ) Las variables cualitativas son aquellas que son numricas y se

    obtiene como resultado del conteo

    PROCEDIMENTAL

    2. Los mtodos de recoleccin de la informacin son: directa e indirecta. Cul

    es la diferencia entre ambas?

    3. Dadas las siguientes variables, colocar en la tabla en el lugar donde le

    corresponde de acuerdo a su naturaleza y escala de medicin.

    a. Estudios diarios e. Grado de instruccin b. Lugar de procedencia f. Sueldos c. Velocidad de lectura g. Gastos d. Idiomas h. Rendimiento i. Estado civil j. Edad k. Estatura l. Categora de docente

    Variable cualitativa Variable cuantitativa

    Nominal Ordinal Discreta Continua

    4. Utilizando la frmula determine el tamao de la muestra, considerando los

    datos que se mencionan a continuacin.

    a) N = 500 k = 10% b) N = 1 000 k = 5% c) N = 1 500 k = 3% d) N = 2 000 k = 10%

    ACTITUDINAL

    5. Considerando los conocimientos adquiridos en esta tutora identificar las

    clases de variables estadstica, su naturaleza, y de esta manera poder realizar un estudio estadstico.

  • Mg. Mara Vallejos Atalaya

    29

    Sesin N 3

    ORGANIZACIN DE LA INFORMACIN: TABLAS Y GRFICOS ESTADSTICOS

    3.1. TABLAS DE FRECUENCIAS O DISTRIBUCIN DE FRECUENCIAS

    Una distribucin de frecuencias (o tabla de distribucin de frecuencias) es una representacin de una

    serie de datos. En ella se muestra cmo se distribuyen los valores de la variable estadstica junto a sus

    frecuencias correspondientes a cada uno de ellos.

    En estas tablas de distribucin de frecuencias, como producto de la operacin de tabulacin (conteo),

    se observa cuantos elementos (frecuencia o repeticin) hay en cada categora, valor o intervalo de la

    variable.

    Luego de la revisin de los datos recopilados, es conveniente presentar la informacin, de acuerdo a

    algn sistema de ordenacin, a fin de describirlos y analizarlos. A continuacin se presenta algunos

    conceptos y procedimientos comunes para la presentacin de cuadros o tablas.

    Frecuencia absoluta simple ( if ): Se llama al nmero de veces que aparece repetido dicho valor, en

    un conjunto de valores realizadas. La suma de todas las frecuencias es igual al total n de datos observados.

    Se denota mediante: if

    Propiedad: nffffm

    i

    im 1

    21 ...

    Frecuencia absoluta acumulada (Fi): Es igual a la suma de las frecuencias absolutas simples

    inferiores o iguales a las frecuencias acumuladas que se desea encontrar.

    Se denota mediante: iF

    Propiedad:

    qfF 1

    212 ffF

    . . .

    mm fffF ...21

    Frecuencia relativa simple ( ih ): Es el cociente entre la frecuencia absoluta simple de su fila y el nmero total de observaciones realizadas (n). La suma de todas las frecuencias relativas es igual a 1.

    Su frmula es: n

    fh ii

    Se denota mediante: ih

  • Mg. Mara Vallejos Atalaya

    30

    Propiedad: 1...1

    21

    m

    i

    im hhhh

    Frecuencia relativa acumulada ( iH ): Se llama al cociente entre la frecuencia absoluta acumulada de su fila y el nmero de observaciones realizadas (n).

    Su frmula es: n

    FH ii

    Se denota mediante: iH

    Propiedad:

    qhH 1

    212 hhH

    . . .

    mm hhfH ...21

    Para presentacin de la informacin mediante cuadros o tablas, es necesario construir la tabla de

    distribucin de frecuencias. La cual puede ser:

    3.1.1. Distribucin de frecuencias de una variable discreta

    Una distribucin de frecuencias es un arreglo de los valores observados x1,...xm de una variable X con

    sus respectivas frecuencias, en una tabla de la forma:

    Valores

    de X

    fi Fi hi Hi

    x1 x2

    .

    .

    .

    xk

    f1 f2

    .

    .

    .

    Fm

    F1 F2

    .

    .

    .

    F m= n

    h1 h2

    .

    .

    .

    Hm

    H1 H2

    .

    .

    .

    Hm = 1

    Total fi=n hi=1

    Ejemplo:

    Dadas las edades de 12 estudiantes de la UPeU, construir la tabla de distribucin de frecuencias.

    EDAD (X): 19, 20, 23, 20, 18, 20, 25, 18, 18, 20, 25, 23.

    Solucin

    EDAD fi Fi hi Hi

    18

    19

    20

    23

    25

    3

    1

    4

    2

    2

    3

    4

    8

    10

    12

    0.25

    0.08

    0.33

    0.17

    0.17

    0.25

    0.33

    0.66

    0.83

    1.00

    Total 12 1.00

    La suma de las frecuencias relativas simples (hi) siempre debe ser igual a uno, en caso de error de

    redondeo no diera 1, hay que ajustar, es decir, hay que sumar o restar 1 dgito a cualquier nmero para

    conseguir la suma de 1.

    f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 4.

  • Mg. Mara Vallejos Atalaya

    31

    F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 10.

    h3: Indica la fecuencia relativa absoluta simple de la tercera fila y corresponde al nmero 0.33. Para

    interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza

    multiplicando el nmero por 100, as 0.33x100 = 33%.

    H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.83. Para

    interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se

    realiza multiplicando el nmero por 100, as 0.83x100 = 83% Interpretacin:

    f3: Existen 4 alumnos que tienen 20 aos de edad. F4: Existen 10 alumnos cuyas edades varan de 18 a 23 aos. h3: El 33% de los alumnos que tienen 20 aos de edad. H4: El 83% de los alumnos tienen edades que varan de 18 a 23 aos. Las frecuencias absolutas interpretan la variable en su fila, en cambio las frecuencias acumuladas interpretan desde el principio hasta su fila.

    Observacin:

    Cuando se realiza una observacin en una muestra o en una poblacin, se puede presentar los

    siguientes casos: Que se hayan hecho pocas observaciones y por lo tanto, la variable estadstica tome pocos

    valores.

    Que se hayan hecho muchas observaciones y sin embargo, la variable estadstica toma muy pocos

    valores diferentes.

    Que se hayan hecho muchas observaciones y la variable toma muchos valores distintos.

    (*) Los dos primeros casos caern dentro del estudio de variable discreta.

    (*) El tercer caso se agrupar los valores de la variable en intervalos adecuadamente para no perder

    mucha informacin.

    2.1.2. Distribucin de frecuencias para datos agrupados

    Es una tabla en donde los datos originales se clasifican en intervalos de clase.

    Para la elaboracin de esta tabla se debe tener en cuenta las definiciones siguientes:

    - Intervalos o lmites de clase: se identifica por tener su lmite superior y su lmite inferior. Los

    extremos de los intervalos no se repiten.

    Ejemplo:

    15-19 LCI=15 y LCS=19

    20-24

    25-29

    - Amplitud intervlica (c): Llamado tambin ancha de clase, es la cantidad de datos que estn

    comprendidos en un intervalo de clase.

    - Marca de clase (Xi): Es el punto medio del intervalo de clase:

    2i

    LCI LCSX

  • Mg. Mara Vallejos Atalaya

    32

    Ejemplo:

    La marca de clase para el primer intervalo ser:

    15 1917

    2iX

    REGLA GENERAL PARA LA CONSTRUCCIN DE UNA DISTRIBUCIN DE FRECUENCIAS DE

    UNA VARIABLE CONTINUA AGRUPADA EN INTERVALOS

    Dado n valores de una variable cuantitativa X continua, o discreta con ms de 20 valores distintos, uno de los mtodos para construir la distribucin de frecuencias es:

    1) Determinar el Rango: R El rango de variacin de los datos se define por:

    mnmx XXR 2) Determinar el Nmero de intervalos: k Utilizando la regla de Sturges:

    1 3.322log( )k n

    n: Nmero total de datos. Observacin: El resultado que se obtenga de k ser redondeado al entero inmediato mayor. Ejemplo:

    Si 6.32k entonces, 7k (Nmero de intervalos igual a 7). Si 6.84k entonces, 7k (Nmero de intervalos igual a 7). 3) Determinar la Amplitud del intervalo: c La amplitud del intervalo se obtiene dividiendo el rango entre el nmero de intervalos.

    Rc

    k

    4) Determinar los extremos de los intervalos

    Ejemplo:

    Los siguientes datos son puntajes del cociente de inteligencia (CI) de 50 alumnos de la UPeU. Con

    base en estos puntajes, preparar la tabla de distribucin de frecuencias.

    PUNTAJES DEL COCIENTE DE INTELIGENCIA (CI)

    DE 50 ESTUDIANTES DE LA UPeU

    91 104 113 125 101

    114 105 101 89 126

    118 100 111 125 109

    119 95 106 120 129

    89 113 118 127 129

    128 107 89 122 89

    114 106 105 115 98

    112 103 92 125 107

    97 104 105 95 91

    106 93 89 100 115

  • Mg. Mara Vallejos Atalaya

    33

    1) Determinar el Rango: R El rango de variacin de los datos se define por:

    mnmx XXR 2) Determinar el Nmero de intervalos: k Utilizando la regla de Sturges:

    1 3.322log( )k n

    n: Nmero total de datos. Observacin: El resultado que se obtenga de k ser redondeado al entero inmediato mayor. Ejemplo:

    Si 6.32k entonces, 7k (Nmero de intervalos igual a 7). Si 6.84k entonces, 7k (Nmero de intervalos igual a 7). 3) Determinar la Amplitud del intervalo: c La amplitud del intervalo se obtiene dividiendo el rango entre el nmero de intervalos.

    Rc

    k

    4) Determinar los extremos de los intervalos

    Tabla N 1

    DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA

    UPeU

    Lmite de

    clase

    Yi fi Fi hi Hi

    88 94 94 100 100 106 106 112 112 118 118 124 124 130

    91

    97

    103

    109

    115

    121

    127

    9

    6

    11

    5

    8

    3

    8

    9

    15

    26

    31

    39

    42

    50

    0.18

    0.12

    0.22

    0.1

    0.16

    0.06

    0.16

    0.18

    0.3

    0.52

    0.62

    0.78

    0.84

    1.00

    50 1.00

    f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 11. F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 31. h3: Indica la relativa absoluta simple de la tercera fila y corresponde al nmero 0.22. Para interpretar se

    debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza multiplicando al nmero por 100, as 0.22x100 = 22% .

    H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.62. Para

    interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza multiplicando al nmero por 100, as 0.62x100 = 62%

    Interpretacin: f3: Existen 11 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que

    vara de 100 a 106 puntos.

  • Mg. Mara Vallejos Atalaya

    34

    F4: Existen 31 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que vara de 106 a 112 puntos

    h3: El 20% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de

    100 a 106 puntos H4: El 62% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de

    106 a 112 puntos Las frecuencias relativas interpretan la variable en su fila, en cambio, las frecuencias acumuladas interpretan la variable desde el principio hasta su fila.

    CUIDADOS EN LA PRESENTACIN DE CUADROS ESTADSTICOS

    A continuacin sealamos los elementos necesarios que deben tenerse en cuenta para la presentacin

    de informacin estadstica mediante cuadros.

    1. N de cuadro

    2. Ttulo: Debe responder las siguientes preguntas:

    a. Qu informacin contiene el cuerpo del cuadro?

    Ej. Cociente de inteligencia de 50 alumnos

    b. Dnde fue tomada la informacin?

    Ej. ...en la UPeU Lima

    c. Cundo fue tomada la informacin?

    Ej. ...Enero, 1995

    3. Los encabezados: Corresponde a la identificacin de la variable y las frecuencias.

    4. Columna matriz: corresponde a las categoras de clasificacin de la variable.

    5. Cuerpo del cuadro: Corresponde a la informacin numrica, generalmente frecuencias absolutas y

    relativas.

    6. Fuente: Sealar el medio de informacin que condujo al conjunto de datos.

    Ej. Test aplicado por los investigadores

    7. Notas: son colocadas para esclarecimiento.

    8. Comentarios: sirve para aclarar minucias en relacin a cada celda.

    Para nuestro ejemplo visto anteriormente el cuadro ser:

    CUADRO N 1

    COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA, 2004

    COCIENTE DE

    INTELIGENCIA

    N DE

    ALUMNOS

    %

    88 94

    94 100

    100 106

    106 112

    112 118

    118 124

    124 130

    9

    6

    11

    5

    8

    3

    8

    18

    12

    22

    10

    16

    6

    16

    TOTAL 50 100

    Fuente: Test aplicado por los investigadores.

  • Mg. Mara Vallejos Atalaya

    35

    Sesin N 4

    REPRESENTACIN DE LA INFORMACIN 4.1. PRESENTACIN DE LA INFORMACIN MEDIANTE GRFICOS

    Los grficos ms usados son:

    a. Histograma de frecuencias

    b. Polgono de frecuencias

    c. Polgono de frecuencias acumuladas u ojiva

    d. Barras

    e. Bastones

    f. Sectores

    g. Series de tiempo

    a. Histograma de frecuencias

    Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos de clase,

    mediante una serie de intervalos continuos.

    Se usa:

    Cuando se tiene una variable cuantitativa continua

    Se construye:

    1. Se coloca los intervalo de clase en el eje horizontal (eje de las abscisas o eje x).

    2. Se levanta cada intervalo a la altura de la frecuencia absoluta simple o relativa simple.

    Ejemplo:

    Considere el ejemplo de tabla de distribucin de frecuencia para datos agrupados del Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.

  • Mg. Mara Vallejos Atalaya

    36

    b. Polgono de frecuencias

    Se usa:

    Cuando se tiene una variable cuantitativa continua y econmica.

    Se construye:

    1. Se ubica en el eje x la marca de clase y se considera el punto medio,

    2. Se levanta el punto de la marca de clase a la altura de la frecuencia absoluta simple o relativa

    simple,

    3. Luego de marcar los puntos, unirlos,

    4. Finalmente, unir los extremos al eje de las abscisas.

    Ejemplo:

    Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual

    estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.

    c. Polgono de frecuencias acumuladas u ojivas

    Se usa:

    Cuando la frecuencia acumulada es de inters.

    Se construye:

    1. Se ubica en el eje x la marca de clase.

    2. Se levanta el punto del extremo superior de cada lmite de intervalo de clase a la altura de la

    frecuencia absoluta acumulada o relativa acumulada.

    3. Luego de marcar los puntos, unirlos

    4. Finalmente, unir los extremos al eje de las abscisas.

    Ejemplo:

    Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual

    estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU

    10

    9

    8

    7

    6

    5

    4

    3

    2

    1

    91 97 103 109 115 121 127

    9

    6

    11

    5 8

    3

    8

    fi

    x

  • Mg. Mara Vallejos Atalaya

    37

    d. Barras

    Se representa mediante una serie de rectngulos separados

    Se usa:

    Para representar variables cualitativas.

    Se construye:

    1. Se ubica en el eje x las categoras de la variable, utilizando intervalos y separando

    aproximadamente la mitad del intervalo entre una categora y otra.

    2. Se levanta cada intervalo de la categora que corresponde a la variable, a la altura de la frecuencia

    absoluta simple o relativa,

    Ejemplo:

    Facultad N de alumnos

    1. Ciencias Contables y Administrativas

    2. Teologa

    3. Ciencias de la Salud

    4. Educacin y Ciencias Humanas

    5. Ingeniera

    500

    200

    250

    250

    300

    Total 1500

    e. Bastones

    Tiene la forma de alfileres.

    Se usa:

    50

    45

    40

    35

    30

    25

    20

    15

    10

    5

    88 94 100 106 112 118 124 130

    9

    15

    26

    31

    39

    42

    50

    fi

    x

    50

    0 45

    0 40

    0 35

    0 30

    0 25

    0 20

    0 15

    0 10

    0 50

    1 2 3 4 5

    50

    0

    20

    0

    25

    0

    30

    0

    fi

    x

    25

    0

  • Mg. Mara Vallejos Atalaya

    38

    Para representar una variable cuantitativa discreta.

    Se construye:

    1. Se ubica en el eje x los valores de la variable, separando equitativamente entre uno y otro valor,

    2. Se levanta utilizando una lnea recta para cada valor de la variable, a la altura de la frecuencia

    absoluta simple o relativa y se termina con un punto, en forma de alfiler.

    Ejemplo:

    No de Hijos (xi) 0 1 2 3 4 5

    N de familias (fi) 3 7 12 20 15 5

    NOTAS

    f. Sectores

    Se representa mediante un crculo particionado.

    Se usa:

    Para representar una variable cualitativa cuyo principal inters es conocer su frecuencia relativa.

    Se construye:

    1. Se particiona a una circunferencia equitativamente, considerando que sta constituye el 100%,

    2. Se efecta la particin, segn la frecuencia relativa simple lo considere y se ubican las categoras

    de la variable en cada particin.

    Ejemplo:

    Rubro hi %

    Diezmo

    Vivienda

    Alimentacin

    Vestido

    Educacin

    Recreacin

    Otros

    10

    20

    30

    10

    20

    5

    5

    Total 100

    20

    15

    10

    5

    1 2 3 4 5

    7

    12

    20

    5

    fi

    x

    15

    3

    ALIMENTACIN 30%

    EDUCACIN

    20%

    RECREAC. 5%

    DIEZMO 10%

    VESTIDO 10%

    OTROS 5%

    VIVIENDA 20%

  • Mg. Mara Vallejos Atalaya

    39

    g. Series de tiempo

    Son curvas idnticas al del polgono de frecuencias pero sus extremos no tocan el eje de las abscisas.

    Se usa:

    Cuando la variable de inters es el tiempo.

    Ejemplo:

    N DE ALUMNOS INGRESANTES A LA UPeU DE TRES

    COLEGIOS DIFERENTES 1991-1995

    AOS N DE ALUMNOS INGRESANTES

    COLEGIO 1 COLEGIO 2 COLEGIO 3

    1991

    1992

    1993

    1994

    1995

    10

    15

    20

    25

    35

    20

    25

    20

    25

    25

    15

    20

    25

    20

    25

    CUIDADOS EN LA PRESENTACIN DE GRFICOS ESTADSTICOS

    A continuacin sealamos los elementos necesarios que deben tenerse en cuenta para la presentacin

    de informacin estadstica mediante grficos.

    1. N de grfico

    2. Ttulo: Debe responder las siguientes preguntas:

    a. Qu informacin contiene el cuerpo del cuadro?

    Ej. Cociente de inteligencia de 50 alumnos

    b. Dnde fue tomada la informacin?

    Ej. ...en la UPeU Lima

    c. Cundo fue tomada la informacin?

    Ej. ...Setiembre, 1994

    3. Representacin grfica (sealar escalas).

    4. Leyenda (si fuere necesario).

    5. Fuente.

    6. Nota (en caso de ser necesario).

    0

    5

    10

    15

    20

    25

    30

    35

    40

    1991 1992 1993 1994 1995

    COLEGIO 1

    COLEGIO 2

    COLEGIO 3

    X

    AOS

    fi

  • Mg. Mara Vallejos Atalaya

    40

    Ejemplo:

    La representacin grfica para el ejemplo de datos agrupados de los datos del Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.

    GRFICO N 1

    COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA,

    2001

    Fuente: Test aplicado por los investigadores.

    EJERCICIOS PROPUESTOS 1. En una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por sus

    colores: Amarillo (A), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas: B, R, R, B, R, A, A, B, B, A B, A, A, R, B, A, B, R, B, A

    a) Construir la distribucin de frecuencias b) Graficar la distribucin

    2. La tabla muestra la distribucin del ingreso familiar correspondiente a 80 familias:

    Ingresos fi Fi hi

    160 170

    170 180

    180 190

    190 200

    200 210

    48 60 0,125 0,075

    a) Determinar el nmero de familias que ganan menos de 200 nuevos soles

    3. Para cada uno de los siguientes ejercicios construir:

    a) La tabla de distribucin de frecuencias

    b) El grfico adecuado

    c) Interpretacin

    3.1. Los siguientes datos proporcionan las remuneraciones de 50 obreros.

    730 470 672 820 670 610 800 670

    600 700 650 700 570 850 590 700

  • Mg. Mara Vallejos Atalaya

    41

    570 730 770 580 609 700 574 578

    730 663 569 720 860 766 456 258

    378 930 848 860 748 777 640 560

    730 640 708 461 685 630 720 840

    650 740

    3.2. Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en

    cm)

    151 152 154 155 159 159 160 161 161 161 161 162 163 163 164 165 166 165 166 166 166 166 166 167 167 167 167 168 168 168 168 168 168 168 168 168 168 169 169 169 169 169 169 169 169 170 170 170 170 170 170 170 171 171 171 172 172 172 173 173 173 173 174 174 174 175 175 175 176 176 176 176 176 177 177 177 177 178 178 178 179 179 180 180 180 181 181 181 181 182 182 182 183 184 185 186 187 188 189 190

    3.3 El gerente de una compaa registra el nmero de cierto trabajo, completados por los

    empleados. Cincuenta empleados realizan el mismo trabajo, divididos en dos grupos de 25

    y en salones diferentes.

    En el saln A, el gerente registra el siguiente nmero de unidades completadas por da:

    21 22 20 15 25 30 28

    29 28 30 24 29 27 34

    38 24 35 36 31 41 32

    43 44 53 50

    En el saln B los datos son los siguientes:

    16 21 13 36 18 24 32

    16 18 20 28 25 33 26

    30 26 20 35 45 59 32

    31 30 40 30

    a) Combinar todos los puntajes y obtener la distribucin de frecuencias con tamao de clase

    k=10.

    b) Obtener la distribucin de frecuencias por cada saln y realice la grfica adecuada.

    4. Se tiene la siguiente tabla de frecuencias relativas de 300 empleados segn su edad.

    EDADES hi

    19-21

    22-24

    25-27

    28-30

    31-33

    0.15

    0.25

    0.40

    0.10

    0.10

    a) Cuntos empleados tienen edades entre 22 y 30 aos?

    b) Qu porcentaje de empleados tienen 25 aos o ms?

    c) Qu porcentaje de empleados tienen 24 aos o menos?

    d) Una empresa que se dedica a preparar dietas, proyecta lanzar al mercado una dieta rigurosa.

    Los empleados de una compaa se presentaron como voluntarios para dicha promocin. Se

    realiz un muestreo con 80 empleados elegidos aleatoriamente. Los resultados del chequeo

    de los pesos (en Kg), fueron los siguientes:

    80.6 65.8 49.6 79.1 84.4 66.2 79.3 59.4 72.9 73.6

    53.2 60.2 91.2 74.8 78.6 81.4 58.6 68.2 67.4 55.6

    76.9 77.4 67.9 63.7 49.9 46.4 68.8 67.3 72.3 75.8

  • Mg. Mara Vallejos Atalaya

    42

    88.3 94.6 57.3 87.3 74.3 73.2 90.4 76.3 52.7 71.7

    75.6 41.8 73.6 71.4 83.2 67.4 99.3 62.3 89.2 86.8

    65.2 62.1 44.8 82.9 81.7 70.4 74.6 76.9 85.7 40.9

    54.2 75.3 50.1 61.1 42.3 68.6 56.2 70.8 47.3 66.9

    80.2 60.2 71.6 77.1 94.9 61.4 82.1 78.3 51.2 79.3

    a) Elaborar la distribucin de frecuencias

    b) Cuntos empleados tienen pesos entre 45 y 60 kg?

    c) Qu porcentaje de empleados tienen pesos mayores que 75.5 Kg?

  • Mg. Mara Vallejos Atalaya

    42

    Autoevaluacin

    CONCEPTUAL

    1. Seale con una V si es verdadero o F si es falso en los siguientes enunciados:

    a) ( ) Una tabla estadstica representa a la informacin en forma organizada.

    b) ( ) La marca de clase es el punto medio de los intervalos de clases.

    c) ( ) F3 indica la frecuencia acumulada relativa simple de la tercera fila.

    d) ( ) La suma de las frecuencias relativas simples debe ser igual a uno.

    e) ( ) El histograma de frecuencia se utiliza para una distribucin de frecuencias

    agrupadas en intervalos de clase.

    PROCEDIMENTAL

    2. A continuacin se presentan las notas de 50 alumnos:

    60

    65

    71

    47

    80

    53

    41

    39

    94

    94

    85

    74

    35

    54

    61

    77

    55

    60

    98

    88

    33

    57

    81

    68

    41

    45

    78

    76

    66

    89

    52

    50

    91

    48

    66

    65

    35

    55

    69

    73

    77

    64

    73

    85

    42

    84

    74

    59

    67

    65

    Se pide:

    a) Determinar el rango.

    b) Nmero de clases o filas.

    c) Amplitud de las clases o filas.

    d) Frecuencias absolutas y relativas simples, absolutas y relativas acumuladas.

    Interpretar por lo menos 2 de cada fila.

    3. Al investigar el nivel socioeconmico en los valores: Bajo (B), medio (M), alto (A), 20

    familias dieron las siguientes respuestas:

    M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B

    Construir la distribucin de frecuencia y trazar su grfica.

    4. Dibujar un diagrama de sectores para mostrar los gastos de un hospital de una gran

    ciudad, siendo stos los siguientes: 73% en sueldos, honorarios profesionales

    mdicos y bonificaciones a los empleados; 13% en suministros, equipo mdico y

    quirrgico; 8% en mantenimiento, alimentacin y energa; y 6% en costos

    administrativos. ACTITUDINAL

    5. Considerando los conocimientos adquiridos en la primera unidad, qu aconsejaras

    a un empresario que necesita tomar decisiones acertadas para el buen

    funcionamiento de su negocio?

  • Mg. Mara Vallejos Atalaya

    43

    UNIDAD II: MEDIDAS ESTADSTICAS Sesin N5: Medidas de resumen Sesin N6: Medidas de posicin Sesin N7: Medidas de dispersin Sesin N8: Medidas de forma

  • Mg. Mara Vallejos Atalaya

    44

    CONCEPTUAL PROCEDIMENTAL ACTITUDINAL

    Reconoce los conceptos de las medidas de resumen, como las de tendencia central, de posicin, de dispersin y de forma, de una serie de datos.

    Calcular las diversas medidas de resumen para una serie de datos.

    Identifican y reconocen qu medidas de resumen son adecuadas para el anlisis de una serie de datos.

    COMPETENCIAS

  • Mg. Mara Vallejos Atalaya

    67

    Sesin N 5

    MEDIDAS DE RESUMEN

    5.1. Anlisis e interpretacin de los resultados

    Se estudi los cuadros y grficos estadsticos en la unidad anterior como formas para ordenar y

    describir un conjunto de datos para tomar decisiones. Sin embargo, el anlisis resulta incompleto, para

    esto se utiliza ciertos indicadores.

    Estos indicadores llamados medidas de resumen o ESTADGRAFOS permiten hallar un solo valor

    numrico, el mismo que representa a toda la poblacin o muestra en estudio.

    Los estadgrafos o medidas de resumen ms importante son:

    De tendencia central: media, mediana y la moda.

    De posicin: cuartiles, deciles y percentiles.

    De dispersin: varianza, desviacin estndar, y coeficiente de variacin.

    De forma: asimetra y el coeficiente de kurtosis.

    5.2. MEDIDAS DE TENDENCIA CENTRAL

    Son estadsticos que permiten hallar el valor numrico que indica el "centro" de un conjunto de datos;

    sealando la caracterstica que destaca en la informacin.

    5.2.1. La media o promedio aritmtico ( x )

    Es la ms estable y se obtiene de acuerdo a lo siguiente:

    a) Media aritmtica para datos simples (en serie):

    Proceso: Sumar todos los valores de la variable y dividir entre el nmero de datos que se han sumado.

    _ x

    nx

    b) Media aritmtica para datos agrupados (en tablas):

    Proceso: Sumar todos los valores de la variable o marca de clase multiplicados por la frecuencia

    absoluta simple y dividir entre el nmero de datos o la suma de las frecuencias absolutas simples.

    x fx

    f

    Ventajas de la media aritmtica:

    - Es til cuando los datos estn distribuidos en forma normal o simtrica.

    - Es de gran estabilidad porque toma en cuenta todos los datos.

    - Nos permite probar parmetros en inferencia estadstica. Desventajas de la media aritmtica:

  • Mg. Mara Vallejos Atalaya

    68

    - Puede ser afectado por valores extremos.

    - Cuando los datos agrupados tienen clases abiertas en los extremos, no es recomendable calcular

    el promedio.

    5.2.2. Mediana (Me)

    Es el estadstico que representa el punto medio de los datos en el cual cae el 50% de puntuaciones. Se

    obtiene de acuerdo a lo siguiente: a) Mediana para datos simples (en serie):

    Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la serie

    es par); del conjunto de datos previamente ordenados en forma creciente.

    (*) La mediana se utiliza tambin en variables ordinales Ej: Se tiene la siguiente informacin sobre el nmero de alumnos repitentes por aos de estudios de la

    carrera de contabilidad en la UPeU.

    AOS fi 1

    Fi 2

    Primero

    Segundo

    Tercero

    Cuarto

    Quinto

    25

    14

    6

    9

    2

    25

    39

    45

    54

    56

    Clase

    mediana.

    Total 56

    Proceso:

    1. Se calcula la suma de las frecuencias absolutas simples entre 2 as:

    2

    n =

    5628

    2 2

    f

    2. El valor inmediatamente superior o igual a 28 se busca en la columna de la tabla que corresponde

    a la frecuencia absoluta acumulada Fi (en este ejemplo corresponde a 39, porque 25 es menor

    que 28).

    3. Luego se observa la primera columna donde se encuentra la variable, en la fila donde se observ el

    nmero 39, el valor de la variable que se encuentra en esa fila corresponde a la mediana.

    Me = Segundo.

    Interpretacin: La mitad de los estudiantes repitentes lo hacen como mximo hasta segundo ao,

    aproximadamente la otra mitad repiten categoras superiores al segundo ao.

    b) Mediana para datos agrupados:

    Cuando los datos se encuentran agrupados en una tabla de distribucin de frecuencias, la mediana se

    encuentra utilizando la siguiente frmula:

    1

    inf

    2i

    i

    nF

    Me L cf

    Donde

    1 fi : frecuencia absoluta simple

    2 Fi : frecuencia absoluta acumulada.

  • Mg. Mara Vallejos Atalaya

    69

    infL : Lmite inferior del intervalo que contiene a la mediana

    c : Amplitud del intervalo n : Nmero total de datos

    1iF : Frecuencia absoluta acumulada anterior a la clase mediana

    if : Frecuencia (o frecuencia absoluta) de la clase mediana.

    Lugar de la Mediana, Me : 2

    n .

    Ventajas de la mediana:

    - No est afectada por valores extremos, y por lo tanto es ms representativa que el promedio,

    cuando las series son poco simtricas.

    - Es til cuando los datos agrupados tienen clases abiertas en los extremos (es decir, no tiene lmite

    inferior en la primera clase ni lmite superior en la ltima clase).

    - Se aplica a variables que pertenecen a la escala ordinal.

    5.2.3. La moda (Mo)

    Nos indica el valor o cualidad que se repite con mayor frecuencia dentro de una informacin. Se

    obtiene de acuerdo a lo siguiente:

    a) Moda para datos simples (en serie):

    Es el valor que ms se repite en una serie.

    (*) Es til cuando la variable en estudio pertenece a la escala nominal.

    Ejemplo:

    Hallar la moda para la siguiente informacin que consiste en una muestra de 100 consumidores segn

    preferencia por tipos de panes Unin.

    TIPOS DE

    PANES

    CONSUMIDORES

    (fi)

    Integral

    Americano

    Fibra

    Hamburguesa

    25

    20

    40

    15

    Total 100

    Clase modal,

    por ser el valor ms frecuente (f =40)

    Entonces, la moda ser el valor que corresponde a la categora de la variable, en la clase o fila modal.

    Mo = Fibra

    Interpretacin:

    La mayora de los consumidores de Productos Unin prefiere pan fibra.

    b) Moda para datos agrupados:

    En este caso la moda se halla mediante la frmula:

    21

    1

    inf cLMo

    Donde

    infL : Lmite inferior del intervalo que contiene a la moda

  • Mg. Mara Vallejos Atalaya

    70

    c : Amplitud del intervalo

    con 1 1i if f ; 2 1i if f

    Ventajas de la moda:

    - No est afectada por valores extremos.

    - Puede usarse cuando los datos agrupados tienen clases abiertas en los extremos.

    - Se usa para variables que pertenecen a la escala nominal.

    Desventajas de la moda:

    - No es representativa a menos que la distribucin contenga un gran nmero de datos y exista

    significativa repeticin de alguno de ellos.

    - Muchas veces la serie no tiene moda porque ningn valor se repite, en ese caso se dice que la

    informacin es unimodal.

    - Cuando la serie tiene 2 modas, se dice que la informacin es bimodal, y si tiene ms de 2 modas,

    la informacin es multimodal. En estos casos se hace difcil su interpretacin y comparacin, por lo

    tanto, no se considera una medida representativa

    Ejemplo:

    Correspondiente a datos simple (informacin en serie):

    Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de

    Ciencias Contables y Administrativas:

    Edad :

    Xi: 18, 20, 23, 17, 18, 19, 23, 18

    Calcular la media, mediana y moda e interpretar sus resultados.

    Solucin:

    Media

    18 20 23 17 18 19 23 18 15619.5 20

    8 8

    xx

    n

    Interpretacin

    La edad promedio de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas

    es de 20 aos.

    Mediana

    Me: Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la

    serie es par); del conjunto de datos previamente ordenados en forma creciente.

    En este caso la serie es par, por lo tanto, se procede del siguiente modo:

    1 Se ordena la serie

    17, 18, 18, 18, 19, 20, 23, 23

    2 Se particiona la serie por la mitad

    17, 18, 18, 18, 19, 20, 23, 23

  • Mg. Mara Vallejos Atalaya

    71

    3 la mediana ser la semisuma de los dos valores centrales, por ser la serie par, es decir 8 datos.

    18 19

    18.5 192

    Me

    Interpretacin:

    La mitad de los de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas

    tiene como mximo 19 aos, aproximadamente la otra mitad tienen ms de 19 aos.

    Moda

    Es el valor que ms se repite.

    As, en nuestra base de datos.

    1 Se ordena la serie

    17, 18, 18, 18, 19, 20, 23, 23

    2 Se toma el valor que ms se repite.

    En nuestro ejemplo el 18 se repite 3 veces.

    Mo = 18

    Interpretacin:

    La mayora de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas tiene de

    20 aos de edad.

    Ejemplo:

    Correspondiente a datos agrupados (informacin en tablas):

    Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el

    Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.

    Hallaremos la media, mediana y moda para datos agrupados.

    Tabla N 1

    DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA

    UPeU

    Lmites de

    clases

    Xi fi Fi Xi fi Xi 2fi

    [88 94>

    [94 100>

    [100 106>

    [106 112>

    [112 118>

    [118 124>

    [124 130>

    91

    97

    103

    109

    115

    121

    127

    9

    6

    Mo 11

    5

    8

    3

    8

    9

    15

    Me 26

    31

    39

    42

    50

    819

    582

    1133

    545

    920

    363

    1016

    74529

    56454

    116699

    59405

    105800

    43923

    129032

    Total 50 5378 585842

    Solucin:

    La columna de las marcas de clase denotada por Xi, se obtiene por la formula dada anteriormente en la

    Unidad 1.

  • Mg. Mara Vallejos Atalaya

    72

    La columna de Xi fi : se obtiene multiplicando valor por valor la columna de las marcas de clase denotada por Xi por las frecuencias absolutas simple denotada por fi: As: X1 f1 = 91 x 9 = 819 X2f2 = 97 x 6 = 582 X3 f3 = 103 x 11 = 1133 X7 f7 = 127 x 8 = 1016

    Observacin: Las sumas de cada columna se encuentran en la fila que corresponde al total (al final de

    las columnas).

    La clase mediana se ubica con las frecuencias absolutas acumuladas.

    La clase modal se ubica con las frecuencias absolutas simples. Media:

    819 582 1133 545 920 363 1016

    9 6 11 5 8 3 8

    5378 107.56 107

    50

    i i

    i

    x fx

    f

    Interpretacin:

    El cociente de inteligencia promedio de los alumnos de la Universidad Peruana Unin es de

    aproximadamente 107 puntos.

    Mediana:

    Proceso:

    1. Ubicamos la clase o fila mediana (intervalo que contenga la mediana):

    Lugar de Me: n/2= 50/2= 25 (25 avo. lugar)

    Analizando, la mediana se encuentra en la 4ta. Clase.

    Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de

    datos, considerando el inmediatamente mayor o igual a 25.

    2

    LCSLCIXi

    1272

    130124

    .

    .

    1032

    106100

    972

    10094

    912

    9488

    7

    3

    2

    1

    X

    X

    X

    X

  • Mg. Mara Vallejos Atalaya

    73

    En nuestro ejemplo corresponde a la cuarta fila, pues su frecuencia acumulada es F4 = 31 y es el

    inmediatamente superior a 25.

    La cuarta fila es la clase mediana y de all se considera los datos que van a ser reemplazados en la

    frmula.

    2. Utilizando la frmula:

    1

    inf

    2i

    i

    nF

    Me L cf

    Linf : Lmite inferior del intervalo de la clase mediana = 100

    n : Nmero total de datos = 50

    Fi-1 : Frecuencia absoluta acumulada anterior a la clase mediana = 15

    fi : Frecuencia absoluta simple de la clase mediana = 11

    c : Amplitud intervlica: 6

    La mediana ser:

    5015

    2100 6

    11Me

    = 105.45

    Interpretacin:

    La mitad de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia

    mximo de 105 puntos, aproximadamente la otra mitad tienen ms de 105 puntos.

    Moda

    Proceso:

    1. Se ubica la clase o fila modal (donde se encuentra la moda), ubicando en la columna de las

    frecuencias absolutas simples (fi) el mayor valor.

    En nuestro ejemplo el mayor valor de las frecuencias absolutas simples es f3 = 11,

    En nuestro ejemplo, la clase modal o fila donde se encuentra la moda es la tercera fila porque en

    ella se encuentra el mayor valor de las frecuencias absolutas simples.

    2. Utilizando la frmula:

    21

    1

    inf cLMo

    hallando:

    1 1i if f = 11- 6= 5

    2 1i if f = 11-5= 6

  • Mg. Mara Vallejos Atalaya

    74

    5100 6

    5 6Mo

    = 102.72

    Interpretacin:

    La mayora de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia de

    103 puntos.

  • Mg. Mara Vallejos Atalaya

    75

    Sesin N 6

    MEDIDAS DE POSICIN

    6.1. MEDIDAS DE POSICIN

    Son estadgrafos que dividen a una serie de datos en cuatro, diez o cien partes iguales.

    Estas medidas son:

    - Cuartiles

    - Deciles

    - Percentiles

    6.1.1. Cuartiles (Qi )

    Son estadgrafos que dividen a la informacin en cuatro partes iguales, donde cada uno de ellos es el

    25% de la informacin.

    Esquemticamente se tiene:

    Q1 25% Q2

    25% Q3

    25%

    25%

    total 100%

    Los cuartiles se calculan con la frmula siguiente:

    1

    inf

    ( )

    4i

    j

    i

    j nF

    Q L cf

    Donde:

    j : 1,2 3

    Linf : Lmite inferior del intervalo de la clase cuartlica.

    n : Nmero total de datos.

    Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartlica.

    fi : Frecuencia absoluta simple de la clase cuartlica.

    c : Amplitud intervlica. 6.1.2. Deciles (Di )

    Son estadgrafos que dividen a la informacin en diez partes iguales, donde cada uno de ellos es el

    10% de la informacin.

  • Mg. Mara Vallejos Atalaya

    76

    Esquemticamente se tiene:

    D1 10%

    10% D9

    . . .

    10%

    10%

    Total 100%

    Los deciles se calculan con la frmula siguiente:

    1

    inf

    ( )

    10i

    j

    i

    j nF

    D L cf

    Donde:

    j : 1,2, 3, 9 Linf : Lmite inferior del intervalo de la clase declica.

    n : Nmero total de datos.

    Fi-1 : Frecuencia absoluta acumulada anterior a la clase declica.

    fi : Frecuencia absoluta simple de la clase declica.

    c : Amplitud intervlica.

    6.1.3. Percentiles (Pi )

    Son estadgrafos que dividen a la informacin en cien partes iguales, donde cada uno de ellos es el 1%

    de la informacin.

    Esquemticamente se tiene:

    P1 1%

    1% P99

    . . . 1%

    1%

    total 100%

    Los percentiles se calculan con la frmula siguiente:

    1

    inf

    ( )

    100i

    j

    i

    j nF

    P L cf

    Donde:

    D2

    P2

  • Mg. Mara Vallejos Atalaya

    77

    j : 1,2, 3, 99 Linf : Lmite inferior del intervalo de la clase percentlica.

    n : Nmero total de datos.

    Fi-1 : Frecuencia absoluta acumulada anterior a la clase Percentlica.

    fi : Frecuencia absoluta simple de la clase percentlica.

    c : Amplitud intervlica.

    Observacin:

    Generalmente se calculan las medidas de posicin para datos agrupados, pues se tiene una gran

    cantidad de informacin.

    Ejemplo:

    Correspondiente a datos agrupados (informacin en tablas)

    Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el

    Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.

    Hallaremos los cuartiles 1 y 3, los deciles 2 y 8 y los percentiles 10 y 90.

    Tabla N 1

    DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA UPeU

    Intervalo de clase Xi fi Fi

    [88 94> [94 100> [100 106> [106 112> [112 118> [118 124> [124 130>

    91 97 103 109 115 121 127

    9 6 11 5 8 3 8

    9 15 26 31 39 42 50

    P10 Q1,D2 Q3,D8 P90

    Total 50

    Solucin

    Cuartil 1 (Q1)

    Proceso

    1. Se ubica la clase o fila cuartlica (donde se encuentra el primer cuartil), utilizando la siguiente

    frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.

    (1)5012.5

    4 4

    i f

    2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de

    datos, considerando el inmediatamente mayor o igual a 12.5.

    En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el

    inmediatamente superior a 12.5.

    3. La segunda fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en

    la frmula.

    1

    inf

    ( )

    4i

    j

    i

    j nF

    Q L cf

  • Mg. Mara Vallejos Atalaya

    78

    Linf : Lmite inferior del intervalo de la clase cuartlica = 94

    n : nmero total de datos = 50

    Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartlica = 9

    if : Frecuencia absoluta simple de la clase cuartlica = 6

    c : amplitud intervlica: = 6

    Cuartil 1 ser:

    1

    (1)509

    494 6 97.56

    Q

    Interpretacin:

    El 25% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia

    mximo de 98 puntos, aproximadamente el 75% restante tienen ms de 98 puntos.

    Cuartil 3 (Q3)

    Proceso

    1. Se ubica la clase o fila cuartlica (donde se encuentra el tercer cuartil), utilizando la siguiente

    frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.

    ( ) (3)5037.5

    4 4

    j n

    2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de

    datos, considerando el inmediatamente mayor o igual a 37.5.

    En nuestro ejemplo corresponde a la quinta fila, pues su frecuencia acumulada es F5 = 39 y es el

    inmediatamente superior a 37.5.

    3. La quinta fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en la

    frmula.

    Linf : Lmite inferior del intervalo de la clase cuartlica = 112

    n : nmero total de datos = 50

    Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartlica = 31

    if : Frecuencia absoluta simple de la clase cuartlica = 8

    c : Amplitud intervlica: = 6

    El cuartil 3 ser:

    (3)(50)31

    43 112 6 116.878

    Q

    Interpretacin:

    El 75% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia

    mximo de 117 puntos, aproximadamente el 25% restante tienen ms de 117 puntos.

  • Mg. Mara Vallejos Atalaya

    79

    Decil 2 (D2)

    Proceso:

    1. Se ubica la clase o fila declica (donde se encuentra el segundo decil), utilizando la siguiente

    frmula, el valor i, se reemplaza de acuerdo a qu decil se desea encontrar; ya sea el 1, 2, , 9.

    ( ) (2)5010

    10 10

    j n

    2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de

    datos, considerando el inmediatamente mayor o igual a 15.

    En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el

    inmediatamente superior a 10.

    3. La segunda fila es la clase declica y de all se considera los datos que van a ser reemplazados en

    la frmula.

    Li : Lmite inferior del intervalo de la clase declica = 94

    n : Nmero total de datos = 50

    Fi-1 : Frecuencia absoluta acumulada anterior a la clase declica = 9

    if : Frecuencia absoluta simple de la clase declica = 6

    c : Amplitud intervlica: = 6

    El decil 2 ser:

    2

    (2)(50)9

    1094 6 956

    D

    Interpretacin:

    El 20% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia

    mximo de 95 puntos, aproximadamente el 80% restante tienen ms de 95 puntos.

    Percentil 10 (P10)

    Proceso

    a. Se ubica la clase o fila percentlica (donde se encuentra el percentil 10), utilizando la siguiente

    frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2, , 99.

    ( ) (10)505

    100 100

    j n

    b. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de

    datos, considerando el inmediatamente mayor o igual a 5.

    En nuestro ejemplo corresponde a la primera fila, pues su frecuencia acumulada es F2 = 9 y es el

    inmediatamente superior a 5.

    c. La primera fila es la clase percentlica y de all se considera los datos que van a ser remplazados

  • Mg. Mara Vallejos Atalaya

    80

    en la frmula.

    Li : Lmite inferior del intervalo de la clase percentlica = 88

    n : Nmero total de datos = 50

    Fi-1 : Frecuencia absoluta acumulada anterior a la clase Percentlica = 0

    if : Frecuencia absoluta simple de la clase percentlica = 9

    c : Amplitud intervlica: = 6

    El percentil 10 ser:

    10

    (10)(50)0

    10088 6 91.39

    P

    Interpretacin:

    El 10% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia

    mximo de 91.3 puntos, aproximadamente el 90% restante tienen ms de 91.3 puntos.

    EJERCICIOS PROPUESTOS

    1) Los datos siguientes corresponden al peso en Kg. de 10 alumnos.

    40.8 52.5 49.2 40.8 62.2

    52.5 58.0 60.0 40.8 52.5

    Calcular:

    a) La media, la mediana y la moda.

    b) Cul de los 3 indicadores (en (a)) miden con mayor precisin el centro de los datos?

    2) El nmero de autos vendidos por cada uno de 10 vendedores de una distribuidora de

    automviles en un mes particular, dispuestos en orden ascendente es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15.

    Determine e interprete: a) La media b) La mediana c) La moda

    3) La media mnima para aprobar una asignatura es 11. Si un estudiante obtiene la notas 13.5, 14,

    9.5, 12, 8.5, 8, 11.5, 10 en los trabajos mensuales de la asignatura en cuestin, el estudiante

    fue aprobado?

    4) A Continuacin se dan las notas de 50 alumnos.

    60 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89

    Se pide:

  • Mg. Mara Vallejos Atalaya

    81

    a) Obtener la distribucin de frecuencias

    b) Determinar: la media, mediana y moda

    c) Determinar el 3er cuartil, 7mo decil y 55avo percentil.

    5) A continuacin tenemos la distribucin del nmero de accidentes por da durante 43 das, en

    cierta autopista.

    N de accidentes 0 1 2 3 4

    N de das 10 15 10 5 3

    a) Determinar: la media, mediana y moda

    b) Cul es el porcentaje de das en que se tuvo dos o ms accidentes por da?

    6) Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en cm)

    151 152 154 155 159 159 160 161 161 161 161 162

    163 163 164 165 166 165 166 166 166 166 166 167

    167 167 167 168 168 168 168 168 168 168 168 168

    168 169 169 169 169 169 169 169 169 170 170 170

    170 170 170 170 171 171 171 172 172 172 173 173

    173 173 174 174 174 175 175 175 176 176 176 176

    176 177 177 177 177 178 178 178 179 179 180 180

    180 181 181 181 181 182 182 182 183 184 185 186

    187 188 189 190

    Calcular las medidas de tendencia central, posicin, dispersin y de forma. Interpretar los

    resultados.

    7) Obtenga la media y la mediana para cada uno de los siguientes conjuntos de nmeros:

    1) 1, 5, 9, 13, 17 2) 1, 3, 9, 27, 81 3) 1, 4, 9, 16, 25

    a) Para cul de estos conjuntos de datos son iguales la media y la mediana? b) Cul medida es la misma para los 3 conjuntos? c) Cul de estos conjuntos tiene una moda?

    8) Los siguientes datos representan el nmero de obreros ausentes en cierta empresa

    manufacturera, en 10 das consecutivos de trabajo: 5, 3, 0, 4, 3, 1, 4, 2, 20, 0

    a) Encontrar la media, la mediana y la moda. b) Interpretar sus resultados.

    9) El siguiente cuadro muestra la distribucin de edades de casos de una cierta enfermedad

    reportada durante un ao en una ciudad del estado.

    EDAD Nmero de casos

    5 - 14 15 - 24 25 - 34 35 - 44 45 - 54 55 - 64

    5 10 20 22 13 5

    Total 75

    a) Determinar e interpretar las medidas de tendencia central: media, mediana, moda. b) Determinar e interpretar las medidas de Posicin: Cuartiles (Q1 y Q3) Deciles (D3 y D4) y

    Percentil (P14 y P94).

  • Mg. Mara Vallejos Atalaya

    82

    10) En la tabla siguiente se muestra los puntajes obtenidos por 36 alumnos en una prueba de

    razonamiento matemtico:

    Yi-1 - Yi

    fi hi Fi Hi

    Yi

    42 - 51 51 - 60 60 - 69 69 - 78 78 87 87 - 96

    11 0.35 10 0.28 2 0.055 5 0.14 3 0.08 5 0.14

    a) Calcular la media aritmtica, mediana y moda e interprete los datos b) Calcular Q1, P90, D9 e interprete c) Graficar el histograma y polgono de frecuencia

  • Mg. Mara Vallejos Atalaya

    83

    Autoevaluacin

    CONCEPTUAL

    1. Seale con una V si es verdadero o F si es falso en los siguientes

    enunciados:

    a) ( ) La mediana es una medida de tendencia central. b) ( ) La moda indica el valor que se repite con mayor frecuencia. c) ( ) Los cuartiles dividen a la informacin en 10 partes iguales. d) ( ) La media se calcula sumando todos los valores de la variable. e) ( ) Los percentiles dividen la informacin en cien partes iguales.

    PROCEDIMENTAL

    2. Establezca las diferencias entre las medidas de tendencia central: media,

    mediana y moda. 3. El nmero de autos vendidos por cada uno de 10 vendedores de una

    distribuidora de automviles en un mes particular, dispuestos en orden ascendente es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15.

    Determine e interprete: a) La media b) La mediana c) La moda

    4. La siguiente tabla muestra la distribucin de edades de casos de una cierta

    enfermedad informados durante un ao en una provincia.

    Edad Nmero de casos

    [5 - 15> [15 - 25> [25 - 35> [35 - 45> [45 - 55> [55 - 65>

    5 10 20 22 13 5

    total 75

    a) Calcular la media, la mediana, la moda. Interprete. b) Calcular el Q1, Q3, D2, D5, P8, P10

    ACTITUDINAL

    5. Para conocer la edad ms frecuente de tus compaeros de clase, qu

    medida de tendencia central utilizaras?, qu procedimiento efectuaras para su clculo? y cmo ensearas a tus subordinados para conocer la edad ms frecuente de los que siempre llegan tarde?

  • Mg. Mara Vallejos Atalaya

    84

    Sesin N 7

    MEDIDAS DE DISPERSIN 7.1. Medidas de dispersin

    Son estadgrafos que cuantifican el grado de concentracin o de dispersin de los valores de la

    variable en torno a un promedio o valor central de la distribucin. Las medidas de dispersin se

    necesitan para dos propsitos bsicos:

    a) Para verificar la confiabilidad de los promedios y

    b) Para que sirva como base para el control de la variacin de la misma.

    Las principales medidas de dispersin o variabilidad son:

    - Varianza

    - Desviacin estndar

    - Coeficiente de variacin

    7.1.1. Varianza (s

    2 )

    Es una medida que cuantifica el grado de dispersin o de variacin de los valores de una variable

    cuantitativa con respecto a su media aritmtica.

    Es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a su media.

    Cuando el resultado de la varianza es un valor grande, se dice que los datos se encuentran bastantes

    dispersos o alejados de la media aritmtica; si el resultado es bastante pequeo los datos estarn

    bastante cercanos o concentrados alrededor de la media aritmtica.

    Se obtiene de acuerdo a lo siguiente:

    a) Varianza para datos simples (en serie):

    2 2

    2( )

    1

    x n xs

    n

    Donde:

    2x Cada valor de la muestra se eleva al cuadrado luego se suma todos los valores. n = Tamao de la muestra. (nmero de datos).

    x = Media para datos simples.

    b) Varianza para datos agrupados:

    2 2

    2( )

    1

    Y f n Ys

    n

    Donde:

    2Y f = Cada marca de clase elevado al cuadrado y multiplicado por su frecuencia absoluta simple, luego se suman todos los valores.

    n = Tamao de la muestra.

  • Mg. Mara Vallejos Atalaya

    85

    Y = Media para datos agrupados. Observacin: La varianza es una medida terica; no tiene interpretacin prctica.

    7.1.2. Desviacin estndar (s )

    Es la raz cuadrada de la varianza. Esta medida tiene interpretacin prctica.

    2s s

    Es uno de los estadsticos de mayor uso en el cual las unidades de la variable ya no estn elevados al

    cuadrado sino estn en unidades originales.

    7.1.3. Coeficiente de variacin (c.v. % )

    Es el cociente de la desviacin estndar y la media aritmtica, expresado en porcentaje. As:

    100.%x

    scv

    - El coeficiente de variacin se usa para saber si un conjunto de datos es homogneo o heterogneo

    (concentrados o dispersos). Para esto se utiliza el siguiente criterio:

    Si C.V. < 0.33 Datos HOMOGNEOS

    Si C.V. 0.33 Datos HETEROGNEOS

    - El coeficiente de variacin tambin se utiliza para comparar la variabilidad de 2 ms series de

    datos que tengan unidades de medidas diferentes (por ejemplo, peso en kgs. y edad en aos). Si C.V.A < C.V.B Los datos de la serie A presentan una menor variabilidad con respecto a los

    datos de la serie B

    Ejemplo:

    Correspondiente a datos simples (informacin en serie):

    Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de

    Ciencias Contables y Administrativas:

    Edad:

    Xi: 18, 20, 23, 17, 18, 19, 23, 18

    Calcular la varianza, desviacin estndar y coeficiente de variacin e interpretar sus resultados.

    Solucin:

    La varianza (s2) :

    Proceso:

    18 20 23 17 18 19 23 18 156

    19.58 8

    xx

    n

    2 2 2 2 2 2 2 2 218 20 23 17 18 19 23 18 3080x

    n = 8, pues hay 8 datos.

  • Mg. Mara Vallejos Atalaya

    86

    Entonces, la varianza es:

    2 2 2

    2( ) 3080 8(19.5)

    5.431 8 1