Estadistica descriptiva

Embed Size (px)

DESCRIPTION

T. Brand

Citation preview

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    1

    MODELOS APLICADOS A LA INGENIERA

    GUA 1

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    2

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    3

    1.- Estadstica Descriptiva

    Llamaremos estadstica descriptiva a un conjunto de mtodos y tcnicas que permiten recopilar, presentar, analizar y tomar decisiones de un conjunto de datos, este anlisis es muy bsico. Por otro lado la estadstica inferencial, se emplea para estudiar alguna caracterstica de la poblacin a travs del anlisis de una o ms muestras.

    Conceptos Bsicos:

    1.1.- Poblacin: La poblacin representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogneo que rene unas caractersticas determinadas.

    1.2.- Muestra: La muestra es el conjunto menor de individuos (subconjunto de la poblacin accesible y limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la poblacin). El individuo es cada uno de los componentes de la poblacin y la muestra. La muestra debe ser representativa de la poblacin y con ello queremos decir que cualquier individuo de la poblacin en estudio debe haber tenido la misma probabilidad de ser elegido.

    Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos sealar:

    1.- Ahorrar tiempo. Estudiar a menos individuos toma menos tiempo.

    2.- Como consecuencia del punto anterior se reducen los costos.

    3.- Estudiar la totalidad de los pacientes o personas con una caracterstica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar, por ejemplo estudiar a todos los peces que pertenecen a un cardumen.

    4.- Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones y mediciones realizadas a un reducido nmero de individuos pueden ser ms exactas y plurales que si las tuvisemos que realizar a una poblacin.

    5.- La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una poblacin al indicar los criterios de inclusin y/o exclusin.

    Consideraciones

    - Parmetro Poblacional.- Es un valor numrico que caracteriza cierta poblacin.

    - Estadstico Muestral.- Es un valor numrico que caracteriza cierta muestra.

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    4

    En Estadstica se busca estimar el verdadero valor del parmetro a travs de un estadstico.

    Nota.- Importancia del estudio estadstico

    - Lo ms importante no est en lo que la muestra nos dice sobre sus miembros especficos, sino en cmo hacer inferencias sobre los miembros de la poblacin que no fueron incluidos en la muestra.

    - Un estadstico primero disea la muestra y el experimento para minimizar los costos de obtener la informacin.

    - Despus busca el mejor mtodo para realizar la inferencia segn el muestreo dado.

    - Finalmente mide la bondad de la inferencia.

    1.3.- Variable aleatoria: Representa una caracterstica de inters a medir de los miembros de una poblacin. Las variables aleatorias pueden ser cualitativas y cuantitativas.Los datos que se asocian con las variables aleatorias pueden medirse con diferentes escalas dependiendo del tipo de dato que se trate.

    Observacines-

    La diferencia entre variables aleatorias y variables algebraicas es que nos interesa saber la probabilidad de ocurrencia de sus posibles valores antes de que estos valores sean observados.

    1.3.1.- Variables Cualitativas: sus valores corresponden a conceptos, atributos o cualidades; no son medibles. Ejemplo: (color de los ojos, grupo sanguneo, profesin, etctera).

    Observaciones:

    Las variables cualitativas:

    - Arrojan respuestas categricas. - Se les puede asignar despus un valor numrico (codificarlas)

    Los datos cualitativos no tienen interpretacin cuantitativa, slo pueden clasificarse por ejemplo:

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    5

    - Planta de funcionarios. Directivos Profesionales Produccin Servicios Otros - Tipos de accidentes. Cadas Quemaduras Fracturas Intoxicaciones Otros - Actividades de las empresas Productivas Servicios Otros

    En el proceso de medicin de estas variables cualitativas, se pueden utilizar dos escalas:

    Escalas nominales: sta es una forma de observar o medir en la que los datos se ajustan por categoras que no mantienen una relacin de orden entre s (color de los ojos, sexo, profesin, presencia o ausencia de un factor de riesgo o enfermedad, etctera).

    Escalas ordinales:

    - Los datos de tipo cualitativo guardan un orden natural. - Se pueden realizar operaciones aritmticas con los nmeros asignados a

    las categoras. El resultado no indica nada

    Ejemplos:

    (grados de disnea, estadiaje de un tumor, etctera).

    1.3.2.- Variables Cuantitativas: Son medibles y corresponden a nmeros reales.

    Observaciones:

    Las variables cuantitativas:

    - Podemos tratar un dato cuantitativo como cualitativo (categorizando)

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    6

    Las variables cuantitativas pueden ser:

    1.3.2.1.- Discreta, Si el nmero posible de valores que puede tomar es contable, slo toman valores reales,

    Ejemplo: n. de hijos, n. de hermanos, horas de descanso, aos de estudio

    1.3.2.2.- Continuas, toman infinitos valores dentro de un intervalo real, generalmente resultan de un proceso de medicin.

    Ejemplo: edad, peso, talla, etc.

    En el proceso de medicin de estas variables cuantitativas, se pueden utilizar dos escalas:

    Medidas por Escala de Intervalo:

    - Los datos que se utilizan son cuantitativos y guardan las caractersticas descritas en las medidas ordinales.

    - No existe un cero natural, es decir, el cero no implica necesariamente la ausencia del atributo en estudio.

    - Implican la asignacin de nmeros de modo que a iguales diferencias entre los grados del atributo, correspondan iguales diferencias entre los valores numricos

    Medidas por Escala de Razn:

    - Datos que cumplen con las caractersticas necesarias para medirse con una escala de intervalo, y que adems posee un cero natural.

    - Tener un cero natural implica que el punto cero no es arbitrario y corresponde a una total ausencia del atributo en estudio.

    Una vez clasificados los datos, es necesario poder organizarlos de modo de transformar los datos en informacin, para ello el primer paso es la construccin de tablas de frecuencia.

    1.3 * .- Construccin de tablas de Distribucin de frecuencias

    La construccin de tablas de distribucin de frecuencias es un mtodo que permita conocer como es la composicin y distribucin de los datos. Sin embargo previo a la construccin de estas tablas es preciso tener claro los conceptos de frecuencia absoluta y relativa.

    * Frecuencia Absoluta.-Es la cantidad de elementos que pertenecen a cada categora o bien el nmero de veces que se repite un suceso. La suma de todas las frecuencias

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    7

    absolutas debe coincidir con el tamao de la muestra. La frecuencia absoluta se denomina por in

    * Frecuencia relativa.-Corresponde a relativizar la cantidad de elementos que hay en cada categora, respecto del total de elementos de la muestra. La suma total de las frecuencias relativas debe ser 1 100%.

    A continuacin se muestra la forma de elaborar tablas de frecuencia, metodologa que sirve tanto para datos cualitativos como cuantitativos

    1.3 * 1.- Datos Cualitativos

    Se puede presentar de la siguiente forma:

    Modalidades Frecuencia Absoluta Frecuencia relativa Categoria1 1n

    nnf 11 =

    Categoria2 2n nnf 22 =

    M

    M

    M

    Categora k kn nn

    f kk =

    =

    =k

    ii nn

    1

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    8

    Ejemplo.-

    Estado Civil

    (clase)

    Nmero de ocurrencias

    (frecuencia)

    Porcentaje

    (frecuencia relativa)

    Soltero 29 29%

    Casado 33 33 %

    Divorciado 27 27 %

    Viudo 6 6 %

    Otro 5 5 %

    Total 100 personas 100 %

    1.3 * 2.- Datos Cuantitativos (Intervalos o categoras)

    Para cada variable es necesario construir las categoras en las cuales se agruparn los datos para conocer su distribucin, la forma de operar es la siguiente:

    Paso1.- Se busca el mximo y el mnimo correspondiente a cada conjunto de datos

    Paso2.- Se calcula la diferencia entre estos dos valores (mximo mnimo)

    Paso3.- Se definen la cantidad de intervalos a utilizar. En general se considera apropiado la construccin entre 5 y 10 intervalos.

    Paso4.- Se debe calcular la amplitud de cada intervalo C , para ello, primero se obtiene la razn entre la diferencia obtenida en el paso2 dividida por la cantidad de intervalos a construir:

    ervalosdeNMnimoMximoC

    int=

    Paso5.- Construccin de los intervalos

    1er intervalo: El lmite inferior corresponde al mnimo valor encontrado en la serie de datos recolectados, el lmite superior se obtiene sumando al mnimo la amplitud de los intervalos (C ), esto es:

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    9

    Lminfinter1= Mn

    Limsupint1 = Mn + C

    2do intervalo: El lmite inferior corresponde al lmite superior del intervalo precedente ms un delta (valor pequeo), y el lmite superior se obtiene sumando al lmite inferior la amplitud de los intervalos

    Lminfinter2 = Mn +C + Lmsupinter2 = Mn + 2C + 3er intervalo: El lmite inferior corresponde al superior del intervalo precedente

    ms un delta y el lmite superior se obtiene sumando al inferior la amplitud de los intervalos

    Lminfinter3 = Mn +2C +2 Lmsupinter3= Mn +3C +2 Y as sucesivamente hasta terminar con la cantidad de intervalos definidos

    Paso6.- Se contabiliza la cantidad de observaciones para cada uno de los intervalos

    Paso7.- Se calcula la frecuencia relativa.

    Ejemplo.- Se considera el porcentaje de asistencia de los funcionarios a clases de prevencin de riesgos. Los datos obtenidos son los siguientes:

    90 85 70 75 30 55 80 43 68 85 75 60 48 60 62 45 63 30 90 82 80 78 65 75 55 75 35 76 79 77 74 78

    Paso1: Mximo= 90 , Mnimo=30

    Paso2: Mximo-Mnimo = 90-30 = 60

    Paso3: N de intervalos = 6

    Paso4 Amplitud del intervalo 10660

    int===

    ervalosdeNMnimoMximoC

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    10

    Paso5: Construccin de intervalos (Considerando =0.01 ) Paso5.1.- 1er. Intervalo 30; 30+10 =40 30;40

    Paso5.2.- 2do. Intervalo 40+ ; 40+10+ 40,01; 50,01 Paso5.3.- 3er. Intervalo 50,01+ ; 50,01+10+ 50,02; 60,02 Paso5.4.- 4to. Intervalo 60,02+ ; 60,02+10+ 60,03; 70,03

    Paso 5.5.- 5to. Intervalo 70,03+ ; 70,03+10+ 70,04; 80,04 Paso 5.6.- 6to. Intervalo 80,04+ : 80,04+10+ 80,05; 90,05 Paso 6.- Construccin tabla de intervalos

    Intervalos Marca de clase (1) Frecuencia Absoluta

    Frecuencia relativa

    30,00 - 40,00 35 3 0.094 40,01 - 50,01 45 3 0.094 50,02 - 60,02 55 4 0.125 60,03 -70,03 65 5 0.156 70,04 80,04 75 12 0.375 80,05 90,05 85 5 0.156 32 1.000

    (1)Marca de clase: Promedio aritmtico entre los lmites de cada intervalo.

    1.4.- Medidas de tendencia central, posicin y de dispersin.

    Introduccin.-

    En el anlisis de datos las medidas de tendencia central, posicin y dispersin son de vital importacin para tener un apresto de la forma de la distribucin de los datos en estudio.

    1.4.1.- Tendencia central

    Estas medidas dicen relacin con la posicin que ocupan los datos respecto al centro de la distribucin. En muchas investigaciones interesa mucho ms conocer el resumen global de las caractersticas de un grupo en estudio, lo que podemos conseguir utilizando las medidas de tendencia central y posicin. Las medidas de tendencia central son: Media, mediana, moda.

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    11

    1.4.1.1.- Promedio o media La media o promedio es una de las medidas de tendencia central ms utilizadas, ya que en ella se basan muchos otros estadgrafos. Se aplica slo a variables cuantitativas. La media aritmtica est fuertemente afectada por valores extremos, por lo que cuando se dispone de datos muy heterogneos no se recomienda su uso.

    * Para datos no agrupados tenemos

    1.- Media poblacional )( Sean nxxxx ...,,, 321 valores de la variable aleatoria, entonces la media o promedio, viene dada por:

    = =

    n

    iixn 1

    1

    2.- Media muestral ( x )

    Sean nxxxx ...,,, 321 valores de la variable aleatoria de la muestra, entonces la media o promedio, viene dada por:

    n

    xxxxn

    x nn

    ii

    ...1 211

    ++=

    = =

    Ejemplo.- Se tiene una muestra de tamao 5 de las edades de los alumnos del curso de modelos bsicos

    23, 36,45, 29,58

    aosx 2,385

    5829453623 =++++=

    Respuesta: Se puede concluir que en promedio los alumnos del curso tienen 38,2 aos

    * Media datos agrupados en intervalos

    Dada un conjunto nxxxx ...,,, 321 datos agrupados en k-intervalos, talque kXXX ...,, 21 marcas de clase y jf la frecuencia correspondiente a cada clase, entonces:

    = =

    j

    k

    ii fxn

    x1

    1

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    12

    Ejemplo.- Se tienen los datos correspondientes a las edades de los 42 empleados de la Distribuidora de Alimentos S.A. .Determinar la edad promedio de dichos empleados.

    Intervalo Marca clase Frecuencia f acumulada F relativa acumulada

    17-26 21.5 11 11 26.2% 27-36 31.5 8 19 45.2% 37-46 41.5 4 23 54.8% 47-56 51.5 7 30 71.4% 57-66 61.5 9 39 92.9% 67-76 71.5 3 42 100%

    aosfxn

    x jk

    ii 45.4242

    3*5.719*5.617*5.514*5.418*5.3111*5.2111

    =

    +++++=

    = =

    Respuesta: En promedio los trabajadores de la empresa tienen 42,45 aos

    Observaciones.-

    1.- Todo conjunto de datos de nivel de intervalo y de nivel de razn tiene un valor medio.

    2.- un conjunto de valores slo tiene una media.

    3.- la media es la nica medida de posicin o ubicacin donde la suma de las desviaciones con respecto a la media, siempre es cero.

    4.- la cantidad de datos a evaluar raramente afecta a la media

    Ejemplo:

    Considere el conjunto de valores: 3, 8 y 4. La media es 5.

    Para ilustrar la tercera propiedad, (3 - 5) + (8 - 5) + (4 - 5) = - 2 + 3 - 1 = 0.

    1.4.1.2.- Moda

    La moda de un conjunto de datos es el valor de la variable que se repite con mayor frecuencia. Se utiliza tanto para variables cuantitativas como semi-cuantitativas.

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    13

    *1.- Moda datos no agrupados

    Tabla 2.- Pesos en kilos Peso frecuencia 52 5 56 10 57.5 8 59 13 62 5 65 3 67 2

    Ejemplo.- La moda es 59, es decir, el peso de mayor ocurrencia

    *2.- Moda datos agrupados en intervalos

    La moda para datos agrupados en intervalos viene dada por:

    cLModa *21

    1

    ++=

    Donde:

    L : Limite aparente

    1 : frecuencia de la moda frecuencia anterior

    2 : frecuencia de la moda frecuencia siguiente

    C : longitud del intervalo

    Ejemplo.- En la tabla dada la moda es:

    Tabla.- Edades Intervalo Marca clase Frecuencia f acumulada F relativa

    acumulada 17-26 21.5 11 11 26.2% 27-36 31.5 8 19 45.2% 37-46 41.5 4 23 54.8% 47-56 51.5 7 30 71.4% 57-66 61.5 9 39 92.9% 67-76 71.5 3 42 100%

    aosModa 2586.2410*311

    1117 =++=

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    14

    1.4.1.3.- Mediana

    Otra medida de tendencia central es la mediana; como se ver es especialmente til cuando los datos estn sesgados. Mediana significa a la mitad y la mediana es el valor a la mitad de una serie de datos que han sido colocados en orden. Especficamente, la mediana es el valor que divide una serie de datos en dos mitades con una mitad de las observaciones mayores que sta y la otra mitad menores a la mediana. Formalmente, se define la mediana como el valor que divide a la muestra en dos partes iguales, es decir, el 50% de los datos se encuentran bajo este valor y el 50% restante se encuentra sobre . Obs.- Para calcular la mediana de un grupo de observaciones, es necesario previamente ordenarlas considerando sus valores en forma ascendente. Por ejemplo al tener los siguientes datos relativos a los pesos de de pacientes obesos: 110,120,122,130,180 kg. En este ejemplo, hay dos observaciones mayores y dos menores que 122, entonces, la mediana es 122 kg. el valor de la 3 observacin. Al obtener la media (132) sta seria mayor que 4 de los 5 valores. Mediana: Nmero par y nmero impar de datos i.- Ordene los datos de menor a mayor o viceversa ii.- Encuentre el rango medio con la siguiente frmula Rango mediano= (n+1) 2 *. Si el nmero de observaciones (n) es impar el rango medio cae en una observacin. n es par el rango medio cae entre dos observaciones. iii.- Identifique el valor de la mediana *. Si el rango medio cae en una observacin especfica (n=impar) la mediana es igual al valor de sta observacin.

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    15

    *. Si el rango medio cae entre dos observaciones (n=par) la mediana es igual al promedio (media aritmtica) del valor de estas observaciones. Ejemplo con nmero impar de observaciones: n=5: 13,7,9,15,11 1.- Ordenar de mayor a menor: 7,9,11,13,15. o viceversa: 15,13,11,9,7. 2.- Encontrar el rango mediano Rango mediano = (n+1) = 5+1 = 3 2 2 Entonces, el rango medio cae en el valor de la 3a observacin. 3.- Identificar el valor de la mediana que es igual al valor de la tercera observacin=11 Ejemplo con numero par: n=6: 15,7,13,9,10,11 1.- Ordenar los datos 7,9,10,11,13,15 2.- Encontrar el rango medio Rango mediano = (n+1)= 6+1 = 3.5 2 2 Entonces, el rango medio cae entre el valor de la 3a y la 4a observacin. 3.- Identificar el valor de la mediana que es igual al promedio de la 3a y 4a observacin Mediana = 11+10 = 10.5 2 En contraste con la media, la mediana no est influenciada por valores extremos. Ejemplo:

    i) 24,25,29,30,31 Media 28.0 mediana 29 ii) 24,25,29,30,131 Media 44.7 mediana 29

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    16

    Se observa cmo una observacin altera la media pero no cambia la mediana, entonces se prefiere la mediana como medida de tendencia central cuando los datos estn desviados en cualquier direccin o cuando los datos incluyen valores extremadamente grandes o pequeos. Ejemplo A 0 0 1 1 1 5 9 9 9 10 10 B 0 4 4 4 5 5 5 6 6 6 10 C 0 1 2 3 4 5 6 7 8 9 10 D 0 1 1 2 2 2 3 3 3 4 10 E 0 6 7 7 7 8 8 8 9 9 10 1.- Organice las observaciones en orden creciente (ya est hecho) 2.- Encuentre el rango medio de las observaciones (11 observaciones + 1)/2 =12/2=6 3.- Identifique el valor de la mediana que es el de la 6a observacin: La mediana para las variables A, B y C es 5; La mediana para la variable D es 2; La mediana para la variable E es 8; 1.4.2.- Medidas de Dispersin Las medidas de dispersin dan informacin acerca de la concentracin de los valores de la variable con respecto a un cierto valor central, por ejemplo la media, Un valor pequeo para una medida de dispersin indica que los datos se encuentran acumulados cercanamente, dan cuenta de a homogeneidad o heterogeneidad de los datos. Se consideran varias medidas de dispersin:

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    17

    1.- Amplitud de variacin o rango Es la medida de dispersin ms sencilla, lo que denotaremos por Rango y se define como: Rango o Recorrido = Valor mximo - valor mnimo 2.- Desviacin Media Es la media aritmtica de los valores absolutos de las desviaciones con respecto a la media aritmtica, es decir, mide el valor en promedio en que varan los valores de una poblacin o muestra con respecto a su media, la denotaremos por DM y viene dada por:

    n

    xxDM

    =

    x : valor de cada observacin x : media aritmtica de los valores n : nmero de observaciones de la muestra Ejemplo.- Hallar la desviacin media del conjunto 2, 3,6.8,11

    8,25

    61168666362

    65

    118632

    =++++=

    =++++=

    MD

    x

    3.- Varianza Se basa en las desviaciones absolutas de los datos con respecto a la media, se expresa en unidades cuadrticas. Las formulas para la varianza muestral y poblacional son muy diferentes

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    18

    i).- Varianza Poblacional ( 2 ), para datos no agrupados Sean nxxxx ...,,, 321 datos de la poblacin y su media aritmtica poblacional, la varianza poblacional para datos no agrupados es:

    ( )n

    xi = 22

    ii).- Varianza Muestral ( 2s ), para datos no agrupados Sean nxxxx ...,,, 321 valores de la variable aleatoria de la muestra, x su media aritmtica la varianza muestral para datos no agrupados es: ( )

    1

    2

    2

    =

    nxx

    s i

    Ejemplo.- Hallar la varianza muestral de los datos 2, 3,6.8,11

    ( ) ( ) ( ) ( ) ( ) 5.134

    544

    25409164

    61168666362

    65

    118632

    222222 ==++++=++++=

    =++++=

    s

    x

    iii) Varianza para datos agrupados en intervalos Sean nxxxx ...,,, 321 datos de una poblacin, agrupados en k intervalos cuyas frecuencias absolutas son kfff ...,, 21 , entonces [ ]

    1

    22

    2

    =

    nnxf

    xfs

    ijij

    Donde:

    ix : Marca de clase

    jf : frecuencia absoluta de la clase n : nmero de observaciones

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    19

    4.- Desviacin estndar Como ya se dijo da cuenta de la homogeneidad o heterogeneidad de un conjunto de datos con respecto a la media (expresa la concentracin). La desviacin estndar es la raz cuadrada de la varianza y se expresa en la misma unidad de medida de los datos analizados. i.- Desviacin estndar poblacional ( ) para datos no agrupados Sean nxxxx ...,,, 321 datos de la poblacin y su media aritmtica poblacional, la desviacin estndar poblacional para datos no agrupados es:

    ( )n

    xi = 2

    ii.- Desviacin estndar muestral ( s ) para datos no agrupados Sean nxxxx ...,,, 321 valores de la variable aleatoria de la muestra, x su media aritmtica la desviacin estndar muestral para datos no agrupados es:

    ( )1

    2

    =

    nxx

    s i

    Ejemplo.- Hallar la desviacin estndar muestral de los datos 2, 3,6.8,11

    ( ) ( ) ( ) ( ) ( )

    67.35.13

    5.134

    544

    25409164

    61168666362

    65

    118632

    222222

    ==

    ==++++=++++=

    =++++=

    s

    s

    x

    iii.- Desviacin estndar agrupados en intervalos Sean nxxxx ...,,, 321 valores de la variable aleatoria, agrupados en k intervalos cuyas frecuencias absolutas son kfff ...,, 21 , entonces

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    20

    [ ]1

    22

    =

    nnxf

    xfs

    ijij

    ix : Marca de clase

    jf : frecuencia absoluta de la clase n : nmero de observaciones Consideraciones El Matemtico ruso P. Chebyshev , desarrollo un teorema que permite determinar la proporcin mnima de los valores que se encuentran dentro de un nmero especfico de desviaciones estndares respecto de la media. Por ejemplo, con base en e teorema de Chebyshev , al menos tres de cada cuatro valores , o sea 75% , deben encontrarse entre la media ms dos desviaciones estndares y la media menos dos desviaciones estndares. Esta relacin se aplica sin que importe la forma de la distribucin. Adems a menos ocho de cada nueve valores, o sea 88,9% estarn entre la media ms tres desviaciones estndares y entre dicha media menos tres desviaciones estndares. Al menos 24 de 25 valores , es decir , 96% , se encuentran entre la media y ms , y menos cinco desviaciones estndares. En trminos generales Chebyshev establece que: Teorema de Chebyshev Para un conjunto cualquiera de observaciones (muestra o poblacin), la proporcin mnima de los valores que se encuentran dentro de k desviaciones estndares desde la media (promedio) es al menos

    1tan11 2 quemayorteconseskdondek

    Ejemplo.- La media aritmtica(promedio) de la cantidad mensual depositada por los garzones de un pequeo restaurant en el plan de participacin de propinas es us$ 51,54 y su desviacin estndar us$7.51 . Al menos que porcentaje de las propinas se encuentra a una distancia de ms 3.5 desviaciones estndares y menos 3.5 desviaciones estndares, respecto de la media

    ( ) 92.025.1211

    5.31111 22 === k

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    21

    Regla Emprica Para una distribucin de frecuencias simtrica de campana, aproximadamente 68% de lass observaciones estar a ms y menos una desviacin estndar de la media; aproximadamente 95% de tales observaciones se encontrar a ms y menos dos desviaciones estndares de la misma, y prcticamente todas las observaciones (99,9%) se encontrarn a ms y menos tres desviaciones estndares con respecto a la media. 1.4.3.- Dispersin relativa En ocasiones resulta imposible comparar los valores de dos variables aleatorias medidas en distintas unidades o estn en las mismas unidades, pero las medias muy distantes, o tienen distinto tamao las muestras de la que provienen. Ejemplo los sueldos de los ejecutivos y los sueldos de los empleados no calificados. Kart Perrazo idea una medida relativa, que llam Coeficiente de variacin. i.- Coeficiente de variacin ( )CV Es la razn (cociente) de la desviacin estndar a la media aritmtica, expresada como un porcentaje

    100=xsCV

    Observacin.- CV Situacin (0 - 5)% Muy homognea (5 - 25)% Homognea (25 - 50)% Heterognea (50% Muy heterognea

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    22

    Ejemplo

    Se va a comparar la variacin de los ingresos anuales de los ejecutivos con la variacin anual en los ingresos de los trabajadores no calificados.

    Para una muestra de ejecutivos se tiene: 000.50$000.500$ ussyusx == Para una muestra de empleados no calificados

    200.2$000.22$ ussyusx == Comparar la dispersin relativa de las dos distribuciones

    Ejecutivos trabajadores no calificados

    %101000000.22200.2%10100

    000.500000.50 ======

    xsCV

    xsCV

    No existe diferencia en la dispersin relativa de los dos grupos

    ii.- Coeficiente del recorrido

    2MnMx

    RangoCR +=

    iii.- Coeficiente de la desviacin media

    media

    mediadesviacinCDM =

    iv.- Asimetra: ndice que expresa el grado de asimetra de la distribucin. La asimetra positiva indica que los valores ms extremos se encuentran por encima de la media. La asimetra negativa indica que los valores ms extremos se encuentran por debajo de la media. Los ndices de asimetra prximos a cero indican simetra.

    estndarDesviacinmedianamediaCA )(3 =

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    23

    Los resultados tambin recogen el error tpico del ndice de asimetra (es decir la desviacin tpica de la distribucin muestral del ndice de asimetra), el cual permite tipificar el valor del ndice de asimetra e interpretando como una puntuacin z con distribucin aproximadamente N(0,1), ndices tipificados mayores que 1,96 en valor absoluto permiten afirmar que existe asimetra ( positiva o negativa, dependiendo del signo del ndice). Por ejemplo en el dibujo tenemos;

    para la curva A ; la asimetra > 0 : Asimetra positiva para la curva B; la asimetra = 0 :Simetra para la curva C; la asimetra < 0 : Asimetra negativa

    Grfico normal 1.- Grfico Asimetra

    Fuente: Anlisis de datos;

    1.5- Otras Medidas de dispersin

    Los estadgrafos de posicin nos informan del orden o de la posicin que ocupa un dato dentro de conjunto de datos observados en una distribucin. Las medidas de posicin ms utilizadas son los cuntiles: cuartiles, quintiles, deciles, percentiles , , etc.

    Observacin.- Los datos deben estar ordenados de mayor a menor

    1.- Los cuartiles: dividen un conjunto de observaciones en cuatro partes iguales. Cada una de ellas contiene el 25% de los valores.

    1Q : Es el valor bajo el cual se encuentra el 25% de las observaciones

    2Q : Es el valor bajo el cual se encuentra el 50% de las observaciones y coincide con la mediana

    3Q : Es el valor bajo el cual se encuentra el 75% de las observaciones

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    24

    25% 25% 75% 3Q 25% 50% 2Q 25% 1Q

    2.- Los quintiles: dividen un conjunto de observaciones en cinco partes iguales. Cada una de ellas contiene el 20% de los datos

    1q : Es el primer quintil bajo el cual se encuentra el 20% de las observaciones

    M

    4q : Es el cuarto quintil bajo el cual se encuentra el 80% de las observaciones

    20% 20% 80% 4q20% 60% 3q 20% 40% 2q 20% 1q

    Generalizando

    La ubicacin de un cuantil deseado la denotaremos por iL

    100)1( inLcuantilundeUbicacin i +=

    Donde:

    n : nmero de datos

    i : nmero del cuantil

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    25

    Ejemplo

    Localice la mediana, el primer y tercer cuartiles, de las comisiones(en dlares) obtenidas el mes pasado por una muestra de 15 comisionistas de la empresa de Inversiones y Seguros

    $2038 $1758 $1721 $1637 $2097 $2205 $1787 $2287 $1940 $2311 $2054 $2406 $1471 $1460 $2047 Se ordenan los datos $1460 $1471 $1637 $1721 $1758 $1787 $1940 $2038 $2047 $2054 $2097 $2205 $2287 $2311 $2406

    Primer cuartel

    410025)115(

    100)1(25 =+=+= PnL , luego el primer cuartil es 1721, es decir el 25%

    obtuvo comisiones menores de 1721 dlares

    Tercer cuartil

    1210075)115(

    100)1(75 =+=+= PnL , luego el tercer cuartel corresponde al doceavo

    valor y es 2205 dlares

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    26

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    27

    1.6.-Mtodos grficos para el anlisis de datos

    Cuando se dispone de datos de una poblacin, y antes de abordar anlisis estadsticos ms complejos, un primer paso consiste en presentar esa informacin de forma que sta se pueda visualizar de una manera ms sistemtica y resumida. Los datos que nos interesan dependen, en cada caso, del tipo de variables que estemos manejando

    1.- Grfico de Sectores 2.- diagrama de barras 3.-distribucin de frecuencias tabla y grfica 4.- histograma 5.- polgono de frecuencia 6.- diagrama de caja 7.- diagrama de barras agrupadas 8.- diagrama de barras de error 9.- grfico de lineas 10.- diagrama de dispersin 11.- diagrama de lineas superpuestas 12.- diagrama de dispersin 13.- curvas ROC

    1.- Grfica de pe o de sectores

    Se usa con datos cualitativos o cuantitativos, cada rebanada representa la proporcin de los datos contenidos en una clase de la tabla de frecuencias

    Grfico 3.- Nmero de Caras Secuencias Reales

    17%

    219%

    325%4

    11%

    526%

    64%

    74%

    84%

    12345678

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    28

    2.- Grfica de barras o columnas

    Grfica de barras o columnas. Se usa con datos cualitativos o cuantitativos, se puede hacer con la frecuencia absoluta o frecuencia relativa; cada rectngulo representa a cada clase o categora.

    MATERIAL PARTICULAR RAPEL TINGUIRIRICA - NEGRO

    0

    0,02

    0,04

    0,06

    0,08

    0,1

    0,12

    0,14

    Al Mn Mo Ni Pb Zn

    CONTAMINANTES

    PESO

    S ES

    PEC

    IFIC

    OS

    3.- Histograma

    Histograma. Se usa exclusivamente para datos cuantitativos, se puede hacer con la frecuencia absoluta o relativa; sirve para comparar las magnitudes representadas en cada intervalo de clase.

    Histograma sueldos empleados no calificados en miles

    0

    10

    20

    30

    40

    50

    60

    70

    1

    rango sueldos

    frec

    uenc

    ia

    [101-200][201-300][301-400][401-500][501-600][601-700][801-800][901-1000]

    Fuente: Teresa Brand Domnguez

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    29

    4.- Polgono de frecuencias

    Polgono de frecuencias. Se usa exclusivamente para datos cuantitativos, se puede hacer con frecuencia absoluta o relativa, sirve para observar la forma de la distribucin de frecuencias.

    Fuente: (Prtega Daz y Pita Fernndez)

    5.- Diagrama de caja

    El diagrama de Caja.- Es una representacin grfica basada en cuarteles , que ayuda a ilustrar un conjunto de datos. Para elaborar tal diagrama solamente se necesitan cinco valores estadsticos: Valor mnimo, primer cuartel )( 1Q , mediana, tercer cuartel )( 3Q , valor mximo

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    30

    6.- Diagrama de barras agrupadas

    Grfico Comparativo para Manganeso Disuelto y Partculado

    0,0000

    0,0500

    0,1000

    0,1500

    0,2000

    0,2500

    0,3000

    LLUT

    A DE

    SEMB

    OCAD

    URA

    SN.JO

    SE A

    NTES

    BOC

    .AZA

    PA

    LOA

    ESCO

    RIAL

    COPIA

    PO PT

    E.BOD

    EGA

    ELQU

    I ALM

    ENDR

    AL

    LIMAR

    I PAN

    AMER

    ICAN

    A

    ACON

    CAGU

    A PT

    E.COL

    MO

    MAIPO

    CHI

    IHU

    E

    RAPE

    L CAC

    HAPO

    AL-C

    ODAO

    RAPE

    L TIN

    GUIR

    IRIC

    A-NE

    GRO

    MATA

    QUITO

    TENO

    CAP

    T.

    ITATA

    UB

    LE C

    UCHA

    COX

    ITATA

    EN N

    UEVA

    ALD

    EA

    IMPE

    RIAL

    ALM

    AGRO

    Estaciones de Monitoreo

    Peso

    s Es

    pec

    ficos

    Fuente: Teresa Brand Domnguez (Tesis Doctoral)

    7.- Barras de error

    Fuente: (Prtega Daz y Pita Fernndez)

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    31

    8.- Grfico de lneas

    0,112

    0,114

    0,116

    0,118

    0,12

    0,122

    0,124

    0,126

    0,128

    0,13

    0,132

    1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 109 115 121 127 133 139 145 151 157 163 169 175 181 187 193 199 205 211 217 223 229 235

    Punto de datos

    Valo

    res

    Slid

    os T

    otal

    es S

    uspe

    ndid

    os

    RealPronstico

    Fuente: Teresa Brand Domnguez(Tesis Doctoral)

    9.- Grfica de dispersin

    Grfica de dispersin peso vs estatura

    y = 0,0026x + 1,4038R2 = 0,2895

    0

    0,5

    1

    1,5

    2

    0 50 100 150 200

    Peso

    Est

    atur

    a

    Serie1Lineal (Serie1)

    Fuente: Teresa Brand Domnguez

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    32

    10.- Diagramas de lneas superpuestas

    Fuente: (Prtega Daz y Pita Fernndez)

    11.- Diagrama de regresin logstica

    Fuente: (Prtega Daz y Pita Fernndez)

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    33

    12 Curva ROC

    Fuente: (Prtega Daz y Pita Fernndez)

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    34

    LABORATORIO N 1 Modelos aplicados a la ingeniera

    1.- Se tiene informacin del nmero de fallas en departamentos bsicos segn reclamos que se han formulado a 9 empresas constructoras. La informacin esta resumida en la siguiente y esta expresa en nmero de fallas por cada 100 unidades (departamentos). Constructoras Fallas en

    divisiones interiores y techos (1)

    Fallas en muros exteriores (2)

    Fallas en instalaciones sanitarias (3)

    Fallas en pisos (4)

    Fallas en instalaciones elctricas (5)

    Constructora1 12 21 10 5 16 Constructora2 9 13 13 7 10 Constructora3 7 8 9 10 11 Constructora4 11 9 11 6 9 Constructora5 5 14 9 9 11 Constructora6 7 21 23 12 13 Constructora7 14 13 15 8 7 Constructora8 5 9 10 7 14 Constructora9 8 6 7 9 11 Constructora10 13 15 6 11 10 Determine: Usando comandos estadsticos de EXCEL segn corresponda

    A) Calcule qu constructoras estn sobre el promedio en fallas en muros exteriores? Haga grfico.

    B) Qu constructoras esta bajo el 50% en las fallas en instalaciones sanitarias C) Cul de las fallas tiene una mayor dispersin? D) Haga grfico de barras para comparar (1)-(3)-(4) E) Cul es el tipo de falla ms recurrente en este problema? F) Qu constructoras estn sobre el 75% de las fallas en instalaciones elctricas G) A que constructora Ud. No le comprara un departamento?, H) Determine el coeficiente de correlacin entre las diferentes fallas, haga el de

    dispersin y encuentre la recta de regresin. I) JUSTIFIQUE y complemente el anlisis

    2.- Se tiene la siguiente informacin relativa a los precios de venta de departamento cuya venta se gestion a travs de una conocida feria el primer semestre de 2009. La informacin se presenta en la siguiente tabla:

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    35

    Precios Venta (UF) N. Deptos.

    vendidos 500-699 15 700-899 20 900-1099 14 1100-1299 30 1300-1499 40 1500-1699 24 1700-1899 16 1900-2099 10

    Determinar:

    A) Marca de clase, B) histograma,

    C) Cul es la frecuencia relativa de la clase 1300-1499,

    D)Cul es el promedio de departamentos vendidos

    E) El 50% de los departamentos ms baratos cuestan menos de ? ,

    F) El 25% de los departamentos ms caros cuesta ms de ?,

    G) Cunto cuestan los departamentos ms vendidos?

    H) El 67% de los departamentos tiene un valor inferior a ?

    I) Qu porcentaje de los departamentos tienen un valor inferior a UF 1.550,

    J) determine la desviacin estndar

    k) Haga grfica de sectores,

    L) Complemente el anlisis y justifique.

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    36

    Pauta de Correccin Laboratorio 1

    1.- Se tiene informacin del nmero de fallas en departamentos bsicos segn reclamos que se han formulado a 9 constructoras. La informacin est resumida en la siguiente tabla y est expresada en nmero de fallas por cada 100 unidades (departamentos)

    Tabla 1.- Datos Originales Constructoras Fallas en Fallas en Fallas en Fallas en Fallas en divisiones muros instalaciones pisos (4) instalaciones

    interiores y exteriores (2) sanitarias(3) elctricas (5)

    techos (1) Constructora1 12 21 10 5 16 Constructora2 9 13 13 7 10 Constructora3 7 10 9 12 15 Constructora4 11 9 11 6 9 Constructora5 5 14 9 9 11 Constructora6 7 21 23 12 13 Constructora7 14 13 15 8 7 Constructora8 5 9 12 7 14 Constructora9 8 18 7 9 11 Constructora10 13 15 6 11 10

    Cuadro 1.- Estadsticos Bsicos Mximo 14 21 23 12 16 Mnimo 5 9 6 5 7 rango 9 12 17 7 9 promedio 9,1 14,3 11,5 8,6 11,6 mediana 8,5 13,5 10,5 8,5 11 moda 7 21 9 7 10 desv estndar 3,24722103 4,49814777 4,85912658 2,45854519 2,83627298 varianza 10,5444444 20,2333333 23,6111111 6,04444444 8,04444444 coef. Variacin 0,35683748 0,31455579 0,42253275 0,28587735 0,24450629 1er cuartil 7 10,75 9 7 10 3er cuartil 11,75 17,25 12,75 10,5 13,75 Percentil 0,9 13,1 21 15,8 12 15,1 2do. Quintil 7,6 13 9,6 7,6 10,6

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    37

    Respuestas a las preguntas: a) Qu constructoras estn sobre el promedio en fallas muros exteriores?.- Haga grfico. Tabla 1.2.- Fallas en muros exteriores Constructora1 21 14,3Constructora2 13 14,3Constructora3 10 14,3Constructora4 9 14,3Constructora5 14 14,3Constructora6 21 14,3Constructora7 13 14,3Constructora8 9 14,3Constructora9 18 14,3Constructora10 15 14,3

    Grfico 1.2.- Fallas en muros exteriores vs promedio

    0

    5

    10

    15

    20

    25

    Cons

    tructo

    ra1

    Cons

    tructo

    ra2

    Cons

    tructo

    ra3

    Cons

    tructo

    ra4

    Cons

    tructo

    ra5

    Cons

    tructo

    ra6

    Cons

    tructo

    ra7

    Cons

    tructo

    ra8

    Cons

    tructo

    ra9

    Cons

    tructo

    ra10

    Constructoras

    Nm

    ero

    de fa

    llas

    N de Fallaspromedio

    Como se puede visualizar en el grfico 1.2. y tabla 1.2. El 40% de las constructoras est sobre el promedio (14,3) de fallas en muros exteriores.

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    38

    b) Qu constructoras estn bajo el 50% en las fallas en instalaciones sanitarias? Tabla 1b.- Fallas instalaciones sanitarias Constructora1 10 10,5Constructora2 13 10,5Constructora3 9 10,5Constructora4 11 10,5Constructora5 9 10,5Constructora6 23 10,5Constructora7 15 10,5Constructora8 12 10,5Constructora9 7 10,5Constructora10 6 10,5

    Grfico 1b.- Fallas en instalaciones sanitarias vs mediana

    0

    5

    10

    15

    20

    25

    Const

    ructor

    a1

    Const

    ructor

    a2

    Const

    ructor

    a3

    Const

    ructor

    a4

    Const

    ructor

    a5

    Const

    ructor

    a6

    Const

    ructor

    a7

    Const

    ructor

    a8

    Const

    ructor

    a9

    Const

    ructor

    a10

    Constructoras

    Nm

    ero

    de fa

    llas

    N de fallaspromedio

    Como se puede ver en tabla1b.- y Grfico 1b.- el 50% de las constructoras que estn bajo la mediana, son constructoras: 1, 3,5,9,10

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    39

    c) Cul de las fallas tiene una mayor dispersin? Constructoras Fallas en Fallas en Fallas en Fallas en Fallas en divisiones muros instalaciones pisos (4) instalaciones

    interiores y exteriores

    (2) sanitarias(3) elctricas (5) techos (1)

    coef. Variacin 0,35683748 0,31455579 0,42253275 0,28587735 0,24450629 Existe heterogeneidad en las fallas en instalaciones sanitarias, con lo que se vuelve a reiterar se debe realizar capacitacin en el rea de instalaciones sanitarias al igual que mejorar el control del calidad de dicho procedimiento. d) Haga un grfico de barras para comparar (1)-(3)-(4) Tabla 1d.- Comparativo Fallas divisiones-sanitarias-pisos Constructoras Fallas en Fallas en Fallas en divisiones instalaciones pisos (4) interiores y sanitarias(3) techos (1) Constructora1 12 10 5Constructora2 9 13 7Constructora3 7 9 12Constructora4 11 11 6Constructora5 5 9 9Constructora6 7 23 12Constructora7 14 15 8Constructora8 5 12 7Constructora9 8 7 9Constructora10 13 6 11

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    40

    Grfico 1d.- Comparativo fallas divisiones interiores y muros - fallas instalaciones sanitarias- fallas pisos

    0

    5

    10

    15

    20

    25

    Cons

    tructo

    ra1

    Cons

    tructo

    ra2

    Cons

    tructo

    ra3

    Cons

    tructo

    ra4

    Cons

    tructo

    ra5

    Cons

    tructo

    ra6

    Cons

    tructo

    ra7

    Cons

    tructo

    ra8

    Cons

    tructo

    ra9

    Cons

    tructo

    ra10

    Constructoras

    Nm

    ero

    de fa

    llas

    divisiones y murossanitariaspisos

    Como se puede observar en la grfica tenemos serias deficiencias en divisiones interiores y techos e instalaciones sanitarias, siendo extraordinariamente grave la situacin con la constructora 6 en instalaciones sanitarias y pisos no as en divisiones interiores y techos. e) Cul es la falla ms recurrente en este problema? Tabla1f.- Falla ms recurrente Constructoras Fallas en Fallas en Fallas en Fallas en Fallas en divisiones muros instalaciones pisos (4) instalaciones

    interiores y exteriores (2) sanitarias(3) elctricas (5)

    techos (1) 7 21 9 7 10 Fallas en muros exteriores, ver tabla 1f

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    41

    f) Qu constructoras estn sobre el 75% de las fallas en instalaciones elctricas? Tabla 1f.1- Inst elcricas vs 3er cuartil Constructora1 16 13,75Constructora2 10 13,75Constructora3 15 13,75Constructora4 9 13,75Constructora5 11 13,75Constructora6 13 13,75Constructora7 7 13,75Constructora8 14 13,75Constructora9 11 13,75Constructora10 10 13,75

    Grfica 1f .- Fallas en instalaciones elctricas constructoras estn sobre tercer cuartil

    0 2 4 6 8 10 12 14 16 18

    Constructora1

    Constructora2

    Constructora3

    Constructora4

    Constructora5

    Constructora6

    Constructora7

    Constructora8

    Constructora9

    Constructora10

    Nm

    ero

    de fa

    llas

    Constructoras

    3er cuartilfallas elctricas

    Como se puede ver en el grfico anterior sobre el 75% de las fallas en instalaciones elctricas est la constructora 1 constructora 3 y constructora 8.

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    42

    g) A que empresa constructora no le comprara una vivienda social. Tabla 1g- Datos Originales y estadigrafos por constructora

    Constructoras Fallas en Fallas en Fallas en

    Fallas en Fallas en prom

    desv estnda

    coef variacio

    divisiones muros exte instalaciones

    pisos (4) instalaciones

    interiores y

    riores (2) sanitarias(3) elctricas (5)

    techos (1)

    Constructora1 12 21 10 5 16 12,8 6,058052 0,47329Constructora2 9 13 13 7 10 10,4 2,607681 0,25074Constructora3 7 10 9 12 15 10,6 3,04959 0,2877Constructora4 11 9 11 6 9 9,2 2,04939 0,22276Constructora5 5 14 9 9 11 9,6 3,286335 0,34233Constructora6 7 21 23 12 13 15,2 6,648308 0,43739Constructora7 14 13 15 8 7 11,4 3,646917 0,3199Constructora8 5 9 12 7 14 9,4 3,646917 0,38797Constructora9 8 18 7 9 11 10,6 4,393177 0,41445Constructora10 13 15 6 11 10 11 3,391165 0,30829 Segn la tabla 1g.- No se les debera comprar a las constructoras 1, constructora 6 y Constructora 9, debido a la heterogeneidad de sus procesos. Se sugiere a ests empresas hacer una revisin profunda de sus procedimientos, de las competencias de sus trabajadores y adems considerar realizar controles peridicos de sus procesos por parte del departamento de estudios y control de calidad de la empresa.

    Grfico 1k.- Promedio general fallas vs promedio de fallas por constructora

    0

    5

    10

    15

    20

    Cons

    tructo

    ra1

    Cons

    tructo

    ra2

    Cons

    tructo

    ra3

    Cons

    tructo

    ra4

    Cons

    tructo

    ra5

    Cons

    tructo

    ra6

    Cons

    tructo

    ra7

    Cons

    tructo

    ra8

    Cons

    tructo

    ra9

    Cons

    tructo

    ra10

    Constructoras

    prom

    edio

    de

    falla

    s

    prom fallas constructoraprom general

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    43

    Finalmente observando grfico 1k, se podr concluir que son las constructoras 1 y 6 las que tienen mayores problemas. La constructora 6 tiene grandes problemas en el rea instalaciones sanitarias, la particularidad de est situacin es que si la empresa logra resolver sus problemas en pisos e instalaciones sanitarias resolvera de gran manera la problemtica que la afecta, por otro lado la constructora 1 tiene gran heterogeneidad en sus procesos por lo que se sugiere capacitar a su mano de obra as como tambin mejorar el proceso de inspeccin.(Ver tabla 1g) ______________________________________________________________________ 2.- Se tiene la siguiente informacin relativa a los precios de venta de departamento cuya venta se gestion a travs de una conocida feria el primer semestre de 2009. La informacin se presenta en la siguiente tabla: Precios Venta (UF) N. Deptos.

    vendidos 500-699 15 700-899 20 900-1099 14 1100-1299 30 1300-1499 40 1500-1699 24 1700-1899 16 1900-2099 10 a) Marca de clase Tabla 2.- Datos deptos vendidos

    Precio venta (UF) N Deptos vendidos M.clase

    500 699 15 599,5700 899 20 799,5900 1099 14 999,5

    1100 1299 30 1199,51300 1499 40 1399,51500 1699 24 1599,51700 1899 16 1799,51900 2099 10 1999,5

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    44

    b) Histograma Tabla 2.1- Datos deptos vendidos

    Precio venta (UF) N Deptos vendidos

    [500 - 699] 15[700 - 899] 20[900 - 1099] 14[1100 - 1299] 30[1300 - 1499] 40[1500 - 1699] 24[1700 - 1899] 16[1900 - 2099] 10

    Grfico 2.1.- Histograma

    0

    5

    10

    15

    20

    25

    30

    35

    40

    45

    1

    Intervalos

    Nm

    ero

    de D

    epar

    tam

    ento

    s ve

    ndid

    os

    [500 - 699][700 - 899][900 - 1099][1100 - 1299][1300 - 1499][1500 - 1699][1700 - 1899][1900 - 2099]

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    45

    c) Cul es la frecuencia relativa de la clase 1300-1499? Tabla 2.2- Datos deptos vendidos

    Precio venta (UF) N Deptos vendidos M.clase f. relativa

    500 699 15 599,5 0,0887574 700 899 20 799,5 0,1183432 900 1099 14 999,5 0,08284024

    1100 1299 30 1199,5 0,17751479 1300 1499 40 1399,5 0,23668639 1500 1699 24 1599,5 0,14201183 1700 1899 16 1799,5 0,09467456 1900 2099 10 1999,5 0,0591716

    d) Promedio de Departamentos ms vendidos Tabla 2.2- Datos deptos vendidos

    Precio venta (UF) N Deptos vendidos M.clase f. relativa

    f. relat acum prom

    500 699 15 599,5 0,0887574 0,0887574 8992,5700 899 20 799,5 0,1183432 0,2071006 15990900 1099 14 999,5 0,08284024 0,2899408 13993

    1100 1299 30 1199,5 0,17751479 0,4674556 359851300 1499 40 1399,5 0,23668639 0,704142 559801500 1699 24 1599,5 0,14201183 0,8461538 383881700 1899 16 1799,5 0,09467456 0,9408284 287921900 2099 10 1999,5 0,0591716 1 19995

    total 169 suma 218115,5 Prom. 1290,624 El valor promedio de los departamentos vendidos es de UF. 1290 El nmero promedio de departamentos vendidos por intervalo es 21,13 e) El 50% de los departamentos ms baratos cuestan menos de ?

    UFMe 36,1327199*40

    792

    169

    1300 =

    += El 50% de los departamentos ms baratos cuestan menos de UF 1327,36

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    46

    f) El 25% de los departamentos ms caros cuestan ms de?

    UFercuartil 26,1564199*24

    1194169*3

    15003 =

    += El 25% de los departamentos ms caros cuestan ms de UF 1564,26. g) Cunto cuestan los departamentos ms vendidos?

    UFModa 538,1376199*)2440()3040(

    30401300 =++=

    h) El 67% de los departamentos tiene un valor inferior a:

    UFPercentil 99,1470199*40

    79100

    169*67

    130067 =

    += El 67% de los departamentos tiene un valor inferior a UF 1470,99 i) Qu porcentaje de los departamentos tienen un valor inferior a UF 1550?

    98,73199*24

    119100

    169*

    15001550 =

    +=i

    Luego el 73,98% de los departamentos tiene un valor inferior a UF 1550. j) Determine la desviacin estndar

    var 150932,66desv estan 388,50052

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    47

    k) Grfica de sectores

    Grfica2k .- de Sectores asociados a valores de venta de departamentos por tramos en UF

    [500 - 699]; 15; 9%

    [700 - 899]; 20; 12%

    [900 - 1099]; 14; 8%

    [1100 - 1299]; 30; 18%[1300 - 1499]; 40; 24%

    [1500 - 1699]; 24; 14%

    [1700 - 1899]; 16; 9%

    [1900 - 2099]; 10; 6%

    [500 - 699][700 - 899][900 - 1099][1100 - 1299][1300 - 1499][1500 - 1699][1700 - 1899][1900 - 2099]

  • UNIVERSIDAD TECNOLOGICA METROPOLITANA DEPARTAMENTO DE MATEMTICA SEDE SAN IGNACIO _____________________________________________________________________________________

    Estadstica Descriptiva Dra. Ing. Teresa Brand Domnguez

    48

    Laboratorio 1

    Modelos Aplicados a la Ingeniera

    Problemas Propuestos

    1.- Hacer un completo anlisis de la calidad de la vivienda social en Chile, regin por regin desde el punto de vista de los materiales y procesos constructivos; hacer un anlisis estadstico de los datos recopilados. 2.- Averige las causas fundamentales por las que colapsaron para el terremoto del 27 de febrero 2010 edificios nuevos con 5 o menos aos de antigedad. Considere: Suelo (tipo) Estructuras Materiales Procesos Especificaciones Apego a normas 3.- En autopistas de la regin metropolitana identifique las causas fundamentales del colapso de algunos tramos, e indique como afect la derogacin del uso de travesaos para abaratar costos (identifique dicha ordenanza).