70
Introducci´ on Par´ ametros Ejemplos Tema 1A: Estad´ ıstica Descriptiva Descripci´ on de una variable Departamento Matem´ atica Aplicada Universidad de M´ alaga Curso 2012-2013 Departamento Matem´ atica Aplicada Tema 1A: Estad´ ıstica Descriptiva una variable P´ ag. 1

Tema1_ED

Embed Size (px)

DESCRIPTION

Estadística 1

Citation preview

  • IntroduccionParametrosEjemplos

    Tema 1A: Estadstica DescriptivaDescripcion de una variable

    Departamento Matematica Aplicada

    Universidad de Malaga

    Curso 2012-2013

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 1

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Tema 1A: Estadstica Descriptiva

    La estadstica es la ciencia de los datos; implica la coleccion,clasificacion, sntesis, organizacion, analisis e interpretacion de losdatos.Suele aplicarse a dos tipos de problemas:

    Resumir, describir y explorar datos referidos a un colectivo.

    Utilizar datos de muestras para deducir conclusiones sobre uncolectivo mas amplio del cual se escogieron las muestras.

    La rama de la estadstica que se dedica a la organizacion, sntesis ydescripcion de conjuntos de datos es la estadstica descriptiva.

    La rama de la estadstica que se ocupa de utilizar datos demuestras, para inferir algo acerca de la poblacion de la queprovienen, se denomina estadstica inferencial.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 2

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Conceptos previos

    Poblacion: Conjunto de elementos que son objeto de estudio.Individuo: Cada uno de los elementos de la poblacion descritomediante una serie de caractersticas a las que se refiere el estudioestadstico.Muestra: Una muestra es un subconjunto no vaco de individuosde la poblacion. El numero de elementos que componen la muestrase denomina tamano muestral (N) y si coincide con el tamano dela poblacion decimos que se esta realizando un censo.Caracteres: Los caracteres son las caractersticas de los individuosde la poblacion que son objeto de estudio. Pueden ser cualitativos(nominales u ordinales) o cuantitativos (discretos o continuos).Modalidades: Las diferentes situaciones posibles del caracter sedenominan modalidades. Tales situaciones deben estar biendefinidas de tal manera que cada individuo pertenezca a una ysolo una modalidad.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 3

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Tipos de caracteres: Ejemplos

    Cualitativo nominal:Pas={Francia, Espana,...}Color={Rojo, Verde, Amarillo, . . . }

    Cualitativo ordinal: (Comun en escalas jerarquicas){Todo, Mucho, Regular, Poco, Nada}{Muy alto, Alto, Regular, Bajo, Muy Bajo}

    Cuantitativo discreto:Numero de hijos={0, 1, . . . };Numero de smbolos en un mensaje={2, 3, . . . }

    Cuantitativo continuo:Altura en cm.Peso en Kg.Ruido en decibelios (dB).

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 4

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Frecuencias

    Consideremos una poblacion y una muestra de tamano N y sea Xun caracter con modalidades x1, x2, . . . , xk (ordenadas si soncuantitativas):

    Definicion

    La frecuencia absoluta (ni ) de la modalidad xi es el numero deindividuos de la muestra que presentan esa modalidad.

    Definicion

    La frecuencia relativa (fi ) de la modalidad xi es el cociente entrela frecuencia absoluta y el tamano de la muestra,

    fi =niN.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 5

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Frecuencias-2

    Ejemplo

    Los precios (en euros) de los menus servidos durante un da en unrestaurante determinado son: 6, 8, 6, 8, 6, 8, 12, 6, 8, 8, 6, 8, 8, 8, 12,12, 8, 8, 12, 6, 8, 6, 6, 8, 12, 6, 6, 6, 6, 6.

    Expresado en forma de tabla de frecuencias:

    Figura: Tabla de frecuencias

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 6

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Frecuencias-2

    Ejemplo

    Los precios (en euros) de los menus servidos durante un da en unrestaurante determinado son: 6, 8, 6, 8, 6, 8, 12, 6, 8, 8, 6, 8, 8, 8, 12,12, 8, 8, 12, 6, 8, 6, 6, 8, 12, 6, 6, 6, 6, 6.

    Expresado en forma de tabla de frecuencias:

    Figura: Tabla de frecuencias

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 7

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Frecuencias Acumuladas

    Definicion

    La frecuencia absoluta acumulada (Ni ) de una modalidad xi dela variable X es la suma de las frecuencias de los valores que soninferiores o iguales a el (Ni =

    j=ij=1 nj).

    Definicion

    La frecuencia relativa acumulada (Fi ) de una modalidad xi de Xes el cociente entre la frecuencia absoluta acumulada y el tamanode la muestra,

    Fi =NiN.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 8

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Distribuciones de frecuencias. Tablas estadsticas

    La distribucion de frecuencias de un caracter, sea cualitativo(atributo) o sea cuantitativo (variable estadstica), esta constituidapor las distintas modalidades del caracter junto a lascorrespondientes frecuencias.Generalmente, las distribuciones se presentan en forma de tablaestadstica o de frecuencias. Esta forma de representacion permitetener organizada y resumida la informacion contenida en elconjunto de datos y presentada de forma mas comprensible ysignificativa.Las distribuciones de frecuencias son basicamente de dos tipos:discretas y continuas.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 9

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Distribuciones discretas

    Consideramos que la distribucion de frecuencias es discreta si elcaracter es cualitativo o si el caracter es cuantitativo, pero elnumero de modalidades es pequeno en relacion con el numero deobservaciones.En el ejemplo anterior, la distribucion de frecuencias es discreta ysu tabla estadstica es:

    Las distribuciones de caracteres cualitativos se analizan comodiscretas, aunque para las nominales no tendran sentido lasfrecuencias acumuladas.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 10

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Distribuciones continuas

    Consideramos que la distribucion de frecuencias es continuacuando el numero de observaciones y el numero de modalidades esmuy grande.

    Los datos se agrupan en intervalos (clases) y se determina elnumero de individuos que pertenecen a cada intervalo. Usualmentelos intervalos seran de la forma Ii = (Li1, Li ]. Por convenio: Losintervalos extremos de la forma (, L1], o (Lk1,) seconsideran de igual amplitud que sus adyacentes.Los intervalos tienen que formar una particion. Su uso supone unaperdida de informacion y es importante elegir un numero adecuadode intervalos que no suponga una perdida significativa.

    Los puntos medios de las clases son llamados marcas de clases.

    La tabla estadstica se obtiene a partir de los intervalos, sus marcasde clase y las frecuencias correspondientes.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 11

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Ejemplo

    Los precios pagados por las consumiciones realizadas en unacafetera a lo largo de un determinado da vienen dadas en la tabla

    Amplitud de un intervalo: ai = Li Li1Marca de clase: xi =

    Li1+Li2

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 12

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Representaciones graficas

    Muestran la distribucion de frecuencias y deben ser capaces detransmitir informacion de la muestra permitiendo observar algunascaractersticas de los datos. Tratan de facilitar una sntesis visual yconviene cuidar la presentacion (colores, formas, . . . ). El tipo decaracter establece una clasificacion de las representaciones graficas.

    Caracteres cualitativos. No hay orden numerico.Diagrama de rectangulos o barras: Cada modalidad serepresenta mediante una barra cuya altura es la frecuenciaabsoluta o relativa.

    Diagrama de sectores: Crculo con sectores de areaproporcional a la frecuencia de la modalidad correspondiente.

    Pictograma y cartograma: Representacion iconica condibujos simbolicos o mapas.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 13

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Ejemplo

    Los estudiantes de una universidad se dividen en 5 grupos segun suprocedencia de acuerdo a la siguiente distribucion de frecuencias:

    Dicha informacion podemos representarla mediante un diagramade barras o un diagrama de sectores:

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 14

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Caracteres cuantitativos. Se realizan sobre los ejes decoordenadas

    Diagrama de barras o puntos: Caso discreto. Con barrasverticales o puntos en los extremos; la longitud de la barraqueda determinada por la frecuencia y el valor de la variabledetermina el lugar del eje horizontal donde se apoya.

    Histograma: Datos agrupados en intervalos. En cada clasedibujamos un rectangulo sobre el eje X con base el intervalo yarea proporcional a la frecuencia a representar.

    Polgono de frecuencias: Se obtiene uniendo los extremos delas barras en el diagrama de barras o los puntos mediossuperiores de los rectangulos en el histograma. Al inicio y finalse consideran dos nuevos intervalos de igual amplitud que elprimero y ultimo.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 15

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Ejemplo

    Durante un periodo de 35 das las temperaturas (en gradosFahrenheit) a las 6 de la manana han sido:

    Dicha informacion podemos representarla mediante:Lmites Marcas Frecuenciasde clase de clase ni70-75 72.5 375-80 77.5 780-85 82.5 785-90 87.5 590-95 92.5 895-100 97.5 2100-105 102.5 0105-110 107.5 3

    Suma 35

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 16

  • IntroduccionParametrosEjemplos

    GeneralidadesFrecuenciasGraficas

    Ejemplo-cont.

    Pero tambien:

    Lmites Marcas Frecuencias Ampl. Altura

    de clase de clase ni fi =ni35

    ai hi =fiai

    70-80 75.0 10 0.2857 10 0.028680-85 82.5 7 0.2000 5 0.040085-90 87.5 5 0.1428 5 0.028690-95 92.5 8 0.2286 5 0.045795-110 102.5 5 0.1428 15 0.0095

    Suma 35 1

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 17

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Medidas de tendencia central: Medias, mediana y moda

    Las medidas de posicion son valores numericos descriptivoscalculados a partir de los datos. Destacan las medidas de tendenciacentral que ayudan a encontrar el centro de la distribucion o laposicion relativa de una observacion dentro del conjunto de datos.Consideremos la variable X con valores x1, x2, . . . , xk yfrecuencias n1, n2, . . . , nk ; siendo N el numero total de datos.

    Definicion

    La media aritmetica simple es la suma de todos los valoresdivididos por el numero total de datos

    x =

    ki=1 xiniN

    =ki=1

    xifi.

    Se usa x para la media muestral y para la media de la poblacion.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 18

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Ejemplo 1

    Ejemplo

    Si consideramos los valores numericos 7, 11, 11, 8, 12, 7, 6, 6La media aritmetica simple viene dada por

    x =7 + 11 + 11 + 8 + 12 + 7 + 6 + 6

    8= 8.5

    Cuando la variable es continua y los valores estan agrupados porintervalos, consideraremos las marcas de clase como los valoresde la variable y la frecuencia absoluta al numero de datoscontenidos en el intervalo.

    Ejemplo

    Calcular la media aritmetica en el ejemplo de las temperaturas.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 19

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Solucion

    Lmites de clase Frecuencia Marca deLi1 Li absoluta (ni ) clase (xi ) nixi70 75 3 72.5 217.575 80 7 77.5 542.580 85 7 82.5 577.585 90 5 87.5 437.590 95 8 92.5 740.095 100 2 97.5 195.0100 105 0 102.5 0.0105 110 3 107.5 322.5

    35 3032.5

    La media aritmetica simple vale:

    x =3032.5

    35= 86.642857

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 20

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Observacion

    La media es el centro de gravedad de la distribucion.

    La media puede no corresponderse con ningun valor de lavariable.

    La media es muy sensible a valores extremos (inusuales oatpicos) de la variable

    Ejemplo: Dados los datos 5.3; 4.7; 5.2; 4.9; 49 la media aritmeticaes x = 13.82 que no representa nada.Por otra parte, el ultimo dato 49 puede ser erroneo y ser, enrealidad, 4.9. La media sera entonces x = 5.Depende demasiado de algun dato erroneo. Se dice que espoco robusta.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 21

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Transformacion afn

    Si a partir de los valores de una variable X , construimos otraY = aX + b, es decir: yi = axi + b, entonces:

    y = ax + b

    Ejemplo: Hallar la media de la variable X en la tabla:

    xi ni13.725 713.975 1414.225 1814.725 6

    Podemos facilitar los calculos haciendo el cambio:X = 0.25Y + 13.975 Y = X13.9750.25 x = 0.25y + 13.975

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 22

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Solucion:xi ni yi =

    xi13.9750.25 niyi

    13.725 7 1 713.975 14 0 014.225 18 1 1814.725 6 3 18

    45 29

    y =29

    45= 0.64444444

    x = 0.2529

    45+ 13.975 14.1361111

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 23

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Media ponderada

    Definicion

    La media ponderada de los datos xi por los pesos wi se definecomo:

    xw =

    i xiwii wi

    Ejemplo

    Las calificaciones de un alumno son 2.6; 3.7; 5.1, 4.9 y 6.4. Las 3primeras corresponden a controles con ponderacion 1, la cuarta esla nota de practicas con ponderacion 2 y la ultima es el examenfinal con ponderacion 3. Cual es la nota media?

    Las ponderaciones son w = {1, 1, 1, 2, 3}

    xw =2.6 1 + 3.7 1 + 5.1 1 + 4.9 2 + 6.4 3

    1 + 1 + 1 + 2 + 3= 5.05

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 24

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Media armonica

    Definicion

    La media armonica (H) de los datos xi se define mediante:

    H =Ni1xi

    Si los datos estan agrupados puede usarse:

    H =Ninixi

    donde N =

    i ni

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 25

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Ejemplo 1

    Ejemplo

    Tenemos 10 condensadores, 5 de 1F , 3 de 2F y los otros 2 de5F conectados en serie. Queremos usar un unico tipo decondensador (los 10 iguales). Cual debe ser su capacidad?

    Evidentemente debe tener una capacidad intermedia. Peroteniendo en cuenta que la capacidad equivalente C a varioscondensadores conectados en serie cumple: 1C =

    i1Ci

    tenemos:

    1

    C=

    5

    1+

    3

    2+

    2

    5=

    10

    CH CH = 105

    1 +32 +

    25

    = 1.44927536

    que es la media armonica.Tambien vale para resistencias en paralelo.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 26

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Ejemplo 2

    Ejemplo

    Se quiere comparar la duracion del establecimiento de conexionentre dos protocolos. El protocolo A produce los valores (en ms.):{10.8; 5.3;; 12.4; 8.5; 7.7; 7.9; 4.4}, mientras que el protocolo Bproduce: {6.6;; 4.6; 2.3; 1.3; 3.3; 4.9;; 2.8; 2.2; 3.5; 1.7; 2.1;3.9; 3.4; 3.8; 4.0}Podemos usar la media armonica, pero no la aritmetica:

    HA =8

    110.8 +

    15.3 +

    1 +

    112.4 +

    18.5 +

    17.7 +

    17.9 +

    14.4

    = 8.3048788

    HB =17

    16.6 +

    1 +

    14.6 +

    12.3 + . . .+

    13.8 +

    14

    = 3.20419429

    As pues, parece mejor el B, a pesar de que no establece la llamadaen el 11.76% de los casos estudiados.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 27

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Media cuadratica o Valor cuadratico medio (RMS)

    Definicion

    La media cuadratica de los datos xi se obtiene mediante laexpresion:

    xC =

    i x

    2i

    N, o bien para datos agrupados: xC =

    i nix

    2i

    N

    Ejemplo

    Al contabilizar durante una semana el numero de llamadasrecibidas en un servicio tecnico debido a algun tipo de avera, seobtuvieron los valores: 2, 3, 1, 0, 4, 3. Hallar la media cuadratica.

    xC =

    22 + 32 + 12 + 02 + 42 + 32

    6=

    39

    6=6.5 2.54951

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 28

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Moda

    Definicion

    La moda (Mo) de un conjunto de datos es el valor de la variableque presenta mayor frecuencia. Puede no ser unica o puede que noexista si todos los valores tienen la misma frecuencia

    Ejemplo

    Si consideramos el conjunto de datos A = {7, 11, 11, 8, 12, 9, 6, 6},tenemos dos modas que corresponden a los valores 6 y 11En B = {7, 11, 11, 8, 12, 12, 12, 7, 6, 6} la moda es el 12En C = {7, 11, 8, 12, 9, 6} no hay moda.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 29

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Calculo de la moda:

    Si la variable es cualitativa o discreta sera la clase con mayorfrecuencia (absoluta o relativa).

    Si la variable es continua, debemos tener en cuenta laamplitud de los intervalos y llamaremos intervalo modal alque tenga mayor hi =

    niai

    (mayor altura en el histograma).Posteriormente la moda sera:

    Mo = Li1 +1

    1 +2ai

    donde:Li1 = Extremo inferior del intervalo modal.ai = Amplitud del intervalo modal.1 = hi hi12 = hi hi+1

    NOTA: Si no existe la clase i 1 o i + 1 consideraremos como 0el valor de hi1 o hi+1 respectivamente.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 30

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Mediana

    Es una medida central mas robusta frente a los datos que la media.

    Definicion

    La mediana (Me) es aquel valor de la variable estadstica tal que,supuesto ordenados en orden creciente los datos, divide en dospartes iguales a la distribucion de frecuencias. Caso de datos noagrupados, si N es impar la mediana coincide con el termino en laposicion (N + 1)/2 y si N es par la mediana es la media de losvalores en las posiciones N/2 y N/2 + 1.

    Ejemplo

    Consideremos las listas de numeros ordenadosListA = {11, 11, 16, 17, 25} y ListB = {1, 4, 8, 8, 10, 16, 16, 19}; lamediana de ListA es 16 y la de ListB es

    8+102 = 9.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 31

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Cuantiles:

    Constituyen una generalizacion del concepto de mediana.

    Definicion

    Cuantiles Dado un valor c (0, 1) se define el cuantil c como elvalor X (c) tal que, supuesto ordenados en orden creciente losdatos, divide en dos partes a la distribucion de frecuencias, laprimera con el 100c % de los datos y la segunda con el resto.

    Evidentemente la mediana coincide con el cuantil c = 0.5.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 32

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Cuartiles, deciles y percentiles

    Definicion

    Cuartiles. Son tres valores con las siguientes caractersticas:Q1 = X (0.25): Valor que deja por debajo 1/4 de la poblacion.Q2 = X (0.5) = Me: Deja por debajo la mitad de la poblacion.Q3 = X (0.75): Deja por debajo 3/4 de la poblacion.

    Definicion

    Deciles Hay 9 deciles que dividen a la poblacion en 10 partesiguales. Dk = X (

    k10).

    Definicion

    Percentiles Hay 99 percentiles que dividen a la poblacion en 100partes iguales. Se denotan por Pk = X (

    k100) y corresponden a los

    cuantiles k100 para k = 1 : 99.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 33

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Calculo del cuantil c

    Caso discreto: Realizamos la descomposicion de cN en suparte entera (E) y decimal (D): cN = E+D

    Si D 6= 0, X (c) es el valor que ocupa el lugar (E + 1)Si D = 0, X (c) =

    valor de lugar (E)+valor de lugar (E+1)2

    Caso continuo: Calculo cN. En la columna de las frecuenciasacumuladas Ni busco la primera que rebasa ese valorNi1 cN < Ni , a continuacion aplico la formula

    X(c) = Li1 +cNNi1

    niai

    donde:Li1 : Limite inferior del intervalo (Li1, Li ].Ni1 : Frecuencia absoluta acumulada correspondiente alintervalo anterior.ai : Amplitud del intervalo.ni : Frecuencia absoluta del intervalo.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 34

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Ejemplo

    Ejemplo

    Calcular los cuartiles y los percentiles: P37 y P68 para los siguientesvalores numericos: 2, 5, 3, 4, 7, 0, 11, 2, 3, 8

    En primer lugar, ordenamos los N = 10 valores en orden creciente:0, 2, 2, 3, 3, 4, 5, 7, 8, 11Q1 : Calculamos N/4=2.5. Como no es entero se trata del queocupa el tercer lugar, luego Q1 = 2.Mediana = Q2 : Calculo 10/2=5 que es entero, luego es la mediaentre el 5o y 6o valor: Me = 3+42 = 3.5Q3 : Nc=10*3/4=7.5, no es entero luego tomo el 8

    o valor: Q3 = 7.P37 : Calculo 10(37/100)=3.7, no es entero, tomo el 4

    o

    P37 = 3.P68 : Calculo 10(68/100)=6.8, no es entero, tomo el 7

    o

    P68 = 5.Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 35

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Ejercicio

    Consideremos los siguientes 50 valores ordenados:

    10 20 35 44 55 64 75 81 87 9911 22 36 48 56 68 76 82 89 10113 23 38 49 57 69 76 83 90 10215 23 41 50 60 70 78 83 94 10518 30 44 50 63 73 80 85 96 107

    Calcular P5, P95, Q1, Me y Q3.

    P5 : v = 50 5100 = 2.5 busco el 3o, por lo que P5 = 13P95 : v = 50 95100 = 47.5 busco el 48o, por lo que P95 = 102Q1 : v = 50 14 = 12.5 busco el 13o, por lo que Q1 = 38Me : v = 50 12 = 25 saco la media entre el 25o y 26o, por loque Me = 63+642 = 63.5Q3 : v = 50 34 = 37.5 busco el 38o, por lo que Q3 = 83

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 36

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Medidas de desviacion y dispersion

    Ayudan a determinar la variacion de los datos. Sirven paradeterminar lo agrupada o dispersa que esta una poblacion y si lamedida de tendencia central calculada es representativa.Rango: Recorrido o intervalo (R) es la diferencia entre el mayor yel menor valor observado de la variable.Otros rangos usados son:

    Rango intercuartlico: RQ = Q3 Q1Rango intercentlico: RP = P99 P1

    El rango es muy sensible a un error en los datos, no as los rangosintercuartlico e intercentlico.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 37

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Desviacion media

    La desviacion di de un valor xi de la variable respecto a unparametro p es la diferencia di = |xi p| entre esos valores.Usualmente p es una medida de tendencia central.La desviacion media respecto a un promedio p es la media delvalor absoluto de las desviaciones a una determinada medida detendencia central p.

    DM(p) =

    ki=1 |xi p| ni

    N=

    i=ki=1

    |xi p| fi

    Si el parametro p es la media aritmetica simple lo llamamosdesviacion media:

    DM =

    ki=1 |xi x | ni

    N=

    i=ki=1

    |xi x | fi

    Tiene el inconveniente de usar valores absolutos (no derivable).Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 38

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Error cuadratico medio

    Definicion

    Llamamos error cuadratico medio a la media de las desviaciones

    al cuadrado: ECM(p) =

    i ni (xi p)2

    N

    Ejemplo: Dados los valores {5, 2, 3, 3, 3, 5, 7} hallar la desviacionmedia y error cuadratico medio respecto a la media y la mediana.Respecto a la media: x = 5+2+3+3+3+5+77 = 4, las desviaciones

    absolutas son: |~di | = {1, 2, 1, 1, 1, 1, 3}, luegoDM = 5(1)+1(2)+1(3)7 =

    107 y ECM =

    5(1)2+1(2)2+1(3)2

    7 =187 .

    Respecto a la mediana: Me = 3, |~di | = {2, 1, 0, 0, 0, 2, 4}, luegoDM = 3(0)+1(1)+2(2)+1(4)7 =

    97 , ECM =

    3(0)2+1(1)2+2(2)2+1(4)2

    7 =257

    NOTA: La mediana es el valor que hace mnimo la desviacionmedia, mientras la media hace mnimo el error cuadratico medio.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 39

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    La varianza y la desviacion tpica

    La varianza poblacional o varianza de un conjunto de datosviene dada por:

    V = 2 =

    ki=1(xi x)2 ni

    N=

    ki=1

    (xi x)2 fi

    Es decir, es la media de los cuadrados de las desviaciones respectoa la media.Otra forma equivalente para calcular la varianza es:

    V =ki=1

    x2i fi x2 =k

    i nix2i

    N x2

    La desviacion tpica o estandar es la raz cuadrada de la varianza.

    = +V =

    ki=1

    (xi x)2 fiDepartamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 40

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Ejemplo

    Consideremos las listas de valores numericos:

    ListaA = {12, 10, 9, 9, 10} y ListaB : {5, 10, 16, 15, 4}

    . Calcular la desviacion tpica e interpretar los resultados.

    Observamos que en ambos casos la media es 10Para la lista A:

    VA = 2A =

    122 + 2 102 + 2 925

    102 = 1.2 A =1.2

    Para B:

    VB = 2B =

    52 + 102 + 162 + 152 + 42

    5102 = 24.4 B =

    24.4

    Luego los datos estan mas dispersos en la lista B que en la A.Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 41

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Media y varianza muestral

    Normalmente no podemos medir toda la poblacion y tenemos queconformarnos con una muestra, sin embargo si queremos inferir elvalor para la poblacion completa:

    El mejor estimador para la media poblacional es la media

    muestral x =P

    i xiN .

    El mejor estimador de la varianza de una poblacion no es lavarianza de la muestra, es la cuasivarianza de la muestra.

    La varianza muestral o cuasi-varianza (s2), para una muestra de

    tamano N vale: s2 =

    ki=1(xi x)2 ni

    N 1No confundir varianza muestral (s2), con varianza de lamuestra (2M):

    s2 =N

    N 1 2M donde

    2M =

    ki=1(xi x)2 ni

    N

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 42

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Medidas de comparacion

    Se usan para comparar informacion obtenidas de distintas muestraso distintas poblaciones.Variable tipificada:Haciendo uso de la media y de la desviacion tpica de la variableX , podemos considerar una nueva variable dada por:

    Z =X x

    con valores zi =xi x

    i = 1, 2, ..., k

    La variable tipificada es adimensional y, por tanto, independientede las unidades usadas. Mide la desviacion de la variable respectode su media en terminos de la desviacion tpica.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 43

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Ejemplo

    El alumno A ha obtenido una puntuacion de 8.5 en un examencuya puntuacion media ha sido 7.9 y desviacion tpica 0.8. Elalumno B ha obtenido como puntuacion 7.4 en otro examen cuyapuntuacion media ha sido 7.0 y desviacion tpica 0.5. Compara laspuntuaciones de ambos alumnos.

    Para proceder a la comparacion tipificamos las variables:

    zA =8.5 7.9

    0.8= 0.75 zB =

    7.4 7.00.5

    = 0.8

    Observamos que la nota del alumno B es mejor que la del A. Lanota de A se encuentra a 0.75 desviaciones tpicas por encima dela nota media, siendo inferior a la nota de B que supera a la notamedia en 0.8 desviaciones.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 44

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Coeficiente de variacion de Pearson

    Un problema de la desviacion tpica como medida de dispersion esque depende de las unidades de medicion de la variable y de lamuestra. Por tanto no resulta util para comparar dispersiones entredos muestras distintas o expresadas con unidades distintas.Por ello se define el coeficiente de variacion de Pearson , comoel cociente entre la desviacion tpica y el valor absoluto de la media:

    CV =

    |x |Normalmente se expresa en tanto por ciento, para ello bastamultiplicar el cociente por 100.Tiene el problema de no estar definido cuando x = 0.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 45

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Ejemplo

    Un fabricante de tubos de television produce dos tipos de tubos, Ay B, que tienen vidas medias respectivas xA=1495 horas yxB=1875 horas, y desviacion tpica A=280 horas y B=310.Comparar las dispersiones de las dos poblaciones.

    Los coeficientes de variacion para cada tipo de tubos

    CVA =280

    1495 100 1873% CVB = 310

    1875 100 1653%

    indican que, en terminos relativos, la dispersion es mayor en lapoblacion A, a pesar de que las desviaciones tpicas sugieran locontrario.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 46

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Entropa

    Definicion

    Llamamos entropa de una variable (cualitativa o discreta) a:

    H = i

    fi log(fi )

    La base de logaritmo puede ser cualquiera, pero se suele hacercoincidir con el numero de clases, si no se conoce se toma 2.Mide la dispersion de una variable, mientras que la mayora de lasanteriores medidas miden la desviacion respecto a un parametro.La entropa es mnima (H = 0) si todas las observaciones soniguales.La entropa es maxima si todas las fi son iguales (fi =

    1K ).

    H = i

    1

    KlogK

    (1

    K

    )= logK (K ) = 1

    . Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 47

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Ejemplo

    Ejemplo

    Dada la tabla de valores:

    Rojo Verde Azul Amarilloni 14 23 12 11

    Cual es su entropa?

    N = 14 + 23 + 12 + 11 = 60 fi = {1460 , 2360 , 1260 , 1160}. Entonces:H = [1460 log4 (1460)+ 2360 log4 (2360)+ 1260 log4 (1260)+ 1160 log4 (1160)] H 0.96662703NOTA: Podemos usar: logK (x) =

    logb(x)logb(K)

    , pero MATLAB contienelas funciones log, log2 y log10 que calculan el de base e, 2 y 10.El de base 4 se obtiene mediante: log4(x) = log(x)/ log(4).

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 48

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Momentos ordinarios respecto a un punto

    Definicion

    Se define el momento ordinario de orden r respecto al punto ccomo:

    mr(c) =ki=1

    (xi c)rfi =k

    i ni(xi c)rN

    Ejemplo: Hallar m1(Me) y m2(Me) de los datos:{0, 0, 2, 2, 2, 2, 3, 3, 4, 4, 7, 7}.Hay N = 12 datos el 6o vale 2 y el 7o vale 3 Me = 2+32 = 2.5m1(Me) =

    2(02.5)+4(22.5)+2(32.5)+2(42.5)+2(72.5)12 =

    612

    m2(Me) =2(02.5)2+4(22.5)2+2(32.5)2+2(42.5)2+2(72.5)2

    12 =5912

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 49

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Momentos ordinarios

    Definicion

    Se define el momento ordinario de orden r como la mediaaritmetica de las potencias de orden r de los datos de la variable:

    mr =k

    i=1

    x ri fi =

    ki nix

    ri

    N

    Se verifica que:

    El momento ordinario de orden 0 vale 1, m0 = 1.

    El momento ordinario de orden 1 es la media aritmetica:

    m1 = x

    El momento ordinario de orden 2 , m2 = 2 + x2.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 50

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Momentos centrales

    Definicion

    Se define el momento central de orden r como la mediaaritmetica de las potencias de orden r de las desviaciones de losdatos respecto de la media:

    r =k

    i=1

    (xi x)r fi =k

    i=1 ni (xi x)rN

    Propiedades:

    Los momentos centrales 0 = 1 y 1 = 0.

    El momento central de orden 2 es la varianza:

    2 = V = 2 = m2 x2

    3 = m3 3m2x+ 2x34 = m4 4m3x+ 6m2x2 3x4

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 51

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Medidas de forma: simetra y apuntamiento

    Otras medidas que nos permiten clasificar la forma de unadistribucion son las medidas de asimetra (o sesgo) y las medidasde apuntamiento (o curtosis).Medidas de asimetra Una distribucion de frecuencias essimetrica cuando los valores de la variable que equidistan de unvalor central tienen las mismas frecuencias.Las distribuciones simetricas verifican: x = Me, y usualmentex = Me = Mo.

    Distribucion asimetricanegativa o a la izquierda

    Distribucion asimetricapositiva o a la derecha

    Distribucionsimetrica

    Med

    iana

    Mod

    a

    Med

    ia

    Med

    iana

    Mod

    a

    Med

    ia

    Moda

    Mediana

    Media

    Sesgo negativo Simetrica Sesgo positivo

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 52

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Coeficientes de asimetra

    Hay dos coeficientes que nos permiten estudiar el grado deasimetra de una distribucion.Definimos el coeficiente de asimetra de Pearson como:

    AP =x Mo

    Siendo su interpretacion:

    AP > 0 Asimetra a la derecha o positiva

    AP = 0 Simetra

    AP < 0 Asimetra a la izquierda o negativa

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 53

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Coeficiente de asimetra de Fisher

    Definimos el coeficiente de asimetra de Fisher como:

    g1 =33

    Siendo su interpretacion:

    g1 > 0 Asimetrica (o sesgada) a la derecha o positiva

    g1 = 0 Simetrica o insesgada.

    g1 < 0 Asimetrica (o sesgada) a la izquierda o negativa

    Lo que se hace es comparar con la distribucion normal que essimetrica y tiene g1 = 0

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 54

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Coeficiente de apuntamiento

    El aplastamiento, apuntamiento o curtosis de una distribucion es elgrado de achatamiento o afilamiento en comparacion con ladistribucion normal con igual media y varianza.El coeficiente de aplastamiento de Fisher es:

    g2 =44

    3Siendo su interpretacion:

    g2 < 0 Menos apuntamiento que la normal (Platicurtica).

    g2 = 0 Igual apuntamiento que la normal (Mesocurtica).

    g2 > 0 Mas apuntamiento que la normal (Leptocurtica).

    Lo que se hace es comparar con la distribucion normal que tieneg2 = 0

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 55

  • IntroduccionParametrosEjemplos

    Medidas de posicion.Medidas de dispersionMomentos y medidas de forma

    Significado de la curtosis

    Platicurtica Mesocurtica Leptocurtica

    La curva superpuesta al histograma es una normal con igual mediay varianza.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 56

  • IntroduccionParametrosEjemplos

    Ejemplo 1

    Ejemplo

    Los valores previstos (xi ), reales (xi ) y frecuencia absoluta (ni )

    vienen dados en la tabla. Hallar la media cuadratica (MC) y ladesviacion media (DM) del error cometido al en la estimacion.

    xi 0 0 0 1 1 1 3 3 3xi 0 1 3 0 1 3 0 1 3ni 6 3 2 3 5 1 1 3 7

    xi xi ni di = xi xi |di | d2i ni |di | nid2i

    0 0 6 0 0 0 0 00 1 3 1 1 1 3 30 3 2 3 3 9 6 181 0 3 1 1 1 3 31 1 5 0 0 0 0 01 3 1 2 2 4 2 43 0 1 3 3 9 3 93 1 3 2 2 4 6 123 3 7 0 0 0 0 0

    31 23 49

    Media cuadratica=q

    4931

    =

    = 1.25723711

    Error medio o DM= 2331

    == 0.74193548

    Error cuadratico= 4931

    == 1.58064516

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 57

  • IntroduccionParametrosEjemplos

    Ejemplo 2

    Ejemplo

    La duracion en horas de una tipo de lampara incandescente vienereflejado en la tabla adjunta. Calcular:a) Dibujar el histograma. b) Porcentaje que duran menos

    de 950 h.c) Q1, Q3, D1 = P10 y D9 = P90. d) Media, moda y mediana.e) Varianza y desviacion tpica. f) Sesgo y curtosis.g) Medias armonica y cuadratica. h) Desviacion media.i) Error cuadratico medio (ECM) respecto media. j) ECM respecto a la mediana.

    Int (200 600] (600 800] (800 1000] (1000 1200] (1200 1400] (1400 1700]ni 4 31 136 165 67 14

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 58

  • IntroduccionParametrosEjemplos

    Solucion a) Histograma frec. absolutas

    Int. ni ai hi =niai

    200 600 4 400 0.01600 800 31 200 0.155800 1000 136 200 0.681000 1200 165 200 0.8251200 1400 67 200 0.3351400 1700 14 300 0.0467

    417

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 59

  • IntroduccionParametrosEjemplos

    b) Porcentaje que duran menos de 950.

    Necesito las frecuencias absolutas acumuladas.

    Int. ni ai hi Ni200 600 4 400 0.01 4600 800 31 200 0.155 35800 1000 136 200 0.68 1711000 1200 165 200 0.825 3361200 1400 67 200 0.335 4031400 1700 14 300 0.0467 417

    417

    Seran los 35 individuos que son menores 0 iguales que 800, mas laparte proporcional de los que se encuentran en el intervalo(800-1000], es decir:

    P = 35 + 136 950 8001000 800 = 137

    137

    417= 0.329 32.9%

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 60

  • IntroduccionParametrosEjemplos

    c) Q1

    Int. ni ai hi Ni200 600 4 400 0.01 4600 800 31 200 0.155 35800 1000 136 200 0.68 1711000 1200 165 200 0.825 3361200 1400 67 200 0.335 4031400 1700 14 300 0.0467 417

    N = 417

    Q1 : c =14 Nc = 4174 = 104.3. Busco en la columna de

    frecuencias acumuladas Ni la primera que rebasa el valor 104.3 el intervalo que contiene a Q1 es el (800-1000]

    Q1 = X

    (1

    4

    )= Li1 +

    N cNi1ni

    ai = 800+104.3 35

    136200 = 901.9

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 61

  • IntroduccionParametrosEjemplos

    c) Q3

    Int. ni ai hi Ni200 600 4 400 0.01 4600 800 31 200 0.155 35800 1000 136 200 0.68 1711000 1200 165 200 0.825 3361200 1400 67 200 0.335 4031400 1700 14 300 0.0467 417

    N = 417

    Aplico la formula: X(c) = Li1 +N cNi1

    niai

    Q3 : c =34 Nc = 4174 3 = 312.9. El primero en rebasar ese valor

    es el intervalo (1000-1200]: Q3 = 1000 +

    312.9 171165

    200 = 1172

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 62

  • IntroduccionParametrosEjemplos

    P10, P90 y Mediana

    Int. ni ai hi Ni200 600 4 400 0.01 4600 800 31 200 0.155 35800 1000 136 200 0.68 1711000 1200 165 200 0.825 3361200 1400 67 200 0.335 4031400 1700 14 300 0.0467 417

    N = 417

    P10 : c =110 Nc = 41.7. El primero en rebasarlo es el (800-1000]. D1 = P10 = 800 + 41.735136 200 = 809.9

    P90 : c =910 Nc = 375.3. El primero en rebasarlo es el (1200-1400]. D9 = P90 = 1200 + 375.333667 200 = 1317

    Mediana=Q2: c = 0.5 Nc = 208.5. El primero en rebasarlo es el(1000-1200]. Me = 1000 + 208.5171165 200 = 1045.45

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 63

  • IntroduccionParametrosEjemplos

    d) Moda

    Int. ni ai hi Ni200 600 4 400 0.01 4600 800 31 200 0.155 35800 1000 136 200 0.68 1711000 1200 165 200 0.825 3361200 1400 67 200 0.335 4031400 1700 14 300 0.0467 417

    N = 417

    El intervalo modal es el (1000-1200] pues tiene el hi mayor.

    Mo = Li1 +1

    1 +2ai = 1000 +

    0.145

    0.145 + 0.49200 1045.67

    donde 1 = hi hi1 = 0.825 0.68 = 0.145 y2 = hi hi+1 = 0.825 0.335 = 0.49.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 64

  • IntroduccionParametrosEjemplos

    d) Media y e) Varianza y desviacion tpica.

    Calculamos las marcas de clase (xi ) y las columnas nixi y nix2i .

    Int. ni ai hi Ni xi nixi nix2i

    200 600 4 400 0.01 4 400 1600 64(10)4600 800 31 200 0.155 35 700 21700 1519(10)4800 1000 136 200 0.68 171 900 122400 11016(10)41000 1200 165 200 0.825 336 1100 181500 19965(10)41200 1400 67 200 0.335 403 1300 87100 11323(10)41400 1700 14 300 0.0467 417 1550 21700 33635(10)3

    N = 417 436000 472505(10)3

    Media: x = 436000417 = 1045.56Varianza: Calculo primero m2 =

    472505000417 = 1133105.516

    V = m2 x2 = 1133105.516 (1045.6)2 = 39902.38Desviacion tpica: =

    V =

    39902.38 = 199.756

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 65

  • IntroduccionParametrosEjemplos

    f) Sesgo y curtosis

    Calculamos las columnas nix3i y nix

    4i . Borro las no usadas.

    Int. ni xi nixi nix2i nix

    3i nix

    4i

    200 600 4 400 1600 64(10)4 25600(10)4 1024(10)8600 800 31 700 21700 1519(10)4 1063300(10)4 74431(10)8800 1000 136 900 122400 11016(10)4 9914400(10)4 892296(10)81000 1200 165 1100 181500 19965(10)4 21961500(10)4 2415765(10)81200 1400 67 1300 87100 11323(10)4 14719900(10)4 1913587(10)81400 1700 14 1550 21700 33635(10)3 5213425(10)4 808080.875(10)8

    417 436000 472505(10)3 52898125(10)4 6105183.875(10)8

    Momentos ordinarios: m1 = x =436000417 = 1045.6

    m2 =472505000

    417 1133105.52, m3 = 528981250000417 1268540167.87m4 =

    610518387500000417 1464072871702.64

    3 = m3 3m2x+ 2x3 == 1268540167.87 3(1133105.52)(1045.6) + 2(1045.6)3 = 365394.78

    g1 =33

    =365394.78

    199.7563 0.04584 Debilmente sesgada a derecha

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 66

  • IntroduccionParametrosEjemplos

    Sesgo y curtosis-2

    4 = m4 4m3x+ 6m2x2 3x4 == 1464072871702.64 4(1268540167.87)(1045.6)++6(1133105.52)(1045.6)2 3(1045.6)4 = 5723159551.29

    g2 =44

    3 = 5723159551.29199.7564

    3 0.594498 Leptocurtica

    NOTA: Cuando se pida el sesgo se esta pidiendo el coeficiente deFisher, excepto que se pida expresamente el de Pearson.

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 67

  • IntroduccionParametrosEjemplos

    g) Media armonica, cuadratica y h) desviacion media

    Calculamos nixi para la media armonica y |di | = |xi x | para ladesviacion media.

    Int. ni xi nixi nix2i

    nixi

    |di | ni |di |200 600 4 400 1600 64(10)4 0.010000 645.563 2582.25600 800 31 700 21700 1519(10)4 0.044286 345.564 10712.470800 1000 136 900 122400 11016(10)4 0.151111 145.564 19796.6431000 1200 165 1100 181500 19965(10)4 0.150000 54.436 8982.0141200 1400 67 1300 87100 11323(10)4 0.051538 254.436 17047.2421400 1700 14 1550 21700 33635(10)3 0.009032 504.436 7062.110

    417 436000 472505(10)3 0.415968 66182.734

    Media armonica: H = NPinixi

    = 4170.415968 1002.482Media cuadratica:

    MC =m2 =

    472505000

    417 =1133105.516 1064.474

    Desviacion media: DM =P

    i ni|di|N =

    66182.734417 = 158.712

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 68

  • IntroduccionParametrosEjemplos

    i) ECM(x) y j) ECM(Me) (Me=1045.45).

    Int. ni xi di = |xi 1045.45| nidi ni (di )2

    200 600 4 400 645.45 2581.80 1666422.8600 800 31 700 345.45 10789.50 3699406.7800 1000 136 900 145.45 19781.20 2877175.61000 1200 165 1100 54.55 9000.75 490990.91200 1400 67 1300 254.55 17054.85 4341312.11400 1700 14 1550 504.55 7063.70 3563989.8

    417 66191.25 16639297.9

    Error cuadratico medio respecto a la media: Es la varianza que ya seha calculado. ECM(x) = V = 39902.38Error cuadratico medio respecto a la mediana (ECM(Me)):

    ECM(1053) =

    i ni |xi 1045.45|2

    N=

    16639297.9

    417 39902.393

    Desviacion media respecto a la mediana:

    DM(Me) =

    i ni|xi 1045.45|

    N=

    66191.25

    417= 158.732

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 69

  • IntroduccionParametrosEjemplos

    Transparencias basadas en la siguiente bibliografa:

    Lipschutz, S; Schiller, J.J. Schaums Outline of Theory and Problems of Introduction to Probability andStatistics. McGraw-Hill, 1998.

    Apuntes de Estadstica elaborados por el profesor Sixto Sanchez Merino del Dpto. de Matematica Aplicadade la Universidad de Malaga

    Departamento Matematica Aplicada Tema 1A: Estadstica Descriptiva una variable Pag. 70

    IntroduccinGeneralidadesFrecuenciasGrficas

    ParmetrosMedidas de posicin.Medidas de dispersinMomentos y medidas de forma

    Ejemplos