27
2.9 Parámetros de Posición Las tablas y los gráficos que hemos estudiado contienen la totalidad, o al menos una gran parte de la información existente en la muestra. Una de los primeros problemas que se plantea estadística es de sintetizar esta información, reduciendo a un número limitado de parámetros mas fáciles de manejar y comparar entre si.

clase 3-2011-est[1]

Embed Size (px)

DESCRIPTION

k

Citation preview

  • 2.9 Parmetros de Posicin

    Las tablas y los grficos que hemos estudiado contienen la totalidad, o al menos una gran parte de la informacin existente en la muestra.

    Una de los primeros problemas que se plantea estadstica es de sintetizar esta informacin, reduciendo a un nmero limitado de parmetros mas fciles de manejar y comparar entre si.

  • Fundamentalmente la variabilidad de un conjunto de observaciones relativas a una variable cuantitativa unidimensional puede caracterizarse por dos tipos de parmetros que definen la posicin y la dispersin de las observaciones

  • Distribucin de Datos

  • Posicin:

    MediaMedianaCuartilesModa

    Dispersin:VarianzaDesviacin Tpica(estandar)Intervalo Intercuartilico

  • 2.9.1 MediaEl parmetro de posicin mas utilizado en la practica es la media aritmtica de los datos. Su calculo se realiza mediante la formula bien conocida:

    Media maestral x= xi

    N Donde N es el numero de individuos de la muestra, es decir el numero de datos. La media sintetiza la informacin existente en la totalidad de los datos en un numero que da una idea sobre la posicin de las mismas

    Ni=1

  • 2.9.2 Mediana En caso de datos muy asimetricos o con algunos valores extremos puede ser aconsejable usar la mediana como una medida de posicin alternativa en vez de la media.La mediana puede definirse intuitivamente como el valor central de los observados. Mas precisamente, si se ordenan las N observaciones de menor a mayor la mediana se define como el valor

  • Que ocupa la posicin( N+1)/2 si N es impar

    Media entre los valores que ocupan las posiciones N/2 y (N/2 )+1 si N es par

  • 2.9.3 Cuartiles

    El primer cuartil de un conjunto de datos se puede definir de forma aproximada como el valor C1 tal que la cuarta parte de los datos son inferiores a el.

    De forma simtrica se define el tercer cuartil C3 como el valor tal que tres cuartas partes de los datos son inferiores a el y una cuarta parte de los datos son superiores al mismo.

  • Una forma sencilla de calcular los cuartiles C1 y C3 es hallando las medianas de la mitad inferior y de la mitad superior de los datos.

    De acuerdo con la definicin dada, entro los dos cuartiles C1 y C3 se el encuentra el 50% central de los datos observados.

    Ejemplos:

  • 2.10 Parmetros de dispersin

    La poblacin real se caracteriza por la presencia de variabilidad en los valores de la misma en los individuos de la poblacin.

    Para describir un conjunto de datos estadsticos, y tener en consecuencia una idea sobre la pauta de variabilidad existente en la poblacin de la que procede la muestra no es suficiente disponer de una medida de posicin, si no que es preciso tambin cuantificar el grado de dispersin existente en los mismos

  • 2.10.1 Varianza, Desviacin tpica

    Dado que la media es en la mayor parte de los casos un buen parmetro de posicin, parece lgico tomar como medida de dispersin algn parmetro relacionado con la magnitud de las desviaciones de los datos observados respecto a su media.La medida de dispersin mas utilizada es la varianza, o su raz cuadrada que se le denomina desviacin tpica.

  • La varianza no es mas que el promedio de los cuadrados de las desviaciones de los datos respecto a su media.

    Varianza: S2 = (xi-x)2

    N-1

    Desviacin Tpica S= (xi-x)2

    N-1

    N

    i=1N

    i=1

  • En general se prefiere utilizar como medida descriptiva de la dispersin la desviacin tpica, pues resulta mas fcil interpretar al venir expresada en las mismas unidades de los datos primitivos.Se denomina coeficiente de variacin a la medida que indica que las observaciones caen en promedio aproximado CV% del promedio. Se usa para comparar distribuciones con diferentes unidades o para comparar las dispersiones de 2 distribuciones diferentes.

    CV = (100* S)/ x

  • 2.10.2 Intervalo intercuartilico

    En aquellos casos que la media no es un indicador adecuado de posicin( distribucin muy asimtrica) tampoco resulta la desviacin tpica, en estos casos se utiliza a veces con este fin el intervalo intercuartilico, que no es mas que la diferencia entre el tercer y el primer cuartil.

  • Ejercicio: La resistencia a la compresin de 30 ejemplares de prueba de una aleacin aluminio-litio, se muestran en la tabla

    762211839715415310122817410513115413118019013417876142157101149151142151175149153201200

  • 2.11 Parmetros de asimetra y de curtosis

    Como ya se ha comentado las variables aleatorias continuas presentan frecuentemente una pauta de variabilidad que se caracteriza por el hecho de que los datos tienden a acumularse alrededor de un valor central, decreciendo su frecuencia de forma aproximadamente simtrica a medida que se alejan por ambos lados de dicho valor.

    Ello conduce a histogramas que tienen forma de curva de campana(campana de Gauss)

  • Para estudiar este tipo de pauta de variabilidad se ha establecido un modelo matemtico, la distribucin normal, de extraordinaria importancia en toda la inferencia estadstica.

    Toda distribucin normal viene completamente caracterizada por su media y su desviacin tpica, es decir por sus parmetros de posicin y de dispersin.

  • Sin embargo un problema frecuente al estudiar datos reales es, precisamente analizar hasta que punto la distribucin normal pueden exigir el recurso a tratamientos estadsticos especiales o ser el sntoma de anomalas en los datos.

    Con este fin se utilizan los coeficientes de asimetra y de curtosis.

  • 2.11.1 Coeficiente de Asimetra

    Se define el C.A como el promedio( dividiendo por N-1 en vez de por N) de los cubos de las desviaciones respecto a la media, dividido por el cubo de la desviacin tpica. La divisin por S3 tiene por objeto obtener un coeficiente adimensional, es decir que no depende de la escala en que vengan los datos

    C.A = (xi x ) 3 / (N-1)s3

  • SIMETRIA DE DATOS

  • 2.11.2 Coeficiente de CurtosisEs la deformacin vertical de una curva de frecuencias. Se define como el grado de apuntamiento de la curva.

  • C.C = (xi x )4 / (N-1)

    s3- 3Por tanto un conjunto de datos es leptocurtica si su CC es mayor que 0 y platicurtica si su C.C es negativo

  • 2.12 Diagramas Box-Whisker(caja-bigote)

    Es una representacin grafica sencilla de un conjunto de datos. Presenta la ventaja de no exigir un nmero elevado de datos para su construccin, adems de resaltar mas sencillo su manejo cuando el objetivo es comparar distintos conjuntos de datosDiagrama Box-whiskers

  • 20

    1405114422410124403405134154408144185411154206420164227421174268422184259430194241044520430

    *