39
Probabilidad y estadística MEDIDAS DE TENDENCIA CENTRAL, MEDIDAS DE DISPERSIÓN , GRÁFICAS, E INTERPRETANDO RESULTADOS INTERPRETANDO RESULTADOS Prof. Miguel Hesiquio Garduño. Est Mirla Benavides Rojas Est. Mirla Benavides Rojas Depto. De Ingeniería Química Petrolera ESIQIE-IPN [email protected] [email protected] PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

  • Upload
    buique

  • View
    236

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Probabilidad y estadísticaMEDIDAS  DE  TENDENCIA  CENTRAL, MEDIDAS  DE  DISPERSIÓN   ,  GRÁFICAS,    E  INTERPRETANDO RESULTADOSINTERPRETANDO  RESULTADOS

Prof. Miguel Hesiquio Garduño. Est Mirla Benavides RojasEst. Mirla Benavides RojasDepto. De Ingeniería Química [email protected]@gmail.com

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 2: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Datos no agrupados 

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 3: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Medidas de tendencia centralL á d d i l lLos parámetros de tendencia central son valores

numéricos que tienden a localizar en la parte central de unconjunto de datos.

Es un valor que se puede tomar como representativo detodos los datos

Entre los parámetros de tendencia central se encuentran:

PROF. MIGUEL HESIQUIO GARDUÑO

Page 4: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

MEDIA ARITMÉTICA

Medidas de tendencia CentralMEDIA ARMÓNICAMEDIA ARITMÉTICA

Conocida como promedio, se define comola suma de los valores de todas las

MEDIA ARMÓNICAEs la inversa de la mediaaritmética.

la suma de los valores de todas lasobservaciones divididas por elnumero total de datos

ixn

Se utiliza para promediar variablescon unidades complejas ocompuestas, como aceleraciones,energía trabajo etc

xn

i∑

energía, trabajo etc.

= nnH

1n

x ii∑

== 1 ∑=

n

i ix1

1

PROF. MIGUEL HESIQUIO GARDUÑO

Page 5: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Medidas de tendencia CentralRAÍZ CUADRADA MEDIAMEDIA GEOMÉTRICA RAÍZ CUADRADA MEDIA

Proporciona una medida promedioprecisa de una variable que midel bi l

MEDIA GEOMÉTRICA

La media cuadrática o RMS sedefine como la raíz cuadrada de la

di i é i d l llos cambios porcentuales en unaserie de valores positivos

media aritmética de los elementosal cuadrado. Es utilizada para elcálculo de la media de un conjuntode números con las alternancias dede ú e os co as a e a c as decantidades con valores positivos ynegativos.

n

∑ 2n

nxxxxG ...321= xrms i

i∑== 1

2

n

Page 6: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Medidas de Dispersión

Varianza La varianza es el promedio de las desviaciones cuadráticas de cada dato respecto a su media aritmética ix

_x

Poblacional Muestral

xn

i∑ − 2)( μ )(1

2

2∑ −=

xxs

n

ii

ni== 12σ 1

1

−=

ns i

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 7: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Medidas de Dispersión

Desviación Estándar

Es una medida de dispersión usada en la estadística que nos dice cuanto tienden a alejarse los valores puntuales del promedio en una distribución.

“es el promedio de la distancia de cada punto respecto del promedio”p p p p

n∑ 2)( )( 2∑ − xx

n

n

xi

i∑ −= =1

2)( μσ 1

)(1

∑ −= =

n

xxs i

i

PROF. MIGUEL HESIQUIO GARDUÑO

Page 8: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Y estas ecuaciones son fáciles de implementar en una pcalculadora ordinaria?

Hay una ecuación equivalente, porque la ecuaciónque define a la varianza es complicada deimplementar en una calculadora:implementar en una calculadora:

2⎞⎛

1

2

1

2

2∑ ⎟

⎠⎞⎜

⎝⎛∑−⋅

= =xxn

s

n

i

n

iii

( )11 1

−⎠⎝=

nns i i

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 9: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

EjercicioEn el laboratorio de una planta de carbón, se realizan diferentes análisis del mismo, uno de ellos es el análisis de ceniza.

Para este análisis se tomaron muestras del tajo la conquista de los diferentes mantos,Para este análisis se tomaron muestras del tajo la conquista de los diferentes mantos, se obtuvo lo siguiente:  Gramos

10.722511.544221.813624.538827.432130 288330.288327.783922.567030.557236.259334.861938.381726 247026.247039.6775

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 10: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

De éstos datos:) C l l l di l d H Ga) Calcular la mediana y la moda, H, G, rms

b) Encontrar la varianza y la desviación estándar

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 11: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

En EXCEL

=moda(a1:a30)a30)

=mediana(a1:a30)

=promedio(=promedio(a1:a30)

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 12: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Datos agrupados 

Para los datos cuantitativos continuos, los datos se suelen agrupar en clases, que son intervalos que no se juntan y cuya unión cubre todo el rango de los datosrango de los datos 

Suelen elegirse de la misma longitud, de modo que basta con l i l d lseleccionar el numero de clase a tomar.

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 13: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Criterios para generar una p gtabla de datos agrupadosCómo los organizo?

PROF. MIGUEL HESIQUIO GARDUÑO

Page 14: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Ordenando Datos en Clases MiguelHGC t lCuantas clases2K=nTamaño de intervalo de clase:c=(Lrs‐Lri)c≅Rango/kX=marca de clase=(Lrs‐Lri)/2¿O podemos establecer tamaños un poco mayores?Responder despues de hacer el ejercicio

PROF. MIGUEL HESIQUIO GARDUÑO

Page 15: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Medidas de tendencia centralI di l l d dIndican valores con respecto a los datos agrupados 

Media 

Mediana 

Moda

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 16: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Ecuaciones para datos agrupadosEcuaciones para datos agrupados

MediaConocida como promedio, se define como lasuma de los valores de todas lassuma de los valores de todas lasobservaciones divididas por el númerototal de datos

ixn

fxk

ii∑n

fx i

ii∑== 1

nPROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 17: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

MedianaEs el valor que se encuentra en el centro de los datos, es decir, nos

it l l t t t l it d d l j t dpermite conocer el valor que se encuentra exactamente en la mitad del conjunto dedatos. Esta medida nos indica que la mitad de los datos se encuentran por debajo deeste valor y la otra mitad por encima del mismo.

=L1Límite real inferior de la clasemediana

cf

fn

Lxmi )(

2~1

∑−+=

=nNúmero de datos

fmed =∑ f mi )( Suma de las frecuencias detodas las clases por debajo dela clase mediana

=fmedFrecuencia de la clase mediana

Ancho del intervalo de la clase=c

Ancho del intervalo de la clasemediana

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 18: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

ModaEs el valor de variable que mas veces se repite. Es decir cuya frecuencia es mayor.

L1= Límite real Inferior de la clase modal

L ⎟⎟⎞

⎜⎜⎛ Δ+

∧1

Δ1= Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferiorcLx ⎟⎟

⎠⎜⎜⎝ Δ+Δ

+=21

11

clase contigua inferior

Δ2= Exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior

c= ancho del intervalo de la clase modalclase modal

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 19: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Medidas de dispersión I di l ió d l dIndican la mayor o menor concentración de los datos con respecto a las medidas de centralización

VarianzaVarianza  

Desviación estándar  

Coeficiente de variaciónCoeficiente de variación 

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Page 20: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Ecuaciones para datos pagrupados

V iVarianza

1

2

1

2

2∑ ⎟

⎠⎞⎜

⎝⎛∑−⋅ fxfxn

k

i

k

iiiii

( )11 12

−⎠⎝= = =

nns i i

Desviación estándar 22 ⎟⎞⎜⎛

k kDesviación estándar

( )11 1

2

∑ ⎟⎠⎞⎜

⎝⎛ ∑−⋅

= = =

nn

fxfxns i i

iiii

( )1nn

PROF. MIGUEL HESIQUIO GARDUÑO

Page 21: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Medidas de dispersiónMedidas de dispersión 

Coeficiente de variación 

Determina el grado de dispersión de un conjunto de datos relativo ade un conjunto de datos relativo a su medida.

Se calcula dividiendo la desviación 100*sCV =estándar de una distribución porsu media y multiplicando por 100 x

PROF. MIGUEL HESIQUIO GARDUÑO

Page 22: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Crear unas diapositivas intermedias que vinculen al p qtratamiento de datos dispersos con el de agrupados

PROF. MIGUEL HESIQUIO GARDUÑO

Page 23: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Manejo de Datos ,Manejo de Datos , n>20n>20

PROF. MIGUEL HESIQUIO GARDUÑO

Page 24: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Contenido de Carbono en unmineralContenido de Carbono en un mineral sub‐bituminoso87 86 85 87 86 87 87 81 77 85

88 89 86 84 88 90 83 82 84 79

92 88 92 91 87 83 79 82 73 85

PROF. MIGUEL HESIQUIO GARDUÑO

Page 25: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Calcular para los datos del problema de Carbón ( ver la p ptabla de datos ordenados de menor a mayor)

n73 77 79 79 81 82 82 83 84 84

83 85 85 85 86 86 86 87 87 87 1

)(1

2

2

∑ −= =

n

xxs

n

ii

87 87 88 88 88 89 90 91 92 92

1n

1

2

1

2

2∑ ⎟

⎠⎞⎜

⎝⎛∑−⋅

= =xxn

n

i

n

iii

( )11 12

−⎠⎝= = =

nns i i

¿Cómo se hace en excel?

PROF. MIGUEL HESIQUIO GARDUÑO

Page 26: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Además de obtener unas gráficas, el agrupar los datos en clases sirve paraagrupar los datos en clases sirve para otra cosa más?

Li- Ls Lri- Lrs Marca de clase x

fabs frel

73-76 72.5-76.5 74.5 1

77-80 76.5-80.5 78.5 3121416

81-84 80.5-84.5 82.5 7

85 88 84 5 88 5 86 5 142468

1012

f

85-88 84.5-88.5 86.5 14

89-92 88.5-92.5 90.5 5

074.5 78.5 82.5 86.5 90.5

% de C

PROF. MIGUEL HESIQUIO GARDUÑO

Page 27: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Relaciones empíricas

)~(3ˆ xxxx −+=)~(3ˆ xxxx −−=

PROF. MIGUEL HESIQUIO GARDUÑO

Page 28: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Dato mayor dato menor (podriamosDato mayor, dato menor (podriamos ordenarlos)87 86 85 87 86 87 87 81 77 85

88 89 86 84 88 90 83 82 84 79

92 88 92 91 87 83 79 82 73 85

PROF. MIGUEL HESIQUIO GARDUÑO

Page 29: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Ordenados de menor a mayor73 77 7

979 81 82 82 83 84 84

83 85 8 85 86 86 86 87 87 875

87 87 88

88 88 89 90 91 92 92

PROF. MIGUEL HESIQUIO GARDUÑO

Page 30: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Nuestros resultadosNuestros resultados

D d % id dDatos de  % contenido de  carbon en mineral.

30n=30

=x

=≈

x

x

=Mo

PROF. MIGUEL HESIQUIO GARDUÑO

Page 31: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

CálculosH ll di M di M dHallar media, Mediana, Moda, rms

Hallar desviación estándar

PROF. MIGUEL HESIQUIO GARDUÑO

Page 32: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Construyendo la tablaLi- Ls Lri- Lrs Marca de FabsLi- Ls Lri- Lrs Marca de

clase xFabs

73 76 72 5 76 5 74 573-76 72.5-76.5 74.5

77-80 76 5-80 5 78 577 80 76.5 80.5 78.5

81-84 80.5-84.5 82.5

85-88 84.5-88.5 86.5

89-92 88.5-92.5 90.5

PROF. MIGUEL HESIQUIO GARDUÑO

Page 33: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Frecuencia absoluta y relativa

Li Ls Lri Lrs Marca fabs frelLi- Ls Lri- Lrs Marca de clase x

fabs frel

73-76 72.5-76.5 74.5

77-80 76.5-80.5 78.581-84 80.5-84.5 82.582.585-88 84.5-88.5 86.5

89-92 88.5-92.5 90.5PROF. MIGUEL HESIQUIO GARDUÑO

Page 34: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Generando gráficos

PROF. MIGUEL HESIQUIO GARDUÑO

Page 35: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Histograma

810121416

f

0246

74.5 78.5 82.5 86.5 90.5

%d C

Polígono de

% de C

1416

Frecuencias

468

101214

f

024

74.5 78.5 82.5 86.5 90.5

% de C

PROF. MIGUEL HESIQUIO GARDUÑO

Page 36: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Una ojiva de frecuencia jrelativa

Ojiva

1.2

0.40.60.8

1

l acu

mul

ada

frecuencia relativa acumulada

00.2

70 75 80 85 90 95

%C

frel

% C

PROF. MIGUEL HESIQUIO GARDUÑO

Page 37: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

H hi ót i l d t tá if tHay una hipótesis: los datos están uniformementedistribuidos. En general esto no es válido todo el tiempo. Elhistograma ayuda a interpretar, pero es necesariod ll ál ldesarrollar cálculos.

PROF. MIGUEL HESIQUIO GARDUÑO

Page 38: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

Tratando el problema de las muestras de carbón. Datos Agrupados

Li L L i L M d f b 2f fLi- Ls Lri- Lrs Marca de clase x

fabs xi2fi xifi

73-76 72 5-76 5 74 5 173 76 72.5 76.5 74.5 1

77-80 76.5-80.5 78.5 3

81-84 80.5-84.5 82.5 7

85 88 84 5 88 5 86 5 1485-88 84.5-88.5 86.5 14

89-92 88.5-92.5 90.5 5

PROF. MIGUEL HESIQUIO GARDUÑO

Page 39: Probabilidad y estadística - Miguel Hesiquio en la ESIQIE ... · Medidas de tendencia central Los parámetros detendidencia central son valores numéricos que tienden a localizar

¿Podíamos tomar otros valores de limites de clase?¿Podíamos tomar otros valores de limites de clase?Hacerlo en equipo

Iniciando en 70, con ancho de clasede 5,

Li-Ls f

70 74Elaborar Histograma, poligono defrecuencias,ojiva.

Calcular medidas de tendencia central

70-74

75-Calcular medidas de tendencia central( como datos agrupados)

Realizar el cálculo de varianza ydesviacion estándar

80-desviacion estándar

85-

9090-

PROF. MIGUEL HESIQUIO GARDUÑO