Upload
buique
View
236
Download
1
Embed Size (px)
Citation preview
Probabilidad y estadísticaMEDIDAS DE TENDENCIA CENTRAL, MEDIDAS DE DISPERSIÓN , GRÁFICAS, E INTERPRETANDO RESULTADOSINTERPRETANDO RESULTADOS
Prof. Miguel Hesiquio Garduño. Est Mirla Benavides RojasEst. Mirla Benavides RojasDepto. De Ingeniería Química [email protected]@gmail.com
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Datos no agrupados
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Medidas de tendencia centralL á d d i l lLos parámetros de tendencia central son valores
numéricos que tienden a localizar en la parte central de unconjunto de datos.
Es un valor que se puede tomar como representativo detodos los datos
Entre los parámetros de tendencia central se encuentran:
PROF. MIGUEL HESIQUIO GARDUÑO
MEDIA ARITMÉTICA
Medidas de tendencia CentralMEDIA ARMÓNICAMEDIA ARITMÉTICA
Conocida como promedio, se define comola suma de los valores de todas las
MEDIA ARMÓNICAEs la inversa de la mediaaritmética.
la suma de los valores de todas lasobservaciones divididas por elnumero total de datos
ixn
Se utiliza para promediar variablescon unidades complejas ocompuestas, como aceleraciones,energía trabajo etc
xn
i∑
energía, trabajo etc.
= nnH
1n
x ii∑
== 1 ∑=
n
i ix1
1
PROF. MIGUEL HESIQUIO GARDUÑO
Medidas de tendencia CentralRAÍZ CUADRADA MEDIAMEDIA GEOMÉTRICA RAÍZ CUADRADA MEDIA
Proporciona una medida promedioprecisa de una variable que midel bi l
MEDIA GEOMÉTRICA
La media cuadrática o RMS sedefine como la raíz cuadrada de la
di i é i d l llos cambios porcentuales en unaserie de valores positivos
media aritmética de los elementosal cuadrado. Es utilizada para elcálculo de la media de un conjuntode números con las alternancias dede ú e os co as a e a c as decantidades con valores positivos ynegativos.
n
∑ 2n
nxxxxG ...321= xrms i
i∑== 1
2
n
Medidas de Dispersión
Varianza La varianza es el promedio de las desviaciones cuadráticas de cada dato respecto a su media aritmética ix
_x
Poblacional Muestral
xn
i∑ − 2)( μ )(1
2
2∑ −=
xxs
n
ii
ni== 12σ 1
1
−=
ns i
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Medidas de Dispersión
Desviación Estándar
Es una medida de dispersión usada en la estadística que nos dice cuanto tienden a alejarse los valores puntuales del promedio en una distribución.
“es el promedio de la distancia de cada punto respecto del promedio”p p p p
n∑ 2)( )( 2∑ − xx
n
n
xi
i∑ −= =1
2)( μσ 1
)(1
−
∑ −= =
n
xxs i
i
PROF. MIGUEL HESIQUIO GARDUÑO
Y estas ecuaciones son fáciles de implementar en una pcalculadora ordinaria?
Hay una ecuación equivalente, porque la ecuaciónque define a la varianza es complicada deimplementar en una calculadora:implementar en una calculadora:
2⎞⎛
1
2
1
2
2∑ ⎟
⎠⎞⎜
⎝⎛∑−⋅
= =xxn
s
n
i
n
iii
( )11 1
−⎠⎝=
nns i i
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
EjercicioEn el laboratorio de una planta de carbón, se realizan diferentes análisis del mismo, uno de ellos es el análisis de ceniza.
Para este análisis se tomaron muestras del tajo la conquista de los diferentes mantos,Para este análisis se tomaron muestras del tajo la conquista de los diferentes mantos, se obtuvo lo siguiente: Gramos
10.722511.544221.813624.538827.432130 288330.288327.783922.567030.557236.259334.861938.381726 247026.247039.6775
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
De éstos datos:) C l l l di l d H Ga) Calcular la mediana y la moda, H, G, rms
b) Encontrar la varianza y la desviación estándar
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
En EXCEL
=moda(a1:a30)a30)
=mediana(a1:a30)
=promedio(=promedio(a1:a30)
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Datos agrupados
Para los datos cuantitativos continuos, los datos se suelen agrupar en clases, que son intervalos que no se juntan y cuya unión cubre todo el rango de los datosrango de los datos
Suelen elegirse de la misma longitud, de modo que basta con l i l d lseleccionar el numero de clase a tomar.
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Criterios para generar una p gtabla de datos agrupadosCómo los organizo?
PROF. MIGUEL HESIQUIO GARDUÑO
Ordenando Datos en Clases MiguelHGC t lCuantas clases2K=nTamaño de intervalo de clase:c=(Lrs‐Lri)c≅Rango/kX=marca de clase=(Lrs‐Lri)/2¿O podemos establecer tamaños un poco mayores?Responder despues de hacer el ejercicio
PROF. MIGUEL HESIQUIO GARDUÑO
Medidas de tendencia centralI di l l d dIndican valores con respecto a los datos agrupados
Media
Mediana
Moda
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Ecuaciones para datos agrupadosEcuaciones para datos agrupados
MediaConocida como promedio, se define como lasuma de los valores de todas lassuma de los valores de todas lasobservaciones divididas por el númerototal de datos
ixn
fxk
ii∑n
fx i
ii∑== 1
nPROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
MedianaEs el valor que se encuentra en el centro de los datos, es decir, nos
it l l t t t l it d d l j t dpermite conocer el valor que se encuentra exactamente en la mitad del conjunto dedatos. Esta medida nos indica que la mitad de los datos se encuentran por debajo deeste valor y la otra mitad por encima del mismo.
=L1Límite real inferior de la clasemediana
cf
fn
Lxmi )(
2~1
∑−+=
=nNúmero de datos
fmed =∑ f mi )( Suma de las frecuencias detodas las clases por debajo dela clase mediana
=fmedFrecuencia de la clase mediana
Ancho del intervalo de la clase=c
Ancho del intervalo de la clasemediana
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
ModaEs el valor de variable que mas veces se repite. Es decir cuya frecuencia es mayor.
L1= Límite real Inferior de la clase modal
L ⎟⎟⎞
⎜⎜⎛ Δ+
∧1
Δ1= Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferiorcLx ⎟⎟
⎠⎜⎜⎝ Δ+Δ
+=21
11
clase contigua inferior
Δ2= Exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior
c= ancho del intervalo de la clase modalclase modal
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Medidas de dispersión I di l ió d l dIndican la mayor o menor concentración de los datos con respecto a las medidas de centralización
VarianzaVarianza
Desviación estándar
Coeficiente de variaciónCoeficiente de variación
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Ecuaciones para datos pagrupados
V iVarianza
1
2
1
2
2∑ ⎟
⎠⎞⎜
⎝⎛∑−⋅ fxfxn
k
i
k
iiiii
( )11 12
−⎠⎝= = =
nns i i
Desviación estándar 22 ⎟⎞⎜⎛
k kDesviación estándar
( )11 1
2
−
∑ ⎟⎠⎞⎜
⎝⎛ ∑−⋅
= = =
nn
fxfxns i i
iiii
( )1nn
PROF. MIGUEL HESIQUIO GARDUÑO
Medidas de dispersiónMedidas de dispersión
Coeficiente de variación
Determina el grado de dispersión de un conjunto de datos relativo ade un conjunto de datos relativo a su medida.
Se calcula dividiendo la desviación 100*sCV =estándar de una distribución porsu media y multiplicando por 100 x
PROF. MIGUEL HESIQUIO GARDUÑO
Crear unas diapositivas intermedias que vinculen al p qtratamiento de datos dispersos con el de agrupados
PROF. MIGUEL HESIQUIO GARDUÑO
Manejo de Datos ,Manejo de Datos , n>20n>20
PROF. MIGUEL HESIQUIO GARDUÑO
Contenido de Carbono en unmineralContenido de Carbono en un mineral sub‐bituminoso87 86 85 87 86 87 87 81 77 85
88 89 86 84 88 90 83 82 84 79
92 88 92 91 87 83 79 82 73 85
PROF. MIGUEL HESIQUIO GARDUÑO
Calcular para los datos del problema de Carbón ( ver la p ptabla de datos ordenados de menor a mayor)
n73 77 79 79 81 82 82 83 84 84
83 85 85 85 86 86 86 87 87 87 1
)(1
2
2
−
∑ −= =
n
xxs
n
ii
87 87 88 88 88 89 90 91 92 92
1n
1
2
1
2
2∑ ⎟
⎠⎞⎜
⎝⎛∑−⋅
= =xxn
n
i
n
iii
( )11 12
−⎠⎝= = =
nns i i
¿Cómo se hace en excel?
PROF. MIGUEL HESIQUIO GARDUÑO
Además de obtener unas gráficas, el agrupar los datos en clases sirve paraagrupar los datos en clases sirve para otra cosa más?
Li- Ls Lri- Lrs Marca de clase x
fabs frel
73-76 72.5-76.5 74.5 1
77-80 76.5-80.5 78.5 3121416
81-84 80.5-84.5 82.5 7
85 88 84 5 88 5 86 5 142468
1012
f
85-88 84.5-88.5 86.5 14
89-92 88.5-92.5 90.5 5
074.5 78.5 82.5 86.5 90.5
% de C
PROF. MIGUEL HESIQUIO GARDUÑO
Relaciones empíricas
)~(3ˆ xxxx −+=)~(3ˆ xxxx −−=
PROF. MIGUEL HESIQUIO GARDUÑO
Dato mayor dato menor (podriamosDato mayor, dato menor (podriamos ordenarlos)87 86 85 87 86 87 87 81 77 85
88 89 86 84 88 90 83 82 84 79
92 88 92 91 87 83 79 82 73 85
PROF. MIGUEL HESIQUIO GARDUÑO
Ordenados de menor a mayor73 77 7
979 81 82 82 83 84 84
83 85 8 85 86 86 86 87 87 875
87 87 88
88 88 89 90 91 92 92
PROF. MIGUEL HESIQUIO GARDUÑO
Nuestros resultadosNuestros resultados
D d % id dDatos de % contenido de carbon en mineral.
30n=30
=x
=≈
x
x
=Mo
PROF. MIGUEL HESIQUIO GARDUÑO
CálculosH ll di M di M dHallar media, Mediana, Moda, rms
Hallar desviación estándar
PROF. MIGUEL HESIQUIO GARDUÑO
Construyendo la tablaLi- Ls Lri- Lrs Marca de FabsLi- Ls Lri- Lrs Marca de
clase xFabs
73 76 72 5 76 5 74 573-76 72.5-76.5 74.5
77-80 76 5-80 5 78 577 80 76.5 80.5 78.5
81-84 80.5-84.5 82.5
85-88 84.5-88.5 86.5
89-92 88.5-92.5 90.5
PROF. MIGUEL HESIQUIO GARDUÑO
Frecuencia absoluta y relativa
Li Ls Lri Lrs Marca fabs frelLi- Ls Lri- Lrs Marca de clase x
fabs frel
73-76 72.5-76.5 74.5
77-80 76.5-80.5 78.581-84 80.5-84.5 82.582.585-88 84.5-88.5 86.5
89-92 88.5-92.5 90.5PROF. MIGUEL HESIQUIO GARDUÑO
Generando gráficos
PROF. MIGUEL HESIQUIO GARDUÑO
Histograma
810121416
f
0246
74.5 78.5 82.5 86.5 90.5
%d C
Polígono de
% de C
1416
Frecuencias
468
101214
f
024
74.5 78.5 82.5 86.5 90.5
% de C
PROF. MIGUEL HESIQUIO GARDUÑO
Una ojiva de frecuencia jrelativa
Ojiva
1.2
0.40.60.8
1
l acu
mul
ada
frecuencia relativa acumulada
00.2
70 75 80 85 90 95
%C
frel
% C
PROF. MIGUEL HESIQUIO GARDUÑO
H hi ót i l d t tá if tHay una hipótesis: los datos están uniformementedistribuidos. En general esto no es válido todo el tiempo. Elhistograma ayuda a interpretar, pero es necesariod ll ál ldesarrollar cálculos.
PROF. MIGUEL HESIQUIO GARDUÑO
Tratando el problema de las muestras de carbón. Datos Agrupados
Li L L i L M d f b 2f fLi- Ls Lri- Lrs Marca de clase x
fabs xi2fi xifi
73-76 72 5-76 5 74 5 173 76 72.5 76.5 74.5 1
77-80 76.5-80.5 78.5 3
81-84 80.5-84.5 82.5 7
85 88 84 5 88 5 86 5 1485-88 84.5-88.5 86.5 14
89-92 88.5-92.5 90.5 5
PROF. MIGUEL HESIQUIO GARDUÑO
¿Podíamos tomar otros valores de limites de clase?¿Podíamos tomar otros valores de limites de clase?Hacerlo en equipo
Iniciando en 70, con ancho de clasede 5,
Li-Ls f
70 74Elaborar Histograma, poligono defrecuencias,ojiva.
Calcular medidas de tendencia central
70-74
75-Calcular medidas de tendencia central( como datos agrupados)
Realizar el cálculo de varianza ydesviacion estándar
80-desviacion estándar
85-
9090-
PROF. MIGUEL HESIQUIO GARDUÑO