Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
BIOESTADÍSTICA
Dr. Abner A. Fonseca Livias
PROFESOR PRINCIPAL
UNIVERSIDAD NACIONAL HERMILIO VALDIZAN
FACULTAD DE ENFERMERÍA
MEDIDAS PARA DESCRIBIR
VARIABLES NUMÉRICAS
Dr. Abner A. Fonseca Livias
PROFESOR PRINCIPAL
UNIVERSIDAD NACIONAL HERMILIO VALDIZAN
FACULTAD DE ENFERMERÍA
MEDIDAS
• Medidas de tendencia central
• Medidas de dispersión
• Medidas de percentiles o posicionamiento
• Medidas de distribución o de forma
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 3
1 ESTADISTICA PRIMER PARCIAL.ppt#130. MEDIDAS DE TENDENCIA CENTRAL1 ESTADISTICA PRIMER PARCIAL.ppt#162. DESCRIPCIÓN DE UNA VARIABLE NUMÉRICA1 ESTADISTICA PRIMER PARCIAL.ppt#178. MEDIDAS DE POSICIÓN O CUANTILES1 ESTADISTICA PRIMER PARCIAL.ppt#191. Coeficiente de Asimetría
MEDIDAS DE TENDENCIA CENTRAL
• Media aritmética
• Mediana
• Moda
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 4
MEDIA ARITMÉTICA
• Es la que se obtiene sumando los datos y dividiéndolos
por el número de ellos.
– Características:
• No es para distribuciones cualitativas.
• Esta afectada por todos los valores que asume la
variable.
• Si presenta valores extremos bajos o altos, se
recomienda usar otra medida de tendencia central.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 5
MEDIA ARITMÉTICA
• La fórmula que se emplea depende si se trabaja
con N o n.
• La media aritmética es útil con datos no agrupados
y agrupados.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 6
1
N
i
i
x
N ==
n
i
i
x
xn
=
Media de la
poblaciónMedia de la
Muestra
MEDIA ARITMÉTICA PARA DATOS
NO AGRUPADOS
• Los datos no agrupados no están en tabla de frecuencia.
• Ejemplo: El profesor de estadística desea conocer el
promedio de las siguientes notas:
3,2 3,1 2,4 4,0 3,5 3,0 3,5 3,8 4,2 4,0
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 7
MEDIA ARITMÉTICA PARA DATOS
AGRUPADOS
• Es para datos agrupados en tablas, la media aritmética
es igual a la sumatoria del producto de las clases por
la frecuencia sobre el número de datos. Se puede
calcular de la N o n.
• También se trabaja con marca de clase (Mc) por
frecuencia y se divide por el número de datos.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 8
MEDIA ARITMÉTICA PARA DATOS
AGRUPADOS EN FRECUENCIA
Preguntas
buenas
Frecuencia
1 15
2 13
3 8
4 19
5 21
6 5
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 9
Pasos:
1. Realizar sumatoria del producto de las
clases por su frecuencia absoluta.
2. Dividir la sumatoria sobre el número total de datos.
MEDIA ARITMÉTICA PARA DATOS
AGRUPADOS EN MARCA DE CLASE
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 10
Pasos:
1. Realizar sumatoria del producto
de la marca de clase (Mc) por su
frecuencia absoluta.
MEDIA ARITMÉTICA PARA DATOS
AGRUPADOS EN MARCA DE CLASE
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 11
2. Dividir la sumatoria sobre el número total de datos.
VENTAJAS Y DESVENTAJAS DE LA
MEDIA
Ventajas
• Es la medida de tendencia central más usada.
• El promedio es estable en el muestreo.
• Es sensible a cualquier cambio en los datos (puede ser
usado como un detector de variaciones en los datos).
• Se emplea a menudo en cálculos estadísticos
posteriores.
• Presenta rigor matemático.
• En la gráfica de frecuencia representa el centro de
gravedad.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 12
VENTAJAS Y DESVENTAJAS DE LA
MEDIA
Desventajas
• Es sensible a los valores extremos.
• No es recomendable emplearla en distribuciones muy
asimétricas.
• Si se emplean variables discretas o cuasi-cualitativas, la
media aritmética puede no pertenecer al conjunto de
valores de la variable.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 13
CÁLCULO DE MEDIA
ARITMÉTICA EN EXCEL Y SPSS• Trabajar con la base de datos que se
tiene.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 14
MEDIANA (Me)
• La mediana divide a la población exactamente en dos
partes iguales. La cantidad de datos que queda por
debajo y por arriba de la mediana son iguales.
Corresponde al percentil 50%.
Se puede calcular Me para:
• Datos no agrupados:
– Impares
– Pares
• Datos agrupados
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 15
MEDIANA PARA DATOS NO
AGRUPADOS IMPARES
Encontrar la mediana para los siguientes datos:
4 1 2 3 4 2 2 1 5 5 3
SOLUCIÓN:
• PASO 1: Ordenar los datos.
1 1 2 2 2 3 3 4 4 5 5
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 16
MEDIANA PARA DATOS NO
AGRUPADOS IMPARES
• PASO 2: Localizar el valor que divide en dos partes
iguales el número de datos.
• La mediana es 3, dejando 5 datos a cada lado.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 17
MEDIANA PARA DATOS NO
AGRUPADOS PARES
• Modifiquemos el ejemplo anterior, eliminando el
último dato. Encontrar la mediana:
4 1 2 3 4 2 2 1 5 5
SOLUCIÓN
• PASO 1: Ordenar los datos.
1 1 2 2 2 3 4 4 5 5
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 18
MEDIANA PARA DATOS NO
AGRUPADOS PARES
• PASO 2: Localizar el valor que divide en dos parte
iguales el número de datos.
• El punto medio se encuentra entre dos valores: 2 y
3, por tanto, el valor de la mediana será 2,5.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 19
MEDIANA PARA DATOS
AGRUPADOS• Calcular la mediana a partir de frecuencia
relativa acumulada (H) en la siguiente
tabla de frecuencia:
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 20
MEDIANA PARA DATOS
AGRUPADOS• PASO 1: Localizar la frecuencia relativa acumulada
que contiene la mediana (50%).
• La Me se encuentra entre las clases 3 y 4.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 21
MEDIANA PARA DATOS
AGRUPADOS• PASO 2: Interpolar los datos para encontrar la Me.
• Se ordena según la jerarquía de los datos de H
(mayor a menor) lo cual incluye a las clases, para
encontrar el punto que divide en 2 partes iguales.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 22
MEDIANA PARA DATOS
AGRUPADOS• La diferencia es 27,1%. Para llegar al 50%, se debe
incrementar en 4,2% partiendo desde la clase 30.
45,8%+ 4,2% = 50,0%
• Con una regla de tres simples se halla el incremento
en unidades la clase para ese 4,2%.
10 27,1%
Incremento 4,2 %
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 23
MEDIANA PARA DATOS
AGRUPADOS• Para llegar al 50% de los datos, a la clase
30 debemos incrementarle 1,55.
Me = 31,55
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 24
MEDIANA PARA DATOS
AGRUPADOS• Calcular la mediana a partir de intervalos de clase
para datos agrupados en la siguiente tabla.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 25
MEDIANA PARA DATOS
AGRUPADOS• PASO 1: Localizar entre qué intervalos de clase se
encuentra la Me, lo cual está entre el intervalo de clase
4, para ser más preciso, entre los valores 45,21 y 53,21.
• Hasta 45,21 hay agrupados el 42,50% de los datos, y
hasta 53,21 se resume el 60,00% de los datos.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 26
MEDIANA PARA DATOS
AGRUPADOS• PASO 2: Interpolar los datos para encontrar la
mediana. Se ordena jerárquicamente:
• Entre los dos límites superiores abarcan un total de
17,50% de los datos. Se debe aumentar en 7,50%
los datos desde límite superior del tercer intervalo
de clase.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 27
MEDIANA PARA DATOS
AGRUPADOSPara incrementar al 50%, se determina la diferencia
(42,5 + 7,5) y se procede:
8,00 17,50%
Incremento 7,50%
• Para llegar al 50% de los datos, 45,21 se aumenta
en 3,43 unidades.
Me = 45,21+ 3,43 Me = 48,6430/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 28
MEDIANA PARA DATOS
AGRUPADOS
La fórmula para calcular la mediana
• La mediana parte del límite superior del intervalo
de clase anterior, la cual simbolizaremos por Lsi-1,
siendo i igual a 4 (cuarto intervalo de clase). A este
valor se le suma el incremento para llegar al 50%
de los datos:
• Me = Ls i-1 + Incremento
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 29
MEDIANA PARA DATOS
AGRUPADOS• El incremento resulta de multiplicar el incremento para
llevar la frecuencia al 50% (50% - Hi-1) por el ancho de
la clase (A) sobre la diferencia porcentual entre los
límites superiores (Hi – Hi-1):
• Simplificando aún más la fórmula, recordemos que Hi –
Hi-1 es lo mismo la frecuencia relativa del intervalo de
clase i (hi).
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 30
MODA
• Valor que aparece con mayor frecuencia. Una
distribución unimodal tiene una sola moda y una
distribución bimodal tiene dos.
Ejemplo: moda para datos no agrupados
• Los siguientes 30 datos a personas sobre la marca de
gaseosa que más consume a la semana:
Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3
Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1
Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1
Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2
Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3
•30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 31
MODA
SOLUCIÓN
• PASO 1: Determinar las frecuencias de cada valor
de la variable.
La marca 1 se repite 15 veces
La marca 2 se repite 6 veces
La marca 3 se repite 9 veces
• PASO 2: la moda representa el valor que más se
repite. En este caso es la marca 1.
Mo = Marca 1
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 32
MODA
• Ejemplo: moda para datos agrupados
• Calcular la moda a partir de la siguiente
tabla de frecuencia:
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 33
MODA
SOLUCIÓN
• Las marcas de clase que más frecuencias
tienen son 11 y 13, por tanto decimos que
es un caso donde aparecen dos modas
(bimodal).
Mo1 = 11
Mo2 = 13
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 34
MODA
Calculo de la moda mediante fórmula
• Algunos autores suelen aplicar una
fórmula para determinar la moda para
tablas de frecuencia.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 35
DESCRIPCIÓN DE UNA VARIABLE
NUMÉRICA
MEDIDAS DE DISPERSIÓN
• Desviación Estándar
• La varianza.
• Coeficiente de variación
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 36
DESVIACIÓN ESTÁNDAR (S)
• Es el promedio de distancias que tienen los datos
respecto a la media aritmética. Llamada también
desviación típica.
• La fórmula para datos no agrupados es:
Donde:
• = sumatoria del cuadrado de las desviaciones.
• n / N = muestra o población30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 37
1
X(
S 1
2
2)
s −
−
==
=
n
n
i
xi
1
X(
1
2
2)
−
−
==
=
N
N
i
i
Para la población
)X(2
xi − )X(2
−i
Para la muestra
DESVIACIÓN ESTÁNDAR (S)
• Ejemplo:
• Desviación estándar: 1.9730/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 38
X X- (X- )29 3.29 10.807 1.29 1.656 0.29 0.086 0.29 0.085 -0.71 0.514 -1.71 2.943 -2.71 7.37
Media ( ) 5.71428571 23.43
1
X(
S 1
2
)
−
−
=
=
n
n
i
xi
17
23.40
S 1
−=
=
n
i
9.3S =