6
Tema 2. Estadística descriptiva Prof(a) Nancy Chacín Medidas de tendencia no central: Cuartiles y percentiles Vamos a introducir nuevas medidas de dispersión basadas en el concepto de la mediana, valor que separa los datos en 2 conjuntos de igual tamaño. Como una extensión de la idea de la mediana, vamos a definir unas medias descriptivas numéricas, que no van a indicar la tendencia central de los datos, sino que van a ayudar a localizarlos y a medir el grado de dispersión. Estas medidas son los cuartiles y percentiles; para estos cálculos los datos deben estar ordenados de menor a mayor. Los cuartiles: son valores que dividen una serie de datos, previamente ordenados en forma creciente en 4 partes iguales; en consecuencia existen 3 cuartiles que denotaremos por: Q1, Q2, Q3, siendo el cuartil Q2 igual a la mediana. Ejemplo: El siguiente grupo de datos representan las edades de un grupo de estudiante Los cuartiles se calculan siguiendo el concepto de la mediana. El segundo cuartil es la mediana de todo el conjunto de datos Q2=23. El primer cuartil Q1=19 lo podemos definir como la mediana del conjunto que contiene los datos más pequeños y el 17 18 18 20 21 22 24 24 25 27 27 28 Q1 Q2 Q3 25% 25% 25% 25% 50% 50% median

Cuartiles y percentiles

Embed Size (px)

Citation preview

Page 1: Cuartiles y percentiles

Tema 2. Estadística descriptiva Prof(a) Nancy Chacín

Medidas de tendencia no central: Cuartiles y percentiles

Vamos a introducir nuevas medidas de dispersión basadas en el concepto de la mediana, valor que separa los datos en 2 conjuntos de igual tamaño. Como una extensión de la idea de la mediana, vamos a definir unas medias descriptivas numéricas, que no van a indicar la tendencia central de los datos, sino que van a ayudar a localizarlos y a medir el grado de dispersión. Estas medidas son los cuartiles y percentiles; para estos cálculos los datos deben estar ordenados de menor a mayor.

Los cuartiles: son valores que dividen una serie de datos, previamente ordenados en forma creciente en 4 partes iguales; en consecuencia existen 3 cuartiles que denotaremos por: Q1, Q2, Q3, siendo el cuartil Q2 igual a la mediana.

Ejemplo: El siguiente grupo de datos representan las edades de un grupo de estudiante

Los cuartiles se calculan siguiendo el concepto de la mediana.

El segundo cuartil es la mediana de todo el conjunto de datos Q2=23. El primer cuartil Q1=19 lo podemos definir como la mediana del conjunto que contiene los datos más pequeños y el tercer cuartil Q3=26 es la mediana del conjunto que tiene los datos más grandes. Observe que:

1) Entre 2 cuartiles cualesquiera se encuentran siempre un 25% de los datos

2) El 25% de los valores es menor que el primer cuartil (Q1)3) El 50% de los valores es menor que el segundo cuartil (Q2)

50%50%

25%25%25%25%

Q3Q2Q1

17 18 18 20 21 22 24 24 25 27 27 28

mediana

Page 2: Cuartiles y percentiles

Tema 2. Estadística descriptiva Prof(a) Nancy Chacín

4) El 75% de los valores es menor que el tercer cuartil (Q3)5) El 25% de los valores es mayor que el tercer cuartil (Q3)

Rango intercuartil: es la diferencia entre el tercer y el primer cuartil, se denota por RI.

RI= Q1-Q2

Percentiles: los valores que dividen una serie de datos ordenados, de menor a mayor, en 100 partes iguales se llaman percentiles. Existen 99 percentiles que se denotan por: P1, P2, P3,………., P98, P99. Entre dos percentiles consecutivos cualesquiera se encuentra un 1% ò 1/100 parte de los datos. El cálculo de los percentiles es útil si se dispone al menos de 25 a 30 datos. Cuando se disponen de pocos datos su cálculo o interpolación no tiene mucho sentido.

El percentil Ph de un conjunto de datos ordenados es aquel valor que como máximo una porción h/100 o h% de datos son menores que él. Si el número de datos es n, para calcular la ubicación i del percentil h hacemos una regla de tres:

Ejemplo: los datos a continuación representan los pesos (Kg) de un grupo de 50 estudiantes masculinos.

39 58 68 81 9240 59 70 82 9241 62 71 84 9343 63 73 85 9549 64 74 86 10350 65 75 88 10451 66 75 89 10654 66 76 91 10656 67 77 91 10857 67 78 92 112

Calcular los siguientes percentiles: P25; P30; P50; P75; P90. (Las posiciones de estos percentiles están marcados en la tabla de datos)

n 100% i h%

i=h∗n100

i es el número de datos por debajo del percentil Ph

Page 3: Cuartiles y percentiles

Tema 2. Estadística descriptiva Prof(a) Nancy Chacín

Solución

a) P25 es un valor por debajo del cual está el 25% de los datos

Ubicamos el dato número i en la tabla de datos ordenada, como el valor 12,5 no es un número entero, ubicamos la posición entera siguiente, en este caso la posición i del percentil 25 (P25) es i=13

El 25% de los pesos de este grupo de estudiantes es menor que 62 Kg

*Calcular el Q1 y comprobar que es “igual” al P25.

b) El percentil 30 (P30) es un valor por debajo del cual está el 30% de los datos.

Como i es un número entero, se toma el P30 como el punto medio entre el dato Xi y el dato Xi+1, así:

El 30% de los pesos de este grupo de estudiantes es menor que 64,5 Kg.

50 100% i 25%

i=25∗50100

=12,5i=12,5 número de datos por debajo del percentil P25

P25=X 13=62

50 100% i 30%

i=30∗50100

=15i=15 es el número de datos por debajo del percentil P30

P30=X15+X162

=64+652

=64,5

Page 4: Cuartiles y percentiles

Tema 2. Estadística descriptiva Prof(a) Nancy Chacín

Al igual que ocurre con la mediana y los cuartiles, los percentiles no tiene que pertenecer necesariamente al conjunto de datos.

c) El percentil 50 (P50) es un valor por debajo del cual está el 50% de los datos.

Como i es un número entero, se toma el P50 como el punto medio entre el dato Xi y el dato Xi+1, así:

El 50% de los pesos de este grupo de estudiantes es menor que 74,5 Kg.

d) El percentil 75 (P75) es un valor por debajo del cual está el 75% de los datos.

Como i no es un número entero, ubicamos la posición entera siguiente, en este caso la posición i es i=38, ubicamos el dato Xi.

¿Qué significa que el peso de un estudiante esté en el percentil 75? Significa que el 75% de los estudiantes pesan menos que él.

50 100% i 50%

i=50∗50100

=25i=25 es el número de datos por debajo del percentil P50

P50=X25+X262

=74+752

=74,5

50 100% i 75%

i=75∗50100

=37,5

i=37,5 es el número de datos por debajo del percentil P75

P75=X38=91

Page 5: Cuartiles y percentiles

Tema 2. Estadística descriptiva Prof(a) Nancy Chacín

e) El percentil 90 (P90) es un valor por debajo del cual está el 90% de los datos.

Como i es un número entero, se toma el P90 como el punto medio entre el dato Xi y el dato Xi+1, así:

¿Qué significa que el peso de un estudiante esté en el percentil 90? Significa que el 90% de los estudiantes pesan menos que él, y el 10% pesa más.

50 100% i 90%

i= 90∗50100

=45

i=45 es el número de datos por debajo del percentil P75

P90=X 45+X462

=103+1042

=103 ,5