12
Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S. Prof. Joel Amauris Gelabert S. Medidas de Tendencia Central y de Dispersión. Medidas de Tendencia Central Media Aritmética Mediana Moda Medidas de Dispersión Rango Desviación media Desviación Típica Varianza Gráficos Estadísticos Media Geométrica Media Armónica Coeficiente de Variación

Trabajo de Estadística

Embed Size (px)

Citation preview

Page 1: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Prof. Joel Amauris Gelabert S.

Medidas de Tendencia Central y de Dispersión.

Medidas de Tendencia Central

Media Aritmética

Mediana

Moda

Medidas de Dispersión

Rango

Desviación media

Desviación Típica

Varianza

Gráficos Estadísticos

Media Geométrica Media Armónica

Coeficiente de Variación

Page 2: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Media Aritmética. La media aritmética de una variable se define como la suma de todos los valores de la variable dividida entre el número total de datos y se denota por . Fórmula: Mediana. Es el valor central de la variable. Para calcular la mediana en datos sueltos, debemos tener en cuenta dos aspectos fundamentales:

1.- Si n es impar, hay un término central, por lo que la mediana es el término: 𝒙𝒏+𝟏

𝟐

2.- Si n es par hay dos datos centrales y en este caso la mediana es el término:

𝒙 𝒏 𝟐

+ 𝒙 𝒏

𝟐+𝟏

𝟐

Moda. La moda es el dato de la variable que tiene mayor frecuencia.

Media Geométrica. La media geométrica de n observaciones es la raíz de índice n del producto de todas las observaciones. Se representa por: Fórmula: Media Armónica. La media armónica de n observaciones es la inversa de la media de las inversas de las observaciones.

Se denota por:

Varianza. Es la sumatoria del cuadrado de las desviaciones de las observaciones con respecto a la media aritmética dividida entre el total de datos.

Se denota por:

𝑥

𝑥 =

∑ 𝒙𝒊

𝒏

𝐺𝑥 𝐆 𝐱 = √𝐱𝟏. 𝐱𝟐. 𝐱𝟑. 𝐱𝟒 … … 𝐱𝐢

𝐧

H = 𝐧

∑ 𝟏

𝐱𝐢

𝐧𝐢=𝟏

S = ∑(𝐱𝐢− 𝒙)𝟐

𝐧−𝟏

𝒏𝒊=𝟏

Page 3: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Desviación Típica. Es la raíz cuadrada de la varianza.

Su fórmula es: S = √∑(𝐱𝐢− 𝒙)

𝟐

𝐧−𝟏𝒏𝒊=𝟏

Rango. Es la diferencia entre el valor mayor y el valor menor de la distribución. Fórmula: R = 𝐗𝐦𝐚𝐱 − 𝐗𝐦𝐢𝐧 Desviación Media. Es la media de los valores absolutos de las desviaciones y se denota por DM

Coeficiente de Variación. Es una medida que nos permite decir entre dos muestras, cual es la que presenta mayor dispersión.

Su fórmula es: C.V = 𝐬

𝒙 100

Gráficos Estadísticos. Los gráficos estadísticos nos permiten presentar los datos mediante figuras o dibujos.

.

Prof. Joel Amauris Gelabert S.

Page 4: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Prof. Joel Amauris Gelabert

Distribución Muestral.

Muestreo

Muestreo Aleatorio Simple

Muestreo Con Reemplazamiento

Muestreo Sin Reemplazamiento

Muestreo en una población Distribuida Normalmente

Muestreo en poblaciones finitas

Muestreo en poblaciones que no están distribuidas normalmente

Media

Distribución de la diferencia entre dos medias muestrales

Tamaño de la muestra para estimar la media de la población

Distribución de la suma de dos medias muestrales

Prof. Joel Amauris Gelabert S.

Page 5: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Con las edades de los participantes de la maestría, construya una tabla de distribución de frecuencias con i=5.

Edades de los participantes:

Se forman los intervalos de la clase teniendo en cuenta que i= 5, empezando por el dato menor. (24)

33 34 34 35 35 35 36 36 36 37

37 37 40 40 41 41 42 42 43 44

44 58 45 48 49 49 50 50 52 53 54 N= 41

24 26 27 29 29 30 30 31 32 32

𝐟𝐢 −1

Frecuencia absoluta acumulada anterior a la clase donde está la mediana.

𝐟𝐢: Frecuencia absoluta simple de la clase donde está la mediana. I: intervalo o amplitud de clase

Clases 𝐟𝐢 𝐱𝐢 𝐟𝐫 𝐅𝐢 A 𝐅𝐑 A % % A 24-29 3 26.5 0.073 3 0.073 7.3 7.3 29-34 8 31.5 0.195 11 0.268 19.5 26.8 34-39 11 36.5 0.268 22 0.536 26.8 53.6 39-44 7 41.5 0.170 29 0.707 17.0 70.7 44-49 4 46.5 0.097 33 0.803 9.7 80.3 49-54 6 51.5 0.146 39 0.949 14.6 94.9 54-59 2 56.5 0.048 41 0.997 4.8 99.7

TOTAL 41 0.997 99.7

Page 6: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Se calculan los valores del punto medio

𝐱𝐢 = 𝐋𝐒𝐮𝐩𝐞𝐫𝐢𝐨𝐫+𝐋𝐈𝐧𝐟𝐞𝐫𝐢𝐨𝐫

𝟐

𝐱𝐢 = 𝟐𝟒+𝟐𝟗

𝟐 = 26.5 𝐱𝐢 =

𝟐𝟗+𝟑𝟒

𝟐 = 46.5

𝐱𝐢 = 𝟑𝟒+𝟑𝟗

𝟐 = 31.5 𝐱𝐢 =

𝟑𝟗+𝟒𝟒

𝟐 = 51.5

𝐱𝐢 = 𝟐𝟒+𝟐𝟗

𝟐 = 36.5 𝐱𝐢 =

𝟐𝟒+𝟐𝟗

𝟐 = 56.5

𝐱𝐢 = 𝟐𝟒+𝟐𝟗

𝟐 = 41.5

Se calculan los valores de la frecuencia relativa simple

𝐟𝐫 = 𝐟𝐢𝐍

𝐟𝐫 = 𝟑

𝟒𝟏 = 0.073 𝐟𝐫 =

𝟒

𝟒𝟏 = 0.097

𝐟𝐫 = 𝟖

𝟒𝟏 = 0.195 𝐟𝐫 =

𝟔

𝟒𝟏 = 0.146

𝐟𝐫 = 𝟏𝟏

𝟒𝟏 = 0.268 𝐟𝐫 =

𝟐

𝟒𝟏 = 0.048

𝐟𝐫 = 𝟕

𝟒𝟏 = 0.170

Page 7: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Media Aritmética.

𝒙 = ∑ 𝐱𝐢.𝐟𝐢

𝐍

𝒙 = (𝟐𝟔.𝟓)(𝟑)+(𝟑𝟏.𝟓)(𝟖)+(𝟑𝟔.𝟓)(𝟏𝟏)+(𝟒𝟏.𝟓)(𝟕)+(𝟒𝟔.𝟓)(𝟒)+(𝟓𝟏.𝟓)(𝟔)+(𝟓𝟔.𝟓)(𝟐)

𝟒𝟏

𝒙 = 𝟕𝟗.𝟓+𝟐𝟓𝟐+𝟒𝟎𝟏.𝟓+𝟐𝟗𝟎.𝟓+𝟏𝟖𝟔+𝟑𝟎𝟗+𝟏𝟏𝟑

𝟒𝟏 =

𝟏,𝟔𝟑𝟏.𝟓

𝟒𝟏

𝒙 = 39.79

Mediana.

𝐌𝐞 = 𝐋𝐢𝐧𝐟𝐞𝐫𝐢𝐨𝐫 + (𝐍

𝟐 −[𝐟𝐢−𝟏]

𝐟𝐢) 𝐈

𝐌𝐞 = 34 + (𝟒𝟏

𝟐 −𝟏𝟏

𝟏𝟏) 𝟓 = 34 + (

𝟗.𝟓

𝟏𝟏) 5

𝐌𝐞 = 34 + 4.318

𝐌𝐞 = 38.32

Page 8: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Uso de los gráficos estadísticos.

Los gráficos estadísticos suelen utilizarse con frecuencia para representar el comportamiento de un determinada variable.

Ejemplo. En un centro educativo se realizó una investigación para determinar el rango de años en servicios de los docentes. En tal sentido los resultados obtenidos fueron:

Años en servicios

Frecuencia %

De 0 a 5 3 10 % De 6 a 10 8 27 %

De 11 a 15 7 23 % De 16 a 20 10 33 % 21 o más 2 7 %

Total 30 100 % Fuente: Cuestionario aplicado a los/as docentes

Moda.

𝐌𝐎 = 𝐋𝐢𝐧𝐟𝐞𝐫𝐢𝐨𝐫 + (𝐟𝐢 −[𝐟𝐢−𝟏]

(𝐟𝐢−𝐟𝐢−𝟏)+(𝐟𝐢−𝐟𝐢+𝟏)) 𝐈

𝐌𝐎 = 34 + (𝟏𝟏−𝟖

(𝟏𝟏−𝟖)+(𝟏𝟏−𝟕)) 𝟓 = 34 + (

𝟑

𝟑+𝟒) 𝟓 = 34 +

𝟏𝟓

𝟕 = 34 +2.14

𝐌𝐎 = 36.14

Page 9: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Estos resultados muestran que el 10 % de los docentes tiene menos de 5 años de servicio, el 23 % tiene entre 11 y 15 años, el 27 % tiene entre 6 y 10 años, que el 33 % tiene de 16 a 20 años y que el 7 % tiene 21 años o más en el sistema educativo.

0

1

2

3

4

5

6

7

8

9

10

De 0 5 años De 6 a 10años

De 11 a 15años

De 16 a 20años

21 años omás

De 0 5 años

De 6 a 10 años

De 11 a 15 años

De 16 a 20 años

21 años o más

Page 10: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

FÓRMULA PARA CALCULAR LA MUESTRA.

𝐍𝐩= 𝐤𝟐 𝐍 𝐩 𝐪

𝐞𝟐(𝐍−𝟏)+𝐤𝟐𝐩𝐪 o

Donde:

P: proporción de individuos que poseen en la población la característica de estudio. Este dato es generalmente desconocido y se suele suponer que p=q=0.5 que es la opción más segura.

N: población de donde se tomara la muestra

q: proporción de individuos que no poseen esa característica, es decir, es 1−p.

n: tamaño de la muestra (número de encuestas que vamos a hacer).

Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de mayor confianza o esté más libre de error necesariamente; antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida de datos.

e: Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1 % (0.01) y 9 % (0.09).

k: Es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos: un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de k se obtienen de la tabla de la distribución normal estándar N (0,1).

e (%) 1 % 2 % 3 4 5 6 7 8 9

Valor 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

En donde 𝝈 es el límite aceptable de error y Z= p.q Siendo p=q=0.5

Page 11: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Los valores de k más utilizados y sus niveles de confianza son:

Valor de k 1,15 1,28 1,44 1,65 1,96 2,24 2,58

Nivel de confianza 75 % 80 % 85 % 90 % 95 % 97,5 % 99 %

Ejemplo.

Calcular el tamaño de la muestra de una población de 500 elementos con un nivel de confianza del 95%. Solución:

Se tiene N=500, para el 95% de confianza Z = 1,96 y como no se tiene los demás valores se tomará 𝜎=0.05 y e = 0,05. Reemplazando valores de la fórmula se tiene:

Z= p.q P=0.5 y q=1−q q=1−0.5 q=0.5 Como p=q Entonces p.q= Z2

Como estamos trabajando con

un 95 % de confiabilidad nos

queda un 5 % de límite

aceptable de error, por lo que

e= 5 % o 0.05

Page 12: Trabajo de Estadística

Reflexiones Matemáticas Trabajo de Estadística Prof. Joel Amauris Gelabert S.

Otra forma.

𝐍𝐩= 𝐤𝟐 𝐍 𝐩 𝐪

𝐞𝟐(𝐍−𝟏)+𝐤𝟐𝐩𝐪

P=0.5

q=0.5

e=0.05 (Límite aceptable de error)

N=500 (población)

K=0.5 (Nivel de confianza).

𝐍𝐩= (𝟏.𝟗𝟔)𝟐 (𝟓𝟎𝟎)(𝟎.𝟓)(𝟎.𝟓)

(𝟎.𝟎𝟓)𝟐(𝟓𝟎𝟎−𝟏)+(𝟏.𝟗𝟔)𝟐(𝟎.𝟓)(𝟎.𝟓)

𝐍𝐩= 𝟒𝟖𝟎.𝟐

𝟎.𝟎𝟎𝟐𝟓+𝟎.𝟗𝟔𝟎𝟒 =

𝟒𝟖𝟎.𝟐

𝟐.𝟐𝟎𝟕𝟗

𝐍𝐩= 217.