44
1 UNIVERSIDAD TÉCNICA DE AMBATO FACULTAD DE INGENIERÍA CIVIL Y MECÁNICA CARRERA DE INGENIERÍA CIVIL PORTAFOLIO DEL MODULO FORMATIVO “ESTADÍSTICA” Tercer Semestre DOCENTE: M. Sc. Ing. Fernando Durán ALUMNO: Andrés Abril Camino AMBATO – ECUADOR Semestre Abril 2015 – Septiembre 2015

Estadística, libro de trabajo

Embed Size (px)

DESCRIPTION

Apuntes y tareas de estaística, método de wilcoxon, t student.

Citation preview

Page 1: Estadística, libro de trabajo

1

UNIVERSIDAD TÉCNICA DE AMBATO

FACULTAD DE INGENIERÍA CIVIL Y MECÁNICA

CARRERA DE INGENIERÍA CIVIL

PORTAFOLIO DEL MODULO FORMATIVO

“ESTADÍSTICA”

Tercer Semestre

DOCENTE:

M. Sc. Ing. Fernando Durán

ALUMNO:

Andrés Abril Camino

AMBATO – ECUADOR

Semestre Abril 2015 – Septiembre 2015

Page 2: Estadística, libro de trabajo

2

Contenido CONSULTAS Y DEBERES ..................................................................................................... 3

TABLAS ESTADÍSTICAS ..................................................................................................... 25

CONSULTAS Y MATERIA DOCUMENTADA..................................................................... 30

Page 3: Estadística, libro de trabajo

3

CONSULTAS Y DEBERES

Page 4: Estadística, libro de trabajo

4

Page 5: Estadística, libro de trabajo

5

Page 6: Estadística, libro de trabajo

6

Page 7: Estadística, libro de trabajo

7

Page 8: Estadística, libro de trabajo

8

Page 9: Estadística, libro de trabajo

9

Page 10: Estadística, libro de trabajo

10

Page 11: Estadística, libro de trabajo

11

Page 12: Estadística, libro de trabajo

12

Page 13: Estadística, libro de trabajo

13

Page 14: Estadística, libro de trabajo

14

Page 15: Estadística, libro de trabajo

15

Page 16: Estadística, libro de trabajo

16

Page 17: Estadística, libro de trabajo

17

Page 18: Estadística, libro de trabajo

18

Page 19: Estadística, libro de trabajo

19

Page 20: Estadística, libro de trabajo

20

Page 21: Estadística, libro de trabajo

21

Page 22: Estadística, libro de trabajo

22

Page 23: Estadística, libro de trabajo

23

Page 24: Estadística, libro de trabajo

24

Page 25: Estadística, libro de trabajo

25

TABLAS ESTADÍSTICAS

Page 26: Estadística, libro de trabajo

26

Page 27: Estadística, libro de trabajo

27

Page 28: Estadística, libro de trabajo

28

Page 29: Estadística, libro de trabajo

29

MANUAL BÁSICO PARA EL ESTUDIO

Page 30: Estadística, libro de trabajo

30

CONSULTAS Y MATERIA DOCUMENTADA

EJEMPLO

Page 31: Estadística, libro de trabajo

31

1.-El gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar

cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500,

510, 515 y 520) gramos respectivamente.

Por lo que su media es:

MÉTODO DE REGRESIÓN R2

El procedimiento para obtener valores de “a” y “b” para una serie de pares de datos de “x”

y de “y” (tal como la presentada en la Figura 1 y/o en la Tabla 1) es como sigue:

Paso 1 Calcule, para cada par de valores de “x” e “y”, las cantidades “x²”, “y²”, y

“x.y”.

Paso 2 Obtenga las sumas (∑) de estos valores para todos los pares de datos de “x” e

“y”, así como las sumas del total de los valores de “x” e “y”. Los resultados de

los Pasos 1 y 2 aparecerán en forma similar a la siguiente:

Número de pares de datos x x² y y² x.y

1 … … … … …

2 … … … … …

3 … … … … …

·

·

·

n … … … … …

Monto de las sumas ∑x ∑x² ∑y ∑y² ∑x·y

Paso 3 Estime la pendiente (b) por medio de la relación:

Paso 4 Estime el intercepto (a) por medio de la relación:

Page 32: Estadística, libro de trabajo

32

A partir de esos valores de “a” y de “b” obtenidos mediante las Ecuaciones 2 y 3, es

posible trazar a lo largo de los puntos dispersos de un gráfico la línea recta mejor ajustada

a los mismos, y verificar visualmente si tales puntos están bien “expresados” por la línea

(Figura 1b).

Correlación

El análisis de correlación se encuentra estrechamente vinculado con el análisis de regresión

y ambos pueden ser considerados de hecho como dos aspectos de un mismo problema.

La correlación entre dos variables es - otra vez puesto en los términos más simples - el

grado de asociación entre las mismas. Este es expresado por un único valor llamado

coeficiente de correlación (r), el cual puede tener valores que ocilan entre -1 y +1. Cuando

“r” es negativo, ello significa que una variable (ya sea “x” o “y”) tiende a decrecer cuando

la otra aumenta (se trata entonces de una “correlación negativa”, correspondiente a un valor

negativo de “b” en el análisis de regresión). Cuando “r” es positivo, en cambio, esto

significa que una variable se incrementa al hacerse mayor la otra (lo cual corresponde a un

valor positivo de “b” en el análisis de regresión).

Los valores de “r” pueden calcularse fácilmente en base a una serie de pares de datos de

“x” e “y”, utilizando la misma table y montos que se indican en el Paso 2 de la sección

“regresión” de este capítulo. De este modo “r” puede ser obtenido - indirectamente - a partir

de la relación:

COEFICIENTE DE REGRESIÓN R2

Para la regresión lineal

Para la regresión basta con hacer el cuadrado del coeficiente de correlación de Pearson.

Donde:

es la covarianza de

es la desviación típica de la variable

es la desviación típica de la variable

Page 33: Estadística, libro de trabajo

33

Desviación Estándar.-

Es un cálculo empleado en la estadística por la letra griega σ su cálculo se puede dar por

una tabla de distribución estadística con intervalos o también de un conjunto de datos

dados.

Su cálculo esta dado de forma general para el cálculo de un conjunto de datos de la

siguiente manera:

La raíz cuadrada de la sumatoria de cada uno de los términos restando a la media

aritmética elevando está última resta de cada término al cuadrado todo esto dividido para

el número de datos o muestras existentes

Para una comprensión más objetiva se realizara un ejemplo.

Del siguiente conjunto de datos determine la desviación estándar:

5 9 6 7 5

X = 6.4

Desviación estándar en la tabla de distribución estadística

Dada una tabla de distribución estadística

Se obtiene una media aritmética única para la desviación estándar dada del producto entre

la sumatoria total del número de variables existentes en cada intervalo (Fo) y La

sumatoria de la media aritmética de cada intervalo Mc.

La desviación estándar está dada por la raíz cuadrada de la división la sumatoria total de

media aritmética de cada intervalo elevado al cuadrado Mc2

por cada uno del número de

variables existentes en cada intervalo entre la sumatoria total de Mc. Sumado la media

aritmética única de la desviación estándar elevado al cuadrado.

X = 472/84

X = 5.62

Coef iciente de regresión R2

Esta dada por una ecuación pre establecida que los datos estadísticos deberán dar para

poder efectuar su cálculo

Intervalos Fo Mc Mc*Fo Mc²*Fo

(17-19) 9 18 162 2916

(19-21) 5 20 100 2000

(21-23) 3 22 66 1452

(23-25) 6 24 144 3456

84 472 9824

Page 34: Estadística, libro de trabajo

34

Cualquiera de las dos ecuaciones es válida y no afectará el resultado dado que se tomara

Se determinará también el coeficiente de regresión R2 ajustado que está dado por la

siguiente ecuación y esta parte de la Regresión R2

De igual forma se dará una ecuación preestablecida de la siguiente manera:

Donde

n = número total de datos o de muestra

R2 = Coeficiente de regresión

P = frecuencia nula de una variación de datos

K= el número de parámetros que se utiliza para la determinar el coeficiente de regresión.

Ejemplo:

Calcúlese el coeficiente de regresión R2 y R

2 Ajustado si se tiene la varianza explicada

como 3024.4 y la varianza total 3092.6 y se tiene dos parámetros de muestra entre 7 datos

Regresión R2

Regresión R

2 ajustada

(

)

La media aritmética es el valor obtenido al sumar todos

los datos y dividir el resultado entre el número total dedatos .

es el símbolo de la media aritmética .

Page 35: Estadística, libro de trabajo

35

Ejemplo:

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el

peso medio.

MEDIA GEOMÉTRICA a media geométrica (MG) de un conjunto de números estrictamente

positivos (X1, X2,…,XN) es la raíz N-ésima del producto de

los N elementos.

Todos los elementos del conjunto tienen que ser mayores que cero.

Si algún elemento fuese cero (Xi=0), entonces la MG sería 0 aunque

todos los demás valores estuviesen alejados del cero.

La media geométrica es útil para calcular medias de porcentajes,

tantos por uno, puntuaciones o índices. Tiene la ventaja de que no es tan

sensible como la media a los valores extremos.

Ejemplo

En una empresa quieren saber la proporción media de mujeres en

los diferentes departamentos. Para ello, se recoge el porcentaje de

mujeres en los cinco principales departamentos.

Page 36: Estadística, libro de trabajo

36

Como es la media de porcentajes, calculamos la media

geométrica que es más representativa.

Media geométrica

La media geométrica (MG), de un conjunto de números positivos se define como

la n- del producto de los números. Por tanto, la fórmula para la

media geométrica es dada por

Existen dos usos principales de la media geométrica:

1. Para promediar porcentajes, indices y cifras relativas y

2. Para determinar el incremento porcentual promedio en ventas, producción u

otras actividades o series económicas de un periodo a otro.

Page 37: Estadística, libro de trabajo

37

Ejemplo

Supongase que las utilidades obtenidas por una compañía constructora en cuatro

proyectos fueron de 3, 2, 4 y 6%, respectivamente. ¿ Cúal es la media geométrica

de las ganancias?.

En este ejemplo y asi la media geométrica es determinada por

y así la media geométrica de las utilidades es el 3.46%.

La media aritmética de los valores anteriores es 3.75%. Aunque el valor 6% no es

muy grande, hace que la media aritmética se incline hacia valores elevados. La

media geométrica no se ve tan afectada por valores extremos.

Media armónica

La media armónica se define como el recíproco de la media aritmética de los

recíprocos:

Este valor se emplea para promediar variaciones con respecto al tiempo.

Observaciones sobre la media Geométrica y la media Armónica

El empleo de la media geométrica o de la armónica equivale a una transformación

de la variable en log ó , respectivamente, y el cálculo de la media

aritmética de la nueva variable; por ejemplo, si la variable abarca un campo de

variación muy grande, tal como el porcentaje de impureza de un producto químico,

por lo general alrededor del 0.1%, pero que en ocaciones llega incluso al 1% o

más, puede ser ventajoso el empleo de log en lugar de para obtener una

distribución más simétrica y que se aproxime más a una distribución normal. La

media aritmética de log es el logaritmo de la media geométrica de , de forma

que la media empleada es equivalente al empleo de la media geométrica como

valor medio de .

1. Construya la columna con los datos en Excel.

Page 38: Estadística, libro de trabajo

38

2. Ingrese a f y seleccione estadísticas y luego active MEDIA. GEOM o

MEDIA. ARMO, entonces aparecerá una ventana en la que se le pide

Número 1: ingrese el rango de los datos

Número 2: ingrese el rando de otro conjunto de datos

Ejemplo Supongase que una familia realiza un viaje en automóvil a un ciudad y cubre los primeros 100 km a 60 km/h, los siguientes 100 km a 70 km/h y los últimos 100 km a 80 km/h. Calcular, en esas condiciones, la velocidad media realizada.

<Medidas de dispersión - rango, varianza, desviación típica y coeficiente

de variación

Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o

menos concentrados, o más o menos dispersos.

Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las

siguientes:

1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre

el valor más elevado y el valor más bajo.

2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se

calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media,

multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido

se divide por el tamaño de la muestra.

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más

concentrados están los valores de la serie alrededor de la media. Por el contrario,

mientras mayor sea la varianza, más dispersos están.

3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.

Page 39: Estadística, libro de trabajo

39

4.- Coeficiente de varización de Pearson: se calcula como cociente entre la desviación típica y la media.

Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase

(lección 2ª) y vamos a calcular sus medidas de dispersión.

Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

x x x x x

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%

1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20).

Luego el rango de esta muestra es 10 cm.

2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego, aplicamos la

fórmula:

Por lo tanto, la varianza es 0,0010

3.- Desviación típica: es la raíz cuadrada de la varianza.

Page 40: Estadística, libro de trabajo

40

Luego:

4.- Coeficiente de variación de Pearson: se calcula como cociente entre la desviación

típica y la media de la muestra.

Luego,

El interés del coeficiente de variación es que al ser un porcentaje permite comparar el

nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene

expresada en las mismas unidas que los datos de la serie.

Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los

alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las

desviaciones típicas (una viene vienes expresada en cm y la otra en kg). En cambio, sus

coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.

PERMUTACIONES

Una permutación es una combinación en donde el orden es importante. La notación para

permutaciones es P(n,r) que es la cantidad de permutaciones de “n” elementos si solamente

se seleccionan “r”.

Cv = 0,0320 / 1,253

Cv = 0,0255

Page 41: Estadística, libro de trabajo

41

Ejemplo: Si nueve estudiantes toman un examen y todos obtienen diferente calificación, cualquier alumno podría alcanzar la calificación más alta. La segunda calificación más alta

podría ser obtenida por uno de los 8 restantes. La tercera calificación podría ser obtenida

por uno de los 7 restantes.

La cantidad de permutaciones posibles sería: P(9,3) = 9*8*7 = 504 combinaciones posibles

de las tres calificaciones más altas

Se llama permutaciones de m elementos (m = n) a las diferentes agrupaciones de esos m

elementos de forma que:

Sí entran todos los elementos.

Sí importa el orden.

No se repiten los elementos.

Ejemplos:

1. Calcular las permutaciones de 6 elementos.

P6 = 6! = 6 · 5 · 4 · 3 · 2 · 1 = 720

2. ¿Cuántos números de 5 cifras diferentes se puede formar con los dígitos: 1, 2, 3, 4, 5?

m = 5 n = 5

Sí entran todos los elementos.

Sí importa el orden.

No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes.

3. ¿De cuántas formas distintas pueden sentarse ocho personas en una fila de butacas?

Sí entran todos los elementos. Tienen que sentarse las 8 personas.

Sí importa el orden.

Page 42: Estadística, libro de trabajo

42

No se repiten los elementos. Una persona no se puede repetir.

Se llama permutaciones de m elementos (m = n) a las diferentes agrupaciones de esos m

elementos de forma que:

Sí entran todos los elementos.

Sí importa el orden.

No se repiten los elementos.

Ejemplos

1. Calcular las permutaciones de 6 elementos.

P6 = 6! = 6 · 5 · 4 · 3 · 2 · 1 = 720

2. ¿Cuántos números de 5 cifras diferentes se puede formar con los dígitos: 1, 2, 3, 4, 5.

m = 5 n = 5

Sí entran todos los elementos. De 5 dígitos entran sólo 3.

Sí importa el orden. Son números distintos el 123, 231, 321.

No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes.

3. ¿De cuántas formas distintas pueden sentarse ocho personas en una fila de butacas?

Sí entran todos los elementos. Tienen que sentarse las 8 personas.

Sí importa el orden.

No se repiten los elementos. Una persona no se puede repetir.

Page 43: Estadística, libro de trabajo

43

Permutaciones circulares

Es un caso particular de las permutaciones.

Se utilizan cuando los elementos se han de ordenar "en círculo", (por ejemplo, los

comensales en una mesa), de modo que el primer elemento que "se sitúe" en la muestra

determina el principio y el final de muestra.

Ejemplos

1. Calcular las permutaciones circulares de 7 elementos.

PC7= (7 − 1)! = 6! = 6 · 5 · 4 · 3 · 2 · 1 = 720

2. ¿De cuántas formas distintas pueden sentarse ocho personas alrededor de una mesa redonda?

Permutaciones con repetición

Permutaciones con repetición de m elementos donde el primer elemento se repite a veces

, el segundo b veces , el tercero c veces, ...(m = a + b + c + ... = n) son los distintos grupos

que pueden formarse con esos m elementos de forma que :

Sí entran todos los elementos.

Sí importa el orden.

Sí se repiten los elementos.

Ejemplos

Page 44: Estadística, libro de trabajo

44

Calcular las permutaciones con repetición de: .

2. Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4; ¿cuántos números de nueve cifras se pueden

formar?

m = 9 a = 3 b = 4 c = 2 a + b + c = 9

Sí entran todos los elementos.

Sí importa el orden.

Sí se repiten los elementos.

3. En el palo de señales de un barco se pueden izar tres banderas rojas, dos azules y cuatro verdes. ¿Cuántas señales distintas pueden indicarse con la colocación de las nueve

banderas?

Sí entran todos los elementos.

Sí importa el orden.

Sí se repiten los elementos.