UNIVERSIDAD TECNOLÓGICA ECOTEC. ISO 9001:2008 Estadística Ing. Iliana Rosero

Preview:

Citation preview

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Estadística

Ing. Iliana Rosero

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Definiciones

• Los datos son observaciones recolectadas.

• La Estadística es el conjunto de métodos para planear estudios y experimentos, obtener datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los datos.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Definiciones

• La población es el conjunto completo de todos los elementos que se va a estudiar.

• El censo es el conjunto de datos de cada uno de los miembros de la población.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Definiciones

• Una muestra es un subconjunto de miembros de la población.

• La muestra debe ser seleccionada aleatoriamente y representativa de la población

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ramas de la Estadística

• Estadística Descriptiva

• Recolección,

• Resumen

• Presentación

de datos.

• Estadística

Inferencial • Obtiene conclusiones

acerca de una población a partir de una muestra.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Fuente de Datos

Fuentes SecundariasCompilación de datos

Observación

Experimentación

Impreso o eletrónico

Encuesta

Fuentes PrimariasColección de datos

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Un parámetro es una medición numérica que describe alguna característica de la población.– En la ciudad de Guayaquil, están ubicados 10000

semáforos. – Existen 2000 buses de transporte interprovincial de

los cuales el 40% son nuevas unidades.

• Un estadístico es una medición numérica que describe alguna característica de la muestra.– Al entrevistar a 30 transeúntes se encontró que el

30% tiene mas de dos hijos.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicio

• De acuerdo con una encuesta de Goldman, cerca del 4% de los hogares estadounidense utilizan servicios bancarios online. Una encuesta realizada por Cyber Dialogue investigó las razones por las que la gente abandona esta opción . A continuación se ofrece los resultados obtenidos:

¿Por qué abandonó el banco online?Demasiado tiempo... 40%No lo necesita ..........30%No confía en el sistema..20%.Demasiado costoso........10%

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Describa la población de la encuesta Goldman

• Describa la población de la encuesta Cyber Dialogue.

• El 40% de quienes respondieron indicaron que el banco en línea era demasiado complicado .¿Es esto un parámetro o un estadístico?

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Tipo de datos

Datos cualitativos: se dividen en categorías que se distinguen por características no numéricas.

• Ej: Estatus Marital, Color de ojos

Datos cuantitativos: consisten en números que representan conteos o mediciones.– Datos discretos: Respuesta numéricas que resultan de un

conteo.

• Ej. Número de Hijos, defectos por hora– Datos contínuos : Respuesta numérica que resulta de un

medición. • Ej. Peso, Estatura

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicio1

• Para cada una de las láminas indique tres datos: cualitativo, cuantitativo discreto y cuantitativo continuo.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Niveles de Medición

• Nominal: Nombres o clasificaciones que se utilizan para datos en categorías distintas y separadas– Ej: Tipo de bebida que prefiere

• Ordinal: Clasifican observaciones en categorías con un orden significativo pero no es posible determinar la diferencia numérica entre los valores.– Ej: Riesgo: alto medio bajo

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Niveles de Medición

• De intervalo: Nivel ordinal donde podemos determinar magnitudes de diferencia entre los datos. El cero no indica ausencia de valor.– Ej: Temperatura, Años

• De razón: Nivel de intervalo modificado para que el cero indique un punto de partida– Ej: Peso de equipaje, estatura de un niño

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicio

Indique el nivel de medición utilizado:• Preferencia de vehículo según su estilo:camion, van,etc.• Temperatura corporal de una muestra de clientes

enojados.• Numero de cédula.• Contenido de nicotina (mg) de un cigarrillo.• Calificación de una cita a ciegas : sobresaliente, común

y horrible.• Ingreso anual de los gerentes en una compañía.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicio

Indique el nivel de medición utilizado:• Años en que ha ocurrido el Fenómeno “EL niño”• Calificaciones finales : MB, B, R, P• Automóviles descritos como subcompactos, compactos,

medianos o grandes.• Temperatura del ambiente en el aula.• Edad de los clientes.• Año de nacimiento de sus padres

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Usos y abusos de la Estadística

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Errores comunes

• Muestra autoseleccionada: Los propios sujetos deciden ser incluidos. Encuestas por:– Internet, – Correo– Teléfono.

• Muestras pequeñas

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Errores comunes

• Gráficas engañosas

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Errores comunes

• Pictogramas:

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Preguntas predispuestas:

– Ej: ¿Debería el presidente utilizar su poder de veto para eliminar los desperdicios? …………………… 97% si

– ¿Debería utilizar el presidente su poder de veto? 57% si

Orden de preguntas:◦ Ej: ¿Cree usted que el tránsito vehicular contribuye a la contaminación mas

o menos que la industria? 47% tránsito◦ ¿Cree usted que la industria contribuye a la contaminación mas o menos

que el tránsito vehicular ? 24% tránsito

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Correlación y causalidad: Correlación indica que dos variables están relacionadas. Sin embargo correlación no implica causalidad.

• Estudios para el propio beneficio.

• Imágenes parciales :– Ej. “El 90% de todos nuestros automóvi-

les vendidos en este país en los últimos

10 años continua circulando”

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Números precisos: – Ej. En la actualidad existen 103´215.027

hogares estadounidenses.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Pensamiento Crítico

• Un estudio reveló que en cierta ciudad se expiden más multas por exceso de velocidad a los individuos de grupos minoritarios. Conclusión : En la ciudad los individuos de grupos minoritarios exceden la velocidad límite mas que los blancos.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• En un estudio sobre los síntomas del resfriado, se encontró que todos los sujetos que estaban resfriados mejoraron dos semanas después de tomar píldoras de jengibre. Conclusión: Las píldoras de jengibre curan el resfriado.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Usted planea realizar una encuesta para conocer el porcentaje de personas que están de acuerdo con cierta nueva ley. Usted obtiene direcciones y teléfonos del directorio telefónico y envía una encuesta a 850 personas elegidas al azar. ¿Por qué no es correcto utilizar el directorio telefónico como fuente de los sujetos para las encuestas?

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• El Senado de Hawai entro en audiencia para considerar una ley que obligaba a los motociclistas a usar casco. Algunos motociclistas testificaron que habían participado en choques donde los cascos resultaron inútiles. ¿Qué importante grupo no fue capaz de testificar?

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Usted necesita hacer un estudio para determinar el tamaño promedio de una familia en la ciudad donde vive. Para esto reúne datos que consisten en el número de hermanos y hermanas de los estudiantes de su universidad. ¿Cuáles son los problemas de su investigación?

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

RESUMEN Y GRÁFICAS DE DATOS

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Características importantes de los datos

• Centro

• Variación

• Distribución

• Valores Extremos

• Tiempo

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Distribuciones de Frecuencia

• Concepto: Lista valores de datos junto con su frecuencia.

• Ej: Edad

ActricesFrecuencia

[20-30) 28

[30-40) 30

[40-50) 12

[50-60) 2

[60-70) 2

[70-80) 2

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Distribuciones de frecuencia

• Limites de clase Inferior :Cifras más pequeñas que pueden pertenecer a las clases.

• Limites de clase Superior :Cifras más grande que pueden pertenecer a las clases.

• Ancho de clase: Diferencia entre dos límites de clases inferiores consecutivos.

• Marca de Clase: Punto medio de la clase (Lim Inf + Lim sup)/2

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Procedimiento para construir una distribución de frecuencias

• Decidir el número de clases K=1+3,32 log(n) (entre 5 y 20)

• Calcular el ancho de clase=(Valor máximo-Valor mínimo)/número de clases.

• Establecer el punto de partida como límite inferior de la primera clase y sumar el ancho de clase para encontrar el límite superior.

• Completar todos las clases

• Tabular los datos que se encuentren en cada clase.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicios

• Se tienen 50 valores, ¿Cuál es el número de clases sugerido?

• Un conjunto de datos contiene 100 valores, el mayor es 315 y el menor 56. Especifique los limites de las clases en la tabla de distribución de frecuencia.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicio

• Cierto fabricante selecciona aleatoriamente 20 días de invierno y toma la temperatura °C con los siguientes resultados :

24, 35, 17, 21, 24, 37, 26, 46, 58, 30,

32, 13, 12, 38, 41, 43, 44, 27, 53, 27

• Realice la tabla de distribución de frecuencia

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Desarrolle la tabla de distribución de frecuencia a partir de los siguientes datos que corresponden a ingresos de 30 ejecutivos expresado en miles $.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Distribución de frecuencias relativas

• Se obtiene dividiendo cada frecuencia de clase en el total de frecuencias. Las frecuencias relativas en

ocasiones se expresan como porcentaje.

Frecuencia relativa= frecuencia de clase suma de todas las frecuenciasFrecuencia relativa= frecuencia de clase suma de todas las frecuencias

Edad Actrices Frec. Relativa

[20-30) 37%

[30-40) 39%

[40-50) 16%

[50-60) 3%

[60-70) 3%

[70-80) 3%

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Distribución de frecuencias acumuladas

• La frecuencia acumulada de una clase es la frecuencia de esa clase y de todas las anteriores.

Edad Actrices Frec. Acumulada

[20-30) 28

[30-40) 58

[40-50) 70

[50-60) 72

[60-70) 74

[70-80) 76

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• En cierto país se desea investigar el crecimiento de los jóvenes y se seleccionó una muestra aleatoria de 25 jóvenes y se los midió.

Construya la tabla de distribución de frecuencia absoluta,

relativa y acumulada.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Exploración de datos en tablas de frecuencia

• Distribución Normal• Gráfica de campana• Al inicio las frecuencias son bajas, después se

incrementan hasta un punto máximo y luego disminuyen.

• Distribución aproximadamente simétrica y las frecuencias tienden a distribuirse de manera uniforme a ambos lados

• Ej. Las frecuencias:1,5,6,10,7,4,1 son aprox normal

1,5,50,25,20,15,10,5,3,2 no se aprox normal.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejemplo• Se seleccionaron a 1000 mujeres al azar y

se midieron sus estaturas. Tienen una distribución normal?

Estaturas (pulg) Frecuencia

[56-58) 10

[58-60) 64

[60-62) 178

[62-64) 324

[64-66) 251

[66-68) 135

[68-70) 32

[70-72) 6

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicios de aplicación

La siguiente tabla corresponde a la frecuencia de los pesos (gramos) de monedas de un centavo elegidas al azar. ¿Cuáles son sus conclusiones?

Pesos (gramos) Frecuencia

[2,4-2,5) 18

[2,5-2,6) 19

[2,6-2,7) 0

[2,7-2,8) 0

[2,8-2,9) 2

[3,0-3,1) 25

[3,1-3,1) 8

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicios de aplicación

• Remítase a siguiente tabla de distribución. ¿Cuáles son sus conclusiones?

Estatura hombres (pulg)

Frecuencia

[60-65) 4

[65-70) 25

[70-75) 9

[75-80) 0

[80-85) 0

[85-90) 0

[90-95) 0

[95-100) 0

[100-105) 1

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Una persona taladró un hoyo en un dado, lo rellenó de plomo y lo lanzó 180 veces. Los resultados se presentan en la distribución de frecuencias siguiente. Construya la distribución de frecuencias relativas para los resultados que esperaría de un dado perfectamente legal ¿Existen diferencias en los resultados de los dos dados?

Resultado Frecuencia

1 24

2 28

3 39

4 37

5 25

6 27

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

GRÁFICOS

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Histograma

• Es una gráfica de barra donde la escala horizontal representa clases de valores ( marca de clase y la escala vertical representa frecuencias. Las barras se dibujan sin espacios entre sí.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• Ejemplo:

Realice el histograma a partir de la siguiente tabla:

Estaturas (pulg) Frecuencia

[56-58) 10

[58-60) 64

[60-62) 178

[62-64) 324

[64-66) 251

[66-68) 135

[68-70) 32

[70-72) 6

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• A partir del siguiente histograma que muestra las calificaciones de un examen de Estadística responda :

• ¿Cuántos estudiantes hicieron el examen?,

• ¿Cuál es la mínima calificación posible?

• ¿Cuál es la calificación más frecuente?

• ¿Cuál es el ancho de clase? • Y el número de clases?

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Polígono de frecuencia• Concepto: Gráfico que utiliza segmentos

lineales conectados a puntos que se localizan directamente por encima de los valores de la marca de clase.

• Las alturas de los puntos corresponden a la frecuencia de clase.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ojiva• Gráfica lineal que representa frecuencias acumuladas.

En el eje horizontal se muestran el límite superior de cada clase.

Temperatura FrecFrec

Acum%

Acum

[0 - 10) 0 0 0%

[10 - 20) 3 3 15%

[20 - 30) 6 9 45%

[30 – 40) 5 14 70%

[40-50) 4 18 90%

[50 – 60) 2 20 100%

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ojiva: Temperatura diaria

0

2

4

6

8

10

12

14

16

18

20

10 20 30 40 50 60

Límite de Clase

Fre

c. A

cum

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

% A

cum

.

a) ¿Cuántos dias se investigaron?

a) El 60% de los dias registraron temperaturas inferiores a ….

a) ¿Cuantos días se registraron temperaturas menores a 45° ?

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• A 40 estudiantes en la cafetería se les pidió que estimaran el número de horas que habían dedicado a estudiar en la semana anterior. El registro de respuestas aparece en la tabla. Construya la ojiva

Tiempo de estudio semanal en horas Frecuencia

10 y menos que 20 6

20 y menos que 30 11

30 y menos que 40 9

40 y menos que 50 7

50 y menos que 60 4

60 y menos que 70 2

70 y menos que 80 1

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Diagrama tallo hojas• Permite ver cómo se distribuyen y donde

están las concentraciones de datos.

• Se organiza los datos en grupos (llamados tallos), para que los valores dentro de cada grupo (las hojas) ramifiquen hacia la derecha de cada fila.

• Ej: 12,13,25,28,47, 48,49,49,65,66,1101 2 3

2 5 8

4 7 8 9 9

6 5 6

11 0

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Efectúe el diagrama de tallo hoja para los siguientes conjuntos de datos 21, 24, 24, 26, 27, 27, 30, 32, 38, 41

613, 632, 658, 717,722, 750, 776, 827,841, 859, 863, 891,894, 906, 928, 933,955, 982, 1034, 1047,1056, 1140, 1169, 1224

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Gráfico de Pareto• Es un gráfico de barras ordenadas para datos

cualitativos. Esta gráfica enfoca la atención a las categorías más importantes donde se cumpla el 80-20.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Gráficos de Pastel

• Presenta datos cualitativos como si fueran parte de un pastel.

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Diagramas de dispersión

• Gráficas de datos pareados (x,y).• El patrón de puntos puede indicarnos que existe

alguna relación entre las variables

0

50

100

150

200

250

300

350

0 50 100 150Variable A

Var

iabl

e B

0

20

40

60

80

100

120

140

160

0 50 100 150Variable A

Var

iabl

e B

Relación creciente o positiva

Relación decreciente o negativa

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

• No existe relación entre x y

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejemplo

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicio

• Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la tabla se describen el nº de errores que corresponden a los intentos realizados. Realice el diagrama de dispersión.

Número de

intentos

Número de errores

1 15

2 12

3 10

4 8

5 7

6 5

7 5

8 2

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Ejercicio

UN

IVE

RS

IDA

D T

EC

NO

GIC

A E

CO

TE

C. IS

O 9001:2008

Gráficas de serie de tiempo

• Se usa para estudiar patrones de las variables a través del tiempo .