Upload
edvin-muerte
View
57
Download
0
Embed Size (px)
Citation preview
1
Estadística
Introducción¿Qué es la estadística?Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha experimentado un gran desarrollo a lo largo de los últimos años.
Ejemplos de su aplicación son:
1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo.
2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.
2
Estadística
Introducción
Ejemplos de su aplicación son:
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa).
6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población.
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer predicciones sobre ellas.
3
Estadística
IntroducciónEtapas de un estudio estadístico
Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población.
2) Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación.
3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio.
4) Inferencia estadística: consiste en suponer un modelo para toda la población partiendo de los datos analizados para obtener conclusiones generales.
5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población
4
Estadística
IntroducciónEsquema de las etapas de un estudio estadístico
AREA DE INTERES DATOSDATOS
Tema de InvestigaciónTema de Investigación
-Antecedentes Previos Antecedentes Previos
-ObjetivosObjetivos
-Preguntas de InvestigaciónPreguntas de Investigación
-Posibles HipótesisPosibles Hipótesis
-Unidad de AnálisisUnidad de Análisis
-PoblaciónPoblación
-VariablesVariables
ORGANIZAR Y RESUMIRORGANIZAR Y RESUMIR
ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.)
INTERPRETACIÓN
INFERENCIA ESTADÍSTICAINFERENCIA ESTADÍSTICA
¿Población o Muestra?¿Población o Muestra?
CONCLUSIONES
Población Población
MuestraMuestra
ProbabilidadProbabilidadINFORMACIÓN
5
Estadística
IntroducciónEjemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada.
2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades.
3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda.
4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.
5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país.
6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.
7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.
6
• VARIABLE: VARIABLE: es lo que se va a medir y representa una característica de la es lo que se va a medir y representa una característica de la UNIDAD DE UNIDAD DE ANÁLISISANÁLISIS..
• ¿QUIÉNES VAN A SER MEDIDOS?: ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Los sujetos u objetos o Unidades de Análisis de una Población o una MuestraPoblación o una Muestra• POBLACIÓN :POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. Es el total de unidades de análisis que son tema de estudio.
Muestra: 60 trabajadores de empresas de comunicación
Unidad de análisis: Trabajador de empresa de comunicación
Variables: sexo, edad, salario, Nº de horas de trabajo, etc.
Población: Población:
““Las personas que Las personas que
trabajantrabajan en empresas de en empresas de
comunicacióncomunicación” ”
Estadística
• MUESTRA: MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.Es un conjunto de unidades de análisis provenientes de una población.
MuestraMuestra
Resumen de algunos conceptos planteados en la Introducción
7
TIPOS DE VARIABLESTIPOS DE VARIABLES
Variables CuantitativasVariables Cuantitativas
VariableVariable: : corresponde a la característica de la Unidad de Análisiscorresponde a la característica de la Unidad de Análisis
IntervaloIntervalo
DISCRETADISCRETA
Variables Variables CualitativasCualitativasCONTINUACONTINUA
Toma valores enteros Toma valores enteros
EjemplosEjemplos: : Número de HijosNúmero de Hijos, , Número de Número de empleados de una empresaempleados de una empresa, , Número de Número de
asignaturas aprobadas en un semestreasignaturas aprobadas en un semestre , etc., etc.
Toma cualquier valor dentro de un intervalo Toma cualquier valor dentro de un intervalo
EjemplosEjemplos: : Peso; Estatura; Temperatura, etc.Peso; Estatura; Temperatura, etc.
Unidad de MedidaUnidad de Medida: : GramosGramos o o KilosKilos para la variable Peso; Grados para la variable Peso; Grados CC o o F F para Temperatura para Temperatura
ORDINALORDINALNOMINALNOMINAL
Característica o cualidad Característica o cualidad cuyas categorías no tienen cuyas categorías no tienen un orden preestablecido. un orden preestablecido.
EjemplosEjemplos: : Sexo, Deporte Sexo, Deporte FavoritoFavorito, etc., etc.
Característica o cualidad cuyas Característica o cualidad cuyas categorías tienen un orden categorías tienen un orden
preestablecido. preestablecido.
EjemplosEjemplos: Calificación (S, N, A); : Calificación (S, N, A); Grado de Interés por un tema, etc.Grado de Interés por un tema, etc.
Estadística
8
FrecuenciaFrecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se : desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica.presenta una característica.
DISCRETADISCRETA
CONTINUACONTINUA
ORDINALORDINAL
NOMINALNOMINAL
TIPO FRECUENCIATIPO FRECUENCIAFrecuencia AbsolutaFrecuencia Absoluta
(F)(F)Frecuencia RelativaFrecuencia Relativa
(f)(f)
Frecuencia Absoluta Frecuencia Absoluta Acumulada (FAA)Acumulada (FAA)
Frecuencia Relativa Frecuencia Relativa Acumulada (fra)Acumulada (fra)
DISCRETADISCRETA
CONTINUACONTINUANOMINALNOMINAL
ORDINALORDINAL
Variable Variable CuantitativaCuantitativa
Variable Variable CualitativaCualitativa
Variable Variable CuantitativaCuantitativa
Variable Variable CualitativaCualitativa
Estadística
9
VariablesVariables- Tipo de Industria- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (: se clasifica en industria tipo A, B, C o D. (cualitativa nominalcualitativa nominal))- - Nº de EmpleadosNº de Empleados: se refiere al número de empleados en las líneas de producción. (: se refiere al número de empleados en las líneas de producción. (cuantitativa cuantitativa
discretadiscreta))- - SuperficieSuperficie: se refiere a los : se refiere a los metros cuadradosmetros cuadrados ( (unidad de medidaunidad de medida) disponibles para las áreas de ) disponibles para las áreas de
producción. (producción. (cuantitativa continuacuantitativa continua))- - CalificaciónCalificación: calificación realizada por una institución pública sobre cumplimiento de ciertos : calificación realizada por una institución pública sobre cumplimiento de ciertos
estándares (Muy Bien, Bien, Regular, Mal). (estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinalcualitativa ordinal))
Industria nº Tipo Nº Empleados Superficie Calificación
1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
299 D 250 800,3 Mal
300 C 300 4000,2 Regular
Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. de conserva en función de algunas características.
Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva
PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país
DatosDatos
EJEMPLOEJEMPLO
Estadística
10
EJEMPLOEJEMPLO
TABLAS DE TABLAS DE FRECUENCIAFRECUENCIA
Tipo deIndustria
FrecuenciaAbsoluta (Fj)
FrecuenciaRelativa (fj)
Porcentaje(%)
A
B
C
D
Total 300 1 100
CalificaciónFrec.
Absoluta (Fj)Frec.Relativa
(fj) o %Frec. Absol.
Acum. (FAAj)Frec. Relat.
Acum. (fraj) o %
Muy Bien
Bien
Regular
Mal 300 1 (o 100)
Total 300 1 (o 100)
Numero deEmpleados
Frec.Absoluta (Fj)
Frec.Relativa(fj) o %
Frec. Absol.Acum. (FAAj)
Frec. Relat.Acum. (fraj) o %
<100
[100-150[
.
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)Superficie
(mt2)Frec.
Absoluta (Fj)Frec.Relativa
(fj) o %Frec. Absol.
Acum. (FAAj)Frec. Relat.
Acum. (fraj) o %
<200
[200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%)
(1)(1)(2)(2)
(3)(3)
(4)(4)
Problema de InvestigaciónProblema de Investigación: Se quiere establecer el perfil de las industrias de conserva en : Se quiere establecer el perfil de las industrias de conserva en función de algunas características. función de algunas características.
Unidad de AnálisisUnidad de Análisis: Industria de Conserva: Industria de Conserva
PoblaciónPoblación: Industrias de Conservas del país: Industrias de Conservas del país
Estadística
11
Elementos de una tabla de frecuencia cuando la variable es continua (x)Elementos de una tabla de frecuencia cuando la variable es continua (x)
Intervalo Centro de clase Amplitud F f FAA fra
I1 c1 a1
I2 c2 a2 . .
Ik ck ak n 1
Total n 1
[LI1 ; LS1 [
[LI2 ; LS2 [
[LIk ; LSk]
aj = (LSj – LIj))cj = (LIj) + LSj )/2
Estadística
12
Ejercicio: confección de una tabla de frecuencia para una variable Ejercicio: confección de una tabla de frecuencia para una variable continuacontinua
10,5 10,7 9,5 10,5 11,8 11,2
12,0 10,3 13,5 12,3 10,6 9,8
10,7 11,5 11,1 10,6 9,3 12,9
10,4 7,5 10,2 8,7 10,9 9,9
11,7 10,3 10,6 10,5 11,9 11,0
13,9 10,6 10,0 10,8 10,6 -
7,3 8,0 8,5 12,5 9,7 -
Los datos corresponden a la edad de Los datos corresponden a la edad de los hijos de los trabajadores de una los hijos de los trabajadores de una
empresa empresa
7,3 9,7 10,4 10,6 11,1 12,3
7,5 9,8 10,5 10,6 11,2 12,5
8,0 9,9 10,5 10,7 11,5 12,9
8,5 10,0 10,5 10,7 11,7 13,5
8,7 10,2 10,6 10,8 11,8 13,9
9,3 10,3 10,6 10,9 11,9 -
9,5 10,3 10,6 11,0 12,0 -
Datos ordenados de menor a mayorDatos ordenados de menor a mayor
1)1) Construya un Diagrama de Tallo y HojaConstruya un Diagrama de Tallo y Hoja
2)2) ¿Cuál es la variable?; ¿Cuál es la Unidad de ¿Cuál es la variable?; ¿Cuál es la Unidad de análisis?; ¿Cuánto vale n?; ¿Cuál es el rango análisis?; ¿Cuánto vale n?; ¿Cuál es el rango de la variable?. de la variable?.
3)3) Sobre una Tabla de frecuenciaSobre una Tabla de frecuencia: ¿Cuántos : ¿Cuántos intervalos podría construir?; ¿Cuál es la intervalos podría construir?; ¿Cuál es la amplitud de cada intervalo?; ¿Cuántas amplitud de cada intervalo?; ¿Cuántas medidas de frecuencia puede obtener para medidas de frecuencia puede obtener para cada intervalo?.cada intervalo?.
4)4) Construir tabla de frecuenciaConstruir tabla de frecuencia para la para la variablevariable: Intervalos, centro de clase, : Intervalos, centro de clase, amplitud, frecuencias.amplitud, frecuencias.
Realice la siguiente actividadRealice la siguiente actividad
Diagrama de Tallo y Hoja: permite organizar los datos de una variable medida sobre un conjunto de individuos. Su utilidad viene dada cuando no contamos con herramientas automáticas para ordenar los datos.
Estadística
13
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
1. Gráfico de Sectores Circulares (de 1. Gráfico de Sectores Circulares (de Torta)Torta)
Distribución de las unidades de análisis de acuerdo a variable 1
A20%
D10%
C40%
B30%
Distribución de las unidades de análisis de acuerdo a variable 1
B30%
C40%
D10% A
20%
Distribución de las unidades de análisis de acuerdo a variable 1
B30%
C40%
D10%
A20%
Estadística
14
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
2. Gráfico de Barras2. Gráfico de Barras
Numero de unidades de análisis de acuerdo a variable 1
0
100
200
300
400
500
A B C D
variable 1
Nº
Porcentaje de unidad de análisis de acuerdo a variable 1
0 20 40 60 80 100
A
B
C
D
varia
ble
1
% unidad de análisis
-Este tipo de gráfico se utiliza generalmente para Este tipo de gráfico se utiliza generalmente para representar la frecuenciarepresentar la frecuencia de las categorías de una de las categorías de una variable cualitativavariable cualitativa. .
-Cuando una variable es cuantitativa se puede utilizar Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha este tipo de gráfico sólo si la variable se ha transformada en categorías.transformada en categorías.
-Hay distintas versiones de estos gráficos (por ejemplo Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos describir el comportamiento de una variable en distintos grupos.grupos.
Proporción de unidad de análisis de acuerdo a variable 1
0 0,2 0,4 0,6 0,8 1
A
B
C
D
varia
ble
1
Proporción de unidad de análisis
Estadística
15
HistogramaHistograma
- Permite la representación de - Permite la representación de la la frecuenciafrecuencia de una de una variable variable CuantitativaCuantitativa..
- El El ejeeje xx se refiere a la se refiere a la variable.variable.
- El El ejeeje yy se refiere a la se refiere a la frecuencia (Nº , %).frecuencia (Nº , %).
- Cada Cada barrabarra representa la representa la frecuencia de la variable en la frecuencia de la variable en la población en estudio (o la población en estudio (o la muestra). muestra).
-El histograma se puede El histograma se puede construir desde los datos de la construir desde los datos de la tabla de frecuencia de la tabla de frecuencia de la variable en estudio.variable en estudio.
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
3. Histograma3. Histograma
1413121110987
15
10
5
0
edad
Fre
cuen
cia
Nº
Nº
edadedad
HistogramaHistograma
Distribución de los hijos de trabajadores Distribución de los hijos de trabajadores de la empresa de acuerdo a edadde la empresa de acuerdo a edad
EjemploEjemplo
En el gráfico se puede observar el En el gráfico se puede observar el número de número de hijoshijos , de menor edad (7-8 años), las de mayor , de menor edad (7-8 años), las de mayor edad (13-14 años); y además que la mayoría de edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 hijos de los trabajadores están entre los 10 y 12
años.años.
Estadística
16
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
5. Polígono de Frecuencia5. Polígono de Frecuencia
edadedad
1413121110987
15
10
5
0
edad
Fre
cuen
cia
Nº
Nº
Distribución de los hijos de trabajadores Distribución de los hijos de trabajadores
de la empresade la empresa de acuerdo a edadde acuerdo a edad -Esta representación se basa en Esta representación se basa en el Histograma.el Histograma.
-Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..
-El El eje xeje x se refiere a la se refiere a la variable.variable.
- El El ejeeje yy se refiere a la se refiere a la frecuencia (Nº , %). frecuencia (Nº , %).
-Los puntos que permiten la Los puntos que permiten la unión de las líneas representa unión de las líneas representa el el centro de clase centro de clase (o marca de (o marca de clase)clase)..
Estadística
17
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
5. Diagrama de Caja5. Diagrama de Caja
- Permite identificar gráficamente la Permite identificar gráficamente la mediana, los cuartiles 1 y 3 mediana, los cuartiles 1 y 3 (percentiles 25 y 75), mínimo y (percentiles 25 y 75), mínimo y máximo de una variable. máximo de una variable.
- Sólo es útil para variables Sólo es útil para variables cuantitativascuantitativas..
-El El eje xeje x permite identificar la permite identificar la poblacion en estudio.poblacion en estudio.
- El El ejeeje yy representa los valores de la representa los valores de la variable en estudio. variable en estudio.
Estadística
1473584N =
HombresMujeres
Eda
d
100
90
80
70
60
50
40
30
20
10
0
Edad de las personas que se realizaron Edad de las personas que se realizaron angioplastía entre 1980 y 2000angioplastía entre 1980 y 2000
18
TIPOS DE TIPOS DE GRÁFICOSGRÁFICOS
6. Otros6. Otros
Número de alumnos matriculados en la Carrera A según año de ingreso
0
2040
6080
100
1998 1999 2000 2001 2002 2003
año de ingreso
Nº
de
alu
mn
os
Número de alumnos matriculados en la Carrera B según año de ingreso
020406080
100
1998 1999 2000 2001 2002 2003
año de ingreso
Nº
de
alu
mn
os
Número de alumnos matriculados en las Carreras según año de ingreso
0
50
100
150
200
1998 1999 2000 2001 2002 2003
año ingreso
Nº
de
alu
mno
s
Carrera B
Carrera A
año de ingreso Carrera A Carrera B1998 60 801999 55 702000 80 502001 40 602002 68 502003 70 75
Nº de alumnos
Estadística
19
OBSERVACIONESOBSERVACIONES
* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.
* El Gráfico debe contener un Título General y la identificación de cada eje * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia).(variable en estudio y frecuencia).
* En ocasiones resulta más ilustrativo un gráfico que una tabla de * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia.frecuencia.
* Al igual que las tablas, los gráficos deben ser auto-explicativos.* Al igual que las tablas, los gráficos deben ser auto-explicativos.
Variables Cuantitativas
variablex i individuo elen variablela devalor ixni ,...,1
nccccn
i
1
n
iin
n
ii xccxcxcx
11
1
bxabaxbaxbaxn
iin
n
ii
11
1
)()()(
221
1
2n
n
ii xxx
21
2
1
)()( n
n
ii xxx
)()()( 111
nn
n
iii yxyxyx
)()()( 111
nn
n
iii yxyxyx
variabley i individuo elen variablela devalor iy
NOTACIONNOTACION
constantes:,, cba
Estadística
20
MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL
-Media Aritmética (Promedio)Media Aritmética (Promedio)
-MedianaMediana
-ModaModa
n
xx
n
ii
1
Media Aritmética o PromedioMedia Aritmética o Promedio
MedianaMediana
)(EM kx
2M )1()(
E
kk xx
x
1x
2x
nx
Datos CuantitativosDatos Cuantitativos
x
)1(x
)2(x
)(nx
Datos Cuantitativos ordenados de menor a mayorDatos Cuantitativos ordenados de menor a mayor
Si Si nn es par es par
Si Si n n es impares impar
centro del dato)( kx
repite" se más que dato el"M o ModaModaDatos Datos
Cualitativos y CuantitativosCualitativos y Cuantitativos
Estadística
21
Percentiles, Deciles o CuartilesPercentiles, Deciles o Cuartiles
-Percentil (ejemplo: 25, 50, 75)Percentil (ejemplo: 25, 50, 75)
-Decil (ejemplo: 4, 5, 8)Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)Cuartil (ejemplo: 1, 2, 3)
El Decil va de 1 a 10El Decil va de 1 a 10
El Decil 4 (4/10)El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos: es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32. Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando losPercentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los nn datos están ordenados de datos están ordenados de MenorMenor a a MayorMayor
Estadística
El Percentil va de 1 a 100El Percentil va de 1 a 100
El percentil 25 (25/100)El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos: es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20. Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Cuartil va de 1 a 4El Cuartil va de 1 a 4
El Cuartil 3 (3/4)El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos: es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60. Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.
22
MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN
-RangoRango
-VarianzaVarianza
-Desviación EstándarDesviación Estándar
RangoRango
VarianzaVarianzax
1x
2x
nx
Datos CuantitativosDatos Cuantitativos
Coeficiente de VariaciónCoeficiente de VariaciónComparación entre VariablesComparación entre Variables
Se refiere al comportamiento de las variables cuantitativas en Se refiere al comportamiento de las variables cuantitativas en un grupo. un grupo. Por ejemplo: Si se tiene un conjunto de personas a las Por ejemplo: Si se tiene un conjunto de personas a las que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál
presenta mayor variación? presenta mayor variación?
)min()max( ii xxR
Desviación Típica o EstándarDesviación Típica o Estándar
2
1
21 1
22
1
2
2 1)(
1)(
xxnn
xn
x
n
xxs
n
ii
n
i
n
iii
n
ii
2ss
x
scv
Estadística
23
Estadística
Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría
-Kurtosis o ApuntamientoKurtosis o Apuntamiento
Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis.
Coeficiente de Asimetría 3
1
3)(
sn
xx
CA
n
ii
Si CA=0 si la distribución es simétrica alrededor de la media.Si CA<0 si la distribución es asimétrica a la izquierdaSi CA>0 si la distribución es asimétrica a la derecha
Coeficiente de Apuntamiento 4
1
4)(
sn
xx
CAp
n
ii
- Si CAp=0 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica.- Si CAp>0, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media).- Si CAp<0 la distribución es más plana y se llama platicúrtica.
24
Estadística
Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría
-Kurtosis o ApuntamientoKurtosis o Apuntamiento
Ejemplos Histogramas con distinta asimetría y apuntamiento
V2
7,06,05,04,03,02,01,0
14
12
10
8
6
4
2
0
Desv. típ. = 1,67
Media = 3,9
N = 30,00
V4
2,01,00,0-1,0
30
20
10
0
Desv. típ. = ,64
Media = 0,0
N = 30,00
V5
9,08,07,06,05,04,03,02,01,0
6
5
4
3
2
1
0
Desv. típ. = 2,42
Media = 5,2
N = 28,00
25
Estadística
Otras medidas o CoeficientesOtras medidas o Coeficientes-AsimetríaAsimetría
-Kurtosis o ApuntamientoKurtosis o Apuntamiento
Ejemplos
Media 3,9
Mediana 4
Moda 4
Desviación estándar 1,67
Varianza de la muestra 2,78
kurtosis -0,43
Coeficiente de asimetría -0,02
Rango 6
Mínimo 1
Máximo 7
Cuenta 30
V1
9,08,07,06,05,04,03,02,01,0
16
14
12
10
8
6
4
2
0
Desv. típ. = 1,77
Media = 5,4
N = 66,00
1 4 4
1 4 4
1 4 5
2 4 5
2 4 6
2 4 6
2 4 6
3 4 6
3 4 7
4 4 7
Datos Histograma Medidas descriptivas
26
Estadística
Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias)para datos Agrupados (tabla de frecuencias)
Intervalo Centro de clase Amplitud F f FAA fra
I1 c1 a1
I2 c2 a2 . .
Ik ck ak n 1
Total n 1
f1
f2
fk
n1
n2
nk
Tabla de frecuencia (para variable cuantitativa)Tabla de frecuencia (para variable cuantitativa)
1) La Media para datos agrupados es igual a la suma de los productos de las marcas de clase por sus frecuencias relativas, de la forma:
k
jjjcc fcxMedia
1
Sea cj la marca de clase (o centro de clase) y fj la frecuencia relativa de la clase j, donde j=1, 2,…, k.
2) La La Desviación típicaDesviación típica para datos para datos agrupados esta dada por:agrupados esta dada por:
k
jjcjc fxcs
1
2)(
3) El El Coeficiente de AsimetríaCoeficiente de Asimetría para para datos agrupados esta dado por:datos agrupados esta dado por:
3
1
3)(
c
k
jjcj
cs
fxc
CA
4) El El Coeficiente de apuntamientoCoeficiente de apuntamiento para para datos agrupados esta dada por:datos agrupados esta dada por:
4
1
4)(
c
k
jjcj
cs
fxc
CAp
27
Estadística
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Tabla 1 Actividad
Transporte Estudia Pensionado Trabaja
Autobus 5 7 0
Bicicleta 3 3 2
Caminar 2 5 2
Coche 5 4 5
Metro 6 7 4
Transporte Nº %
Autobus 12 20,0
Bicicleta 8 13,3
Caminar 9 15,0
Coche 14 23,3
Metro 17 28,3
TOTAL 60 100
Actividad Nº %
Estudia 21 35,0
Pensionado 26 43,3
Trabaja 13 21,7
TOTAL 60 100
ProblemaInteresa estudiar cual es el principal medio de transporte preferido por un grupo de personas a la hora de dirigirse al centro comercial.
Para esto se consultó a cada Para esto se consultó a cada persona sobre la actividad a persona sobre la actividad a la que se dedicaba y el medio la que se dedicaba y el medio de transporte preferido.de transporte preferido.
28
Estadística
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Nº de personasNº de personas
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
Tabla 2 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60
29
Estadística
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Nº de personas y % respecto de tipo de Transporte Nº de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100
30
Estadística
Descripción de 2 variables cualitativasDescripción de 2 variables cualitativas
Distribución conjuntaDistribución conjunta
Nº de personas y % respecto de tipo de ActividadNº de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100
31
MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL- Covarianza Covarianza
- CorrelaciónCorrelación
x
1x
2x
nx
DatosDatos
CuantitativosCuantitativos
Covarianza: Covarianza:
Recordemos que:Recordemos que: Hasta ahora hemos estudiado las Hasta ahora hemos estudiado las medidas tendencia medidas tendencia central central (Media, Mediana, Moda) (Media, Mediana, Moda) y dispersióny dispersión (Varianza y Desviación Estándar) para (Varianza y Desviación Estándar) para unauna Variable Cuantitativa Variable Cuantitativa (x).(x).
Es una medida de Variabilidad Conjunta entre Es una medida de Variabilidad Conjunta entre dosdos variables ( variables (xx11 ,, x x22) o bien () o bien (xx , , yy))
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
Si Cov(x,y) es positivaSi Cov(x,y) es positiva: : la asociación entre la asociación entre x x e e yy es directamente proporcional, es directamente proporcional, es decir que cuando es decir que cuando x x aumenta aumenta yy también aumenta; y viceversa. también aumenta; y viceversa.
Si Cov(x,y) es negativaSi Cov(x,y) es negativa: : la asociación entre la asociación entre x x e e y y es inversamente es inversamente proporcional, es decir que cuando proporcional, es decir que cuando xx aumenta aumenta yy disminuye; y viceversa. disminuye; y viceversa.
Si Cov(x,y) es ceroSi Cov(x,y) es cero: : no existe asociación entreno existe asociación entre x x e e yy..
n
iii )yy)(xx(
n)y,xcov(
1
1
Estadística
32
MEDIDAS DE ASOCIACIÓN LINEALMEDIDAS DE ASOCIACIÓN LINEAL- Covarianza Covarianza
- CorrelaciónCorrelación
DatosDatos
CuantitativosCuantitativos
Coeficiente de Correlación de Pearson (Coeficiente de Correlación de Pearson (rr): ): Mide el grado de Asociación Lineal Mide el grado de Asociación Lineal entre dos variables Cuantitativasentre dos variables Cuantitativas
Se refiere al grado de asociación entre Se refiere al grado de asociación entre dosdos variables ( variables (xx11 ,, x x22) o bien () o bien (xx , , yy))
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
Si Si rr es positivo es positivo: : la asociación entre la asociación entre x x e e yy es directamente proporcional, es decir que es directamente proporcional, es decir que cuando cuando x x aumenta aumenta yy también aumenta; y viceversa. también aumenta; y viceversa. Si Si rr=1=1: : la asociación lineal es la asociación lineal es perfecta.perfecta.
Si Si rr es negativo es negativo: : la asociación entre la asociación entre x x e e y y es inversamente proporcional, es decir es inversamente proporcional, es decir que cuando que cuando xx aumenta aumenta yy disminuye; y viceversa. disminuye; y viceversa. Si Si rr=-1=-1: : la asociación lineal es la asociación lineal es perfecta.perfecta.
Si Si rr es cero es cero: : no existe asociación entreno existe asociación entre x x e e yy..
CorrelaciónCorrelación: :
11 ryxss
)y,xcov(r
yx
n
iii
ss)n(
yxnyx
r1
1
Estadística
33
r=1 r=-1
EJEMPLO : Representación gráfica de las variables x e yEJEMPLO : Representación gráfica de las variables x e y
Estadística
34
Objetivo 2Estudiar si los valores de una
variable pueden ser utilizados para predecir el valor de la otra
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
Datos CuantitativosDatos Cuantitativos
Determinar si existe relación entre las variables x e y:
Coeficiente de Correlación
Objetivo 1Determinar si dos variables están Determinar si dos variables están asociadas y en qué sentido se da asociadas y en qué sentido se da
la asociaciónla asociación..
Estudiar la dependencia de una variable respecto de la otra:
Modelo de RegresiónModelo de Regresión
TérminosVariable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)Error (residuo)
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
Estadística
35
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
Datos CuantitativosDatos Cuantitativos
NotaciónVariable Respuesta: y
Variable Explicativa: x
Modelo de Regresión Lineal Simple: yi=+xi+ei
Intercepto: Pendiente:
Error: e
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
Modelo Estimado(recta de regresión)
bxay ˆ
xbya
2
11
2
111
n
ii
n
i
n
ii
n
ii
n
i
xxn
yxxynb
Método de Estimación: Mínimos CuadradosMínimos Cuadrados
iii yye ˆResiduos o Errores
Estadística
36
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
DATOSDATOS
MODELO DE REGRESIÓN LINEAL SIMPLE yi=+xi+ei
x y
)1(x )(y1
)2(x )(y2
)(nx )n(y
MODELO ESTIMADO
bxay ˆ
xbya
2
11
2
111
n
ii
n
i
n
ii
n
ii
n
i
xxn
yxxynb
ESTIMADORES
iii yye ˆ
ERRORES
Estadística
37
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
niño edad (meses) talla (cm) i xi yi
1 3 55 2 6 68 3 5 64 4 5 66 5 3 62 6 4 65 7 9 74 8 8 75 9 9 73
10 7 69 11 6 73 12 5 68 13 8 73 14 6 71
y=talla / x=edad / n=14
95614
1
i
iy 3,68y 6,5ys
8414
1
i
ix 6x 2xs
07,9),cov( yx 88,0xyr
586314
1
i
iiyx 55614
1
2 i
ix
Estadística
38
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
M o d e l o E s t i m a d o bxay ˆ
44,2b 64,53a
xy 44,264,53ˆ
Interpretación de los resultados
- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en una unidad la talla se incrementa en 2,44 cm.
Estadística
39
REGRESION LINEAL SIMPLEREGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
De acuerdo al coeficiente de determinación, el modelo ajustado a los datos es adecuado (R2 cercano a 1)
Bondad de Ajuste del Modelo R2 = 0,77
niño edad (meses) talla (cm) Talla estimada error
i xi yi iy ie 1 3 55 61,0 -6,0 2 6 68 68,3 -0,3 3 5 64 65,8 -1,8 4 5 66 65,8 0,2 5 3 62 61,0 1,0 6 4 65 63,4 1,6 7 9 74 75,6 -1,6 8 8 75 73,2 1,8 9 9 73 75,6 -2,6 10 7 69 70,7 -1,7 11 6 73 68,3 4,7 12 5 68 65,8 2,2 13 8 73 73,2 -0,2 14 6 71 68,3 2,7
86,402)(14
1
2 i
ii yy
7,92)ˆ(14
1
214
1
2
i
ii
ii eyy
Estadística