Upload
khangminh22
View
1
Download
0
Embed Size (px)
Citation preview
1
ESTADÍSTICA DESCRIPTIVA
Y PROBABILIDADES Notas de clase
FACULTAD DE INGENIERIA
2015 - III
PROFESOR: SANTANA FLORES CARLOS Correo: [email protected]
ALUMNO:
2
ESTADÍSTICA
La estadística es una ciencia, con su propio campo de estudio, y también un instrumento (conjunto
de técnicas) que utilizan ampliamente otras ciencias. La estadística como ciencia es una rama de la
matemática aplicada, cuyo objeto de estudio es el comportamiento de las variables que pueden
asociarse a una o más poblaciones.
La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea
para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún
fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo
estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso
relacionado con la investigación científica.
Estadística descriptiva
Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de
estudio. Los datos pueden ser resumidos numérica o gráficamente
Estadística inferencial
Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en
cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en
los datos y extraer inferencias acerca de la población bajo estudio.
VARIABLES
Una variable es una característica observable que varía entre los diferentes individuos de la
población, dicha característica debe ser susceptible de ser medido. La información que disponemos
de cada individuo es resumida en variables.
Ejemplos:
Peso corporal
Condición económica
Tiempo de espera
Utilidades de una empresa
………………………………………………………….. …………………………………………………………..
TIPOS DE VARIABLE
Variable cualitativa o categórica.
Cuando la variable está asociada a una característica cualitativa o atributo. Es decir, son variables
cuyos valores son cualidades. Dependiendo del número de categorías pueden ser dicotómicas o
politómicas.
Ejemplos:
Condición económica
Marca de auto
…………………………………………
3 …………………………………………
Dicotómica: Es aquella variable que solo puede adoptar dos atributos o características.
Ejemplos:
Resultado de un encuentro de vóley
……………………………………………………….
Politómica: Es aquella variable que solo puede adopta más de dos atributos o características.
Ejemplos:
Estado civil
………………………………………………………..
Variable cuantitativa o numérica
Cuando la variable está asociada a una característica cuantitativa. Es decir, estas surgen cuando se
puede establecer cuánto o qué cantidad posee una determinada característica. Pueden ser discretas
o continuas.
Ejemplo:
Peso corporal.
Gasto por consumo de energía eléctrica.
……………………………………………………………. …………………………………………………………….
Discreta: En este caso la variable solo adopta valores enteros.
Ejemplos:
Número de televisores en casa
……………………………………………………………. …………………………………………………………….
Continua: En este caso la variable toma cualquier valor real, no necesariamente entero.
Ejemplos:
Estaturas
…………………………………………………………... …………………………………………………………….
MEDICIÓN
Es asignar un número o símbolo a objetos o sucesos de acuerdo a reglas predeterminadas.
ESCALA DE MEDICIÓN
Es el grado de precisión como se expresa la medida de la variable.
4 Nominal
Son aquellas que establecen la distinción de los elementos en las categorías sin implicar orden entre
ellas.
Ejemplo:
Sexo: Mujer – Hombre.
Servicios Hospitalarios: Medicina - Pediatría – Neurología.
…………………………………………………………………………………………..
Ordinal
Son aquellas que agrupan a los objetos, individuos, en categorías ordenadas, para establecer
relaciones comparativas. Es decir, son susceptibles de ordenación pero no de medición cuantitativa.
Ejemplo:
Nivel educativo: Primaria – Secundaria – Técnico - Universitario
Estado de salud: Muy saludable – Saludable - No saludable
…………………………………………………………………………………………….
Intervalar
Se tiene una escala intervalar, cuando los valores asignados a las unidades estadísticas no solo
permiten ordenarlas sino que además, las diferencias iguales entre estos indican diferencias iguales
en las cuantías de las propiedades a medir. El inicio de la escala (0) es arbitraria, convencional.
Ejemplo:
Temperatura
Razón
Se tiene una escala razón, cuando los valores asignados a las unidades estadísticas no solo permiten
que estas puedan ser ordenadas, sino que además, las diferencias iguales entre estos indican
diferencias reales en las cuantías de las propiedades a medir. El valor cero representa ausencia de la
característica que se mide.
Ejemplo:
Edad
5 Peso
POBLACIÓN
Es un conjunto de datos que consta de todas las observaciones concebibles (o hipotéticamente)
posibles de un fenómeno determinado.
MUESTRA
Es un subconjunto de individuos extraídos de la población con el fin de inferir mediante su estudio,
características de la población.
PARÁMETRO
Son todas aquellas medidas que describen numéricamente las características de una población.
También se les denomina valor verdadero, ya que una característica poblacional tendrá un solo valor
del parámetro. Sin embargo una población puede tener varias características y, por tanto, varios
parámetros.
ESTADÍGRAFOS
Es aquella descripción numérica de una característica correspondiente a los elementos de una
muestra. De una población se pueden obtener M números de muestra posibles y en cada una de
ellas se puede cuantificar la característica, obteniéndose por lo general, valores diferentes para cada
muestra.
6 EJERCICIOS
Clasifique las siguientes variables y señale su escala de medición:
Variable Tipo de variable Escala
Número de solicitantes que llega a diario a una agencia de empleos.
Software estadístico.
Bancos comerciales.
Tiempo cronometrado en los 100 metros planos.
Velocidad de un automóvil.
Empresas según el número de trabajadores.
Nivel socioeconómico.
Partidos políticos.
Producto bruto interno del Perú.
Número de asistentes a clase.
Países de la Unión Europea.
Puntuación de un test de coeficiente intelectual.
7
ORGANIZACIÓN TABULAR DE DATOS Y GRÁFICOS
Frente a un conjunto de datos, el primer paso a dar, debe ser expresarlo y clasificarlo de acuerdos a
criterios convenientes, de una forma simple que permita ver rápidamente todas las características
posibles para obtener conclusiones útiles, ya sea directamente o por medio de cálculos posteriores.
Se consideran los siguientes pasos:
Revisión y recolección de los datos.
Construcción de tablas de frecuencias.
Representación tabular o cuadros estadísticos y gráfica.
REVISIÓN Y RECOLECCIÓN DE LOS DATOS
Ningún análisis estadístico, por acabado y seguro que sea, es capaz de suministrar respuestas
adecuadas a un problema de estudio, si aquel se basa en información incorrecta. Por tanto antes de
utilizar los datos muestrales conviene aplicar técnicas simples para probarlos, como dar respuesta a
las siguientes preguntas:
¿Los datos apoyan o contradicen la evidencia que se tenía?
¿Es lógica la conclusión?
¿Hemos obtenido conclusiones que no estén sustentadas por los datos?
¿Cuántas observaciones se tiene?
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
Si los datos que se disponen son numerosos, es indispensable clasificarlos en un cuadro o tabla
resumen de las observaciones originales, a las que en adelante llamaremos tabla de distribución de
frecuencias.
yi ni Ni hi Hi hi% Hi%
Y1 n1 N1 h1 H1 h1% H1%
y2 n2 N2 h2 H2 h2% H2%
y3 n3 N3 h3 H3 h3% H3%
y4 n4 N4 h4 H4 h4% H4%
. . . . . . .
. . . . . . .
. . . . . . .
ym nm Nm hm Hm hm% Hm%
8 Donde:
yi: representa los valores de la variable o el valor asignado a algún atributo de la variable
(caso de variables cualitativas).
ni: frecuencia absoluta del valor yi, representa el número de veces que aparece este valor en
el conjunto de observaciones.
Ni: Frecuencia absoluta acumulada, representa el número de observaciones menores o
iguales a yi.
hi: frecuencia relativa del valor de yi, es el cociente de la frecuencia absoluta de yi y el
número total de observaciones.
Hi: frecuencia relativa acumulada, es la frecuencia relativa total de las observaciones
menores o iguales a yi.
hi%: frecuencia relativa porcentual, es decir hi multiplicado por 100%; nos permite observar
la frecuencia absoluta en forma porcentual respecto del total.
Hi%: frecuencia relativa acumulada porcentual, es decir Hi multiplicado por 100%.
CUADROS ESTADÍSTICOS Y GRÁFICOS
Cuadro estadístico.- Es un arreglo ordenado, de filas y columnas de los datos o series estadísticas,
por tanto tienen dos entradas. En ellas pueden representarse características cualitativas,
cuantitativas o una combinación de ambas. La finalidad es ofrecer información resumida de fácil
lectura, comparación e interpretación.
Gráfico.- Es la representación de un fenómeno estadístico por medio de figuras geométricas cuyas
dimensiones son proporcionales a la magnitud de los datos representados. Su objetivo es la
representación de los datos de forma gráfica, que permite de un solo golpe de vista darse cuenta del
conjunto de elementos presentados y de evidenciar sus variaciones y características.
9
ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS ASOCIADAS A VARIABLES CUALITATIVAS
En el caso de las variables cualitativas se pueden dar dos tipos de tratamiento según la complejidad
de los datos.
En el caso que sólo se tenga el valor de la característica de la variables
Ejemplo:
Se tiene información acerca de la composición de cartera de créditos (en millones de soles) del
Sistema Financiero Peruano para el año 2010.
CONSUMO 25300
CORPORATIVOS 23364
MEDIANAS EMPRESAS 21428
GRANDES EMPRESAS 21170
HIPOTECARIOS 16006
PEQUEÑAS EMPRESAS 13941
MICROEMPRESAS 7874
Si se quiere obtener una información más detallada que la que se muestra en la tabla, podemos
representar esos valores en forma porcentual. Primero, obtengamos el total
CONSUMO 25300
CORPORATIVOS 23364
MEDIANAS EMPRESAS 21428
GRANDES EMPRESAS 21170
HIPOTECARIOS 16006
PEQUEÑAS EMPRESAS 13941
MICROEMPRESAS 7874
TOTAL 129083
10 Luego, obtenemos el valor del hi, este se obtiene dividiendo cada valor entre el total. Una vez
calculado el hi multiplicamos por 100% (hi%), el resultado representará el porcentaje respecto al
total.
Ahora la tabla se puede presentar de la siguiente manera
Interpretaciones:
El 19,6% de los créditos otorgados van a los créditos por consumo.
El 16,4% de los créditos otorgados van destinados a las grandes empresas.
Solo el 6,1% de los créditos son asignadas a las microempresas.
NOTA: En el ejemplo se está trabajando con valores no con frecuencias.
Para una mejor ilustración de los datos se puede realizar un gráfico.
GRÁFICO DE SECTORES O DE PASTEL
Para construir el gráfico de sectores se utiliza una circunferencia, cuyo círculo se divide en sectores,
tales que sus medidas de los ángulos centrales, y por tanto la superficie del sector circular, sean
proporcionales a las magnitudes de los valores de la variable que representan. Al total le
corresponde el círculo completo, es decir los 360º de la circunferencia.