10
1 ESTADÍSTICA DESCRIPTIVA Y PROBABILIDADES Notas de clase FACULTAD DE INGENIERIA 2015 - III PROFESOR: SANTANA FLORES CARLOS Correo: [email protected] ALUMNO:

estadística descriptiva y probabilidades - baixardoc

Embed Size (px)

Citation preview

1

ESTADÍSTICA DESCRIPTIVA

Y PROBABILIDADES Notas de clase

FACULTAD DE INGENIERIA

2015 - III

PROFESOR: SANTANA FLORES CARLOS Correo: [email protected]

ALUMNO:

2

ESTADÍSTICA

La estadística es una ciencia, con su propio campo de estudio, y también un instrumento (conjunto

de técnicas) que utilizan ampliamente otras ciencias. La estadística como ciencia es una rama de la

matemática aplicada, cuyo objeto de estudio es el comportamiento de las variables que pueden

asociarse a una o más poblaciones.

La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea

para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún

fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo

estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso

relacionado con la investigación científica.

Estadística descriptiva

Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de

estudio. Los datos pueden ser resumidos numérica o gráficamente

Estadística inferencial

Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en

cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en

los datos y extraer inferencias acerca de la población bajo estudio.

VARIABLES

Una variable es una característica observable que varía entre los diferentes individuos de la

población, dicha característica debe ser susceptible de ser medido. La información que disponemos

de cada individuo es resumida en variables.

Ejemplos:

Peso corporal

Condición económica

Tiempo de espera

Utilidades de una empresa

………………………………………………………….. …………………………………………………………..

TIPOS DE VARIABLE

Variable cualitativa o categórica.

Cuando la variable está asociada a una característica cualitativa o atributo. Es decir, son variables

cuyos valores son cualidades. Dependiendo del número de categorías pueden ser dicotómicas o

politómicas.

Ejemplos:

Condición económica

Marca de auto

…………………………………………

3 …………………………………………

Dicotómica: Es aquella variable que solo puede adoptar dos atributos o características.

Ejemplos:

Resultado de un encuentro de vóley

……………………………………………………….

Politómica: Es aquella variable que solo puede adopta más de dos atributos o características.

Ejemplos:

Estado civil

………………………………………………………..

Variable cuantitativa o numérica

Cuando la variable está asociada a una característica cuantitativa. Es decir, estas surgen cuando se

puede establecer cuánto o qué cantidad posee una determinada característica. Pueden ser discretas

o continuas.

Ejemplo:

Peso corporal.

Gasto por consumo de energía eléctrica.

……………………………………………………………. …………………………………………………………….

Discreta: En este caso la variable solo adopta valores enteros.

Ejemplos:

Número de televisores en casa

……………………………………………………………. …………………………………………………………….

Continua: En este caso la variable toma cualquier valor real, no necesariamente entero.

Ejemplos:

Estaturas

…………………………………………………………... …………………………………………………………….

MEDICIÓN

Es asignar un número o símbolo a objetos o sucesos de acuerdo a reglas predeterminadas.

ESCALA DE MEDICIÓN

Es el grado de precisión como se expresa la medida de la variable.

4 Nominal

Son aquellas que establecen la distinción de los elementos en las categorías sin implicar orden entre

ellas.

Ejemplo:

Sexo: Mujer – Hombre.

Servicios Hospitalarios: Medicina - Pediatría – Neurología.

…………………………………………………………………………………………..

Ordinal

Son aquellas que agrupan a los objetos, individuos, en categorías ordenadas, para establecer

relaciones comparativas. Es decir, son susceptibles de ordenación pero no de medición cuantitativa.

Ejemplo:

Nivel educativo: Primaria – Secundaria – Técnico - Universitario

Estado de salud: Muy saludable – Saludable - No saludable

…………………………………………………………………………………………….

Intervalar

Se tiene una escala intervalar, cuando los valores asignados a las unidades estadísticas no solo

permiten ordenarlas sino que además, las diferencias iguales entre estos indican diferencias iguales

en las cuantías de las propiedades a medir. El inicio de la escala (0) es arbitraria, convencional.

Ejemplo:

Temperatura

Razón

Se tiene una escala razón, cuando los valores asignados a las unidades estadísticas no solo permiten

que estas puedan ser ordenadas, sino que además, las diferencias iguales entre estos indican

diferencias reales en las cuantías de las propiedades a medir. El valor cero representa ausencia de la

característica que se mide.

Ejemplo:

Edad

5 Peso

POBLACIÓN

Es un conjunto de datos que consta de todas las observaciones concebibles (o hipotéticamente)

posibles de un fenómeno determinado.

MUESTRA

Es un subconjunto de individuos extraídos de la población con el fin de inferir mediante su estudio,

características de la población.

PARÁMETRO

Son todas aquellas medidas que describen numéricamente las características de una población.

También se les denomina valor verdadero, ya que una característica poblacional tendrá un solo valor

del parámetro. Sin embargo una población puede tener varias características y, por tanto, varios

parámetros.

ESTADÍGRAFOS

Es aquella descripción numérica de una característica correspondiente a los elementos de una

muestra. De una población se pueden obtener M números de muestra posibles y en cada una de

ellas se puede cuantificar la característica, obteniéndose por lo general, valores diferentes para cada

muestra.

6 EJERCICIOS

Clasifique las siguientes variables y señale su escala de medición:

Variable Tipo de variable Escala

Número de solicitantes que llega a diario a una agencia de empleos.

Software estadístico.

Bancos comerciales.

Tiempo cronometrado en los 100 metros planos.

Velocidad de un automóvil.

Empresas según el número de trabajadores.

Nivel socioeconómico.

Partidos políticos.

Producto bruto interno del Perú.

Número de asistentes a clase.

Países de la Unión Europea.

Puntuación de un test de coeficiente intelectual.

7

ORGANIZACIÓN TABULAR DE DATOS Y GRÁFICOS

Frente a un conjunto de datos, el primer paso a dar, debe ser expresarlo y clasificarlo de acuerdos a

criterios convenientes, de una forma simple que permita ver rápidamente todas las características

posibles para obtener conclusiones útiles, ya sea directamente o por medio de cálculos posteriores.

Se consideran los siguientes pasos:

Revisión y recolección de los datos.

Construcción de tablas de frecuencias.

Representación tabular o cuadros estadísticos y gráfica.

REVISIÓN Y RECOLECCIÓN DE LOS DATOS

Ningún análisis estadístico, por acabado y seguro que sea, es capaz de suministrar respuestas

adecuadas a un problema de estudio, si aquel se basa en información incorrecta. Por tanto antes de

utilizar los datos muestrales conviene aplicar técnicas simples para probarlos, como dar respuesta a

las siguientes preguntas:

¿Los datos apoyan o contradicen la evidencia que se tenía?

¿Es lógica la conclusión?

¿Hemos obtenido conclusiones que no estén sustentadas por los datos?

¿Cuántas observaciones se tiene?

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

Si los datos que se disponen son numerosos, es indispensable clasificarlos en un cuadro o tabla

resumen de las observaciones originales, a las que en adelante llamaremos tabla de distribución de

frecuencias.

yi ni Ni hi Hi hi% Hi%

Y1 n1 N1 h1 H1 h1% H1%

y2 n2 N2 h2 H2 h2% H2%

y3 n3 N3 h3 H3 h3% H3%

y4 n4 N4 h4 H4 h4% H4%

. . . . . . .

. . . . . . .

. . . . . . .

ym nm Nm hm Hm hm% Hm%

8 Donde:

yi: representa los valores de la variable o el valor asignado a algún atributo de la variable

(caso de variables cualitativas).

ni: frecuencia absoluta del valor yi, representa el número de veces que aparece este valor en

el conjunto de observaciones.

Ni: Frecuencia absoluta acumulada, representa el número de observaciones menores o

iguales a yi.

hi: frecuencia relativa del valor de yi, es el cociente de la frecuencia absoluta de yi y el

número total de observaciones.

Hi: frecuencia relativa acumulada, es la frecuencia relativa total de las observaciones

menores o iguales a yi.

hi%: frecuencia relativa porcentual, es decir hi multiplicado por 100%; nos permite observar

la frecuencia absoluta en forma porcentual respecto del total.

Hi%: frecuencia relativa acumulada porcentual, es decir Hi multiplicado por 100%.

CUADROS ESTADÍSTICOS Y GRÁFICOS

Cuadro estadístico.- Es un arreglo ordenado, de filas y columnas de los datos o series estadísticas,

por tanto tienen dos entradas. En ellas pueden representarse características cualitativas,

cuantitativas o una combinación de ambas. La finalidad es ofrecer información resumida de fácil

lectura, comparación e interpretación.

Gráfico.- Es la representación de un fenómeno estadístico por medio de figuras geométricas cuyas

dimensiones son proporcionales a la magnitud de los datos representados. Su objetivo es la

representación de los datos de forma gráfica, que permite de un solo golpe de vista darse cuenta del

conjunto de elementos presentados y de evidenciar sus variaciones y características.

9

ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS ASOCIADAS A VARIABLES CUALITATIVAS

En el caso de las variables cualitativas se pueden dar dos tipos de tratamiento según la complejidad

de los datos.

En el caso que sólo se tenga el valor de la característica de la variables

Ejemplo:

Se tiene información acerca de la composición de cartera de créditos (en millones de soles) del

Sistema Financiero Peruano para el año 2010.

CONSUMO 25300

CORPORATIVOS 23364

MEDIANAS EMPRESAS 21428

GRANDES EMPRESAS 21170

HIPOTECARIOS 16006

PEQUEÑAS EMPRESAS 13941

MICROEMPRESAS 7874

Si se quiere obtener una información más detallada que la que se muestra en la tabla, podemos

representar esos valores en forma porcentual. Primero, obtengamos el total

CONSUMO 25300

CORPORATIVOS 23364

MEDIANAS EMPRESAS 21428

GRANDES EMPRESAS 21170

HIPOTECARIOS 16006

PEQUEÑAS EMPRESAS 13941

MICROEMPRESAS 7874

TOTAL 129083

10 Luego, obtenemos el valor del hi, este se obtiene dividiendo cada valor entre el total. Una vez

calculado el hi multiplicamos por 100% (hi%), el resultado representará el porcentaje respecto al

total.

Ahora la tabla se puede presentar de la siguiente manera

Interpretaciones:

El 19,6% de los créditos otorgados van a los créditos por consumo.

El 16,4% de los créditos otorgados van destinados a las grandes empresas.

Solo el 6,1% de los créditos son asignadas a las microempresas.

NOTA: En el ejemplo se está trabajando con valores no con frecuencias.

Para una mejor ilustración de los datos se puede realizar un gráfico.

GRÁFICO DE SECTORES O DE PASTEL

Para construir el gráfico de sectores se utiliza una circunferencia, cuyo círculo se divide en sectores,

tales que sus medidas de los ángulos centrales, y por tanto la superficie del sector circular, sean

proporcionales a las magnitudes de los valores de la variable que representan. Al total le

corresponde el círculo completo, es decir los 360º de la circunferencia.