20
ESTADISTICA

Estadística conceptos

Embed Size (px)

DESCRIPTION

Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc., no nos aborde diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc.

Citation preview

Page 1: Estadística conceptos

ESTADISTICA

UNIVERSIDAD FRANSISCO DE PAULA SANTANDERFACULTAD DE INGENIERIAS

OCAÑA2012

Page 2: Estadística conceptos

ESTADISTICA

DOC. ERASMO MENESES VILLAMIZAR

UNIVERSIDAD FRANSISCO DE PAULA SANTANDERFACULTAD DE INGENIERIAS

OCAÑA2012

Page 3: Estadística conceptos

¿QUÉ ES LA ESTADÍSTICA?

Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc., no nos aborde diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc.

Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes determinadas. Podríamos, desde un punto de vista más amplio, definir la estadística como la ciencia que se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. 

Podríamos por tanto clasificar la Estadística en descriptiva, cuando los resultados del análisis no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos más amplio.

CLASES DE ESTADISTICA

Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenido en ellos.

Estadística inferencial: Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. 

DEFINICIÓN DE VARIABLE

Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población.

Page 4: Estadística conceptos

TIPOS DE VARIABLE ESTADÍSTICAS

Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:

Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo:

-El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden. Por ejemplo:

-La nota en un examen: suspenso, aprobado, notable, sobresaliente.

-Puesto conseguido en una prueba deportiva: 1º, 2º, 3º

-Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta

Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo:

-El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Page 5: Estadística conceptos

Variable continúa

Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo:

-La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

-En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

IMPORTANCIA DE LA ESTADISTICA

La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilados a partir de otros datos numéricos.

Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de la muestra.

La importancia que tiene está relacionada con el área o áreas en las que se puede aplicar, debido a que está presente en todas las áreas del saber

La estadística es una ciencia de aplicación práctica casi universal en todos los campos científicos.

* En las ciencias naturales: se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos.

* En las ciencias sociales y económicas: es un pilar básico del desarrollo de la demografía y la sociología aplicada.

* En economía: suministra los valores que ayudan a descubrir interrelaciones entre múltiples parámetros macro y microeconómicos.

* En las ciencias médicas: permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los índices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etcétera.

Page 6: Estadística conceptos

VARIABLES RELACIONADAS CON LA INGENIERIA CIVIL

Las variables en Ingeniería Civil pueden ser: los cambios de lugares de trabajos, de materiales de construcción, de cuerpo de ingenieros. Un ejemplo de esto sería que se cambiara al cuerpo de Ingenieros lo cual afectaría a la obra porque no se sabría cómo se estuvo llevando a cabo el proceso o como puede que beneficie a un mejor rendimiento en la construcción.

 ¿PORQUÉ ES IMPORTANTE LA CARRERA DE INGENIERIA CIVIL EN ESTE METODO ESTADISTICO?

De acuerdo a los conocimientos obtenidos de estadística, LAS MEDIDAS DE TENDENCIA CENTRAL realizan un trabajo muy importante en la INGENIERÍA CIVIL, ya que mediante el análisis estadístico podemos definir los fenómenos de estudio de una manera más sutil o exacta.

Este método desempeña un papel muy importante en casi todas las áreas del quehacer humano, usando datos de situaciones reales que sirven para explicar o ampliar alguna teoría, obteniendo conclusiones validas y tomando decisiones razonables con bases en estos análisis. Este método lo podemos definir como esencial para el desarrollo de proyectos para la INGENIERÍA CIVIL.Los resultados de estos estudios se utilizan para determinar las deficiencias específicas, identificando los problemas se desarrollaran medidas alternativas. De manera natural la selección de contramedidas se debe hacer muy cuidadosamente por el Ingeniero civil.

HISTORIA DE LA ESTADISTICA

Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque.

Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el 594 a.C. para cobrar impuestos.

El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su

Page 7: Estadística conceptos

control. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa.

Los reyes carolingios Pipino, el Breve, y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book.

El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad.

En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales.

En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información.

El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.

CAMPOS DE APLICACIÓN DE LA ESTADÍSTICA

a) Contabilidad

b) Finanzas

c) Mercadotecnia

d) Producción

e) Economía

f) Educación

g) Psicología

Page 8: Estadística conceptos

h) Ingeniería

i) Control estadístico de procesos y la calidad

j) Administración

k) Recursos Humanos

l) Valuación

Casos de Negocios

En todos los casos, la empresa u organización necesita apoyo estadístico para analizar su base de datos con el fin de ganar más dinero, tomar mejores decisiones o sencillamente llegar al siguiente año fiscal.

Se deben tomar muy en cuenta algunos lineamientos en forma de preguntas o cuestiones específicas que el estudiante podría abordar al emplear la estadística para negocios como recurso, con el fin de formular observaciones y recomendaciones informativas o útiles para su “cliente”.

Casos de procesos de control de calidad

En todos los casos, la empresa o fábrica necesita apoyo estadístico para analizar o crear bases de datos con el fin de analizar la calidad de los productos generados por una línea de producción, armado o ensamble para tratar de minimizar los errores en el proceso de producción.

En ocasiones se utiliza a la estadística para conocer los procesos de calidad en la prestación de servicios como hotelería, restaurantes, transporte, salud, ambientes laborales, etc.

MÉTODOS ESTADÍSTICOS

La materia prima de la estadística consiste en conjuntos de números obtenidos al contar o medir cosas. Al recopilar datos estadísticos se ha de tener especial cuidado para garantizar que la información sea completa y correcta.

El primer problema para los estadísticos reside en determinar qué información y cuánta se ha de reunir. En realidad, la dificultad al compilar un censo está en obtener el número de habitantes de forma completa y exacta; de la misma manera que un físico que quiere contar el número de colisiones por segundo entre las moléculas de un gas debe empezar determinando con precisión la naturaleza de los objetos a contar.

Page 9: Estadística conceptos

Los estadísticos se enfrentan a un complejo problema cuando, por ejemplo, toman una muestra para un sondeo de opinión o una encuesta electoral. El seleccionar una muestra capaz de representar con exactitud las preferencias del total de la población no es tarea fácil.

Para establecer una ley física, biológica o social, el estadístico debe comenzar con un conjunto de datos y modificarlo basándose en la experiencia. Por ejemplo, en los primeros estudios sobre crecimiento de la población los cambios en el número de habitantes se predecían calculando la diferencia entre el número de nacimientos y el de fallecimientos en un determinado lapso.

Los expertos en estudios de población comprobaron que la tasa de crecimiento depende sólo del número de nacimientos, sin que el número de defunciones tenga importancia. Por tanto, el futuro crecimiento de la población se empezó a calcular basándose en el número anual de nacimientos por cada 1.000 habitantes. Sin embargo, pronto se dieron cuenta de que las predicciones obtenidas utilizando este método no daban resultados correctos. Los estadísticos comprobaron que hay otros factores que limitan el crecimiento de la población.

Debido a que el número de posibles nacimientos depende del número de mujeres, y no del total de la población, y debido a que las mujeres sólo tienen hijos durante parte de su vida, el dato más importante que se ha de utilizar para predecir la población es el número de niños nacidos vivos por cada 1.000 mujeres en edad de procrear.

El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de mujeres sin descendencia. Por tanto, la diferencia entre nacimientos y fallecimientos sólo es útil para indicar el crecimiento de población en un determinado periodo de tiempo del pasado, el número de nacimientos por cada 1.000 habitantes sólo expresa la tasa de crecimiento en el mismo periodo, y sólo el número de nacimientos por cada 1.000 mujeres en edad de procrear sirve para predecir el número de habitantes en el futuro.

ESCUELAS

Escuelas estadísticas

Dentro de las escuelas estadísticas se pueden considerar grandes escuelas Estadísticas por su importancia y que han contribuido enormemente al desarrollo de Estadística. · 

La escuela administrativa 

Localizada en Alemania, creó la primera cátedra y cursos de Estadística, dándole importancia a la información requerida por el estado. Se consideran como los principales representantes de esta escuela a: Vito de Seckendorff (1626 – 1689); Hermann Conring, quien inició un curso de Estadística en la Universidad de Helmstadt, preocupado por los casos más notables del estado,

Page 10: Estadística conceptos

su discípulo Godofredo Achenwall quien le dio el nombre de Estadística y la separó de la Sociología.

La escuela probabilística 

Algunos la consideran originaria de Italia, otros de Francia, dada la atención prestada a los juegos azar, que se efectuaban para la recreación de la nobleza, con el consiguiente desarrollo de la teoría de la Probabilidades. Sus principales representantes son: Pascal (1623- 1662); Fermat (1601 – 1665); Laplace (1749 – 1827), Poisson (1781 – 1840) Bernoulli y Gauss.

 la escuela demográfica 

Creada en Inglaterra, se preocupaba por problemas actuariales. Dentro de esta sobresalen: Sir William Petty, Edmund Halley, John Graunt, King y Devenaut, entre otros. A principios de este siglo hay una gran preocupación por su aplicación en los campos de la Agronomía y la Biometría, lo cual le da a la Estadística mayor relevancia, colocando así los cimientos y siendo sus principales exponentes: Galton, Karl Pearson, Gosset y Fisher. · Algunos consideran las siguientes escuelas como las menos importantes: la escandinava, la norteamericana y la hindú que también han contribuido a la fundamentación de la Estadística.

POBLACIÓN

Es el conjunto de todos los posibles elementos que intervienen en un experimento o en un estudio.

TIPOS DE POBLACIÓN: 

Población finita: Es aquella que indica que es posible alcanzarse o

sobrepasarse al contar. Es aquella que posee o incluye un número limitado de

medidas y observaciones.

Población infinita: Es infinita si se incluye un gran conjunto de medidas y

observaciones que no pueden alcanzarse en el conteo. Son poblaciones

infinitas porque hipotéticamente no existe límite en cuanto al número de

observaciones que cada uno de ellos puede generar.

Page 11: Estadística conceptos

HECHO

El concepto de hecho, término derivado del latínfactus, permite describir

aquello que ocurre, las acciones, la obra o la cuestión a la cual se hace

referencia.

HECHOS DE LOS QUE SE OCUPA LA ESTADISTICA

Existen muchos fenómenos (hechos) naturales y sociales que son determinados por una multiplicidad de causas, las cuales además se interrelacionan entre sí y dependen a la vez de múltiples otras causas. Muchas de ellas son desconocidas y en conjunto contribuyen en forma significativa para producir el efecto estudiado. Esto es lo que hace que un fenómeno sea de naturaleza compleja. Un sector importante de esas causas desconocidas es de micro causas; en el sentido de que su contribución individual es pequeña, lo que las hace incontrolables desde el punto de vista práctico. De ahí que al repetir la ocurrencia del fenómeno, aun cuando sea en condiciones de la mayor uniformidad, se produzcan resultados o respuestas diferentes. Esto es lo que hace que la ocurrencia de un fenómeno natural o social sea variable. La estadística permite tratar este tipo de fenómenos de una manera más elaborada que la forma vulgar. La estadística se aplica:

Cuando se hacen observaciones repetidas en condiciones similares.

Cuando a pesar de tener las mayores precauciones en uniformar las condiciones en que se hacen las observaciones, los resultados que ellas presentan son diferentes, son variables.

 

Cuando el valor de la expresión cuantitativa, de cualquier observación individual, es incierto no  predictible.

Aun cuando se conozcan algunos factores que pueden ser determinantes de carácter en estudio. Es un hecho tratable por la estadística el nivel de anticuerpos circulantes contra la fiebre aftosa en la población bovina. No es un problema tratable por la estadística el valor de la hipotenusa de un triángulo. En el problema de los anticuerpos, aun cuando sepamos cual es la raza, sexo, edad, peso, condiciones sanitarias y el período de tiempo postvacunal, etc., no se puede predecir el valor del índice de sobreprotección, al medir el nivel de

Page 12: Estadística conceptos

anticuerpos con este indicador. Si un cierto bovino, especificadas las condiciones ya enumeradas, tiene un valor de sobreprotección de 2,3, otro bovino en las mismas condiciones puede tener un valor 0,5. En cambio en el caso del cuadrado de la hipotenusa, si se dan los valores de los dos catetos (condiciones) se puede predecir en forma cierta el valor de la hipotenusa. Además, si dos triángulos tienen los mismos valores para los catetos (las mismas condiciones) el valor de la hipotenusa será el mismo, para los dos triángulos. En este último caso se puede decir que conociendo los factores determinantes, el resultado es predictible. El hecho de que las repeticiones de un carácter manifiesten variación (diferencias en el resultado) se debe a que los hechos naturales y sociales, como ya se ha dicho están influidos por una gama de causas (multicausalidad) que se interrelacionan entre sí y dependen a su vez de múltip1esotras causas. La relación de factores causales es siempre incompleta, siendo la mayor parte de las 2 causas desconocidas, razón por la cual se dice que la variación es akatoria o causal.

Se entiende por azar (aleatorio) una mezcla entre lo desconocido, lo parcialmente conocido y lo conocido. La variación de origen aleatoria, que hace que un valor individual cualquiera sea irregular en su comportamiento sea imposible de predecir en forma lógica, tiene un orden o regularidad cuando es observada en un hecho colectivo, o sea, un conjunto de repeticiones individuales. En el hecho colectivo se presenta una regularidad que disminuye la incertidumbre. Los valores que puede asumir la característica se hacen más o menos probables, se toman predictibles. Los resultados manifiestan ciertas tendencias, ya que algunos valores son más frecuentes que otros. Los métodos estadísticos permiten estudiar el conjunto de observaciones y dilucidan esas tendencias generales, cuando las observaciones están influidas por múltiples causas de variación. Permiten captar el orden, la uniformidad que manifiestan los hechos naturales o sociales.

QUE ES ESTADÍSTICO?

En estadística un estadístico (muestra) es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo de estimar o inferir características de una población o modelo estadístico.

Más formalmente un estadístico es una función medible T que, dada una muestra estadística de valores, les asigna un número,  que sirve para estimar determinado parámetro de la distribución de la que procede la muestra. Así, por ejemplo, la media de los valores de una muestra (media muestral) sirve para estimar la media de la población de la que se ha extraído la misma; la varianza muestral podría usarse para estimar la varianza poblacional, etc. Esto se denomina como realizar una estimación puntual.

Page 13: Estadística conceptos

QUE SON ESTADRIGRAFOS?

Después de haber ordenado y descrito un conjunto de datos, aún el análisis resulta todavía un tanto incompleto; es necesario entonces resumir la información y facilitar así su análisis e interpretación utilizando ciertos indicadores. 

A estos indicadores se les denomina también estadígrafos o medidas de resumen, permiten hallar un valor numérico, el mismo que representa a toda la población o muestra en estudio. 

MEDIDAS DE ESTADISTICAS

CLASIFICACIÓN:

Medidas de centralización

Medidas de dispersión

Medidas de posición.

MEDIDAS DE CENTRALIZACIÓN

   Indican los valores más representativos de un conjunto de datos.

1. Media aritmética2. Mediana3. Moda

 Media aritmética

Se denota por X Se divide la suma de los datos por el número total de ellos. O si los datos vienen en una tabla con sus frecuencias absolutas

(fi ( tantos con este valor, otros tantos con otro valor...), se multiplica cada dato   xi  por su frecuencia fi

         x =   (x1.f1 + x2.f2 +....+ xn.fn) / N  = ∑ (xi.fi)/N

Page 14: Estadística conceptos

Mediana

Se representa por Me  Es el valor central de un conjunto de datos Se ordenan los valores en orden creciente y se toma el que ocupa el

lugar central (si el número de valores es impar o la media de los dos centrales si es par).

Si se trata de la mediana de valores agrupados

Moda

Se representa por Mo Es el valor que más se repite. Si se repiten la serie es bimodal (2) o multimodal.

MEDIDAS DE DISPERSIÓN

Se utilizan para medir el grado de dispersión que existe en la distribución.

1. Recorrido o amplitud2. Recorrido intercuartílico3. Desviación media4. Varianza5. Desviación típica6. Coeficiente de variación

Recorrido o amplitud

Se representa por R Es la diferencia entre el mayor y el menor de los valores. Si aparecen valores extremos deja de ser representativo.

Recorrido intercuartílico

Se utiliza cuando aparecen valores extremos en la distribución y también se desea tener en cuenta las frecuencias.

Se dividen las frecuencias en cuatro partes iguales separando los valores en quartiles.

Se halla la diferencia entre el valor del cuartil tercero (Q3) y el primero (Q1)

Se consideran por tanto el recorrido del 50% de los elementos sin tener en cuenta el primer y último tramo (25 % y 25%), descartando por tanto los valores extremos.

Page 15: Estadística conceptos

Desviación media

La desviación de un dato x respecto a la media x es la diferencia entre ambos

La desviación media DM  es la media aritmética de los valores absolutos (siempre positivos) de las desviaciones de cada dato respecto a la media.  DM = ( f1. |x1-x| +...+ fn. |xn-x|) / N

Varianza (σ2)

Es la media aritmética de los cuadrados de las desviaciones respecto de la media.

                            σ2 = ( f1. (x1-x)2 +...+ fn. (xn-x)2) / N

Desviación típica (σ)

Es la raíz cuadrada positiva de la desviación típica

                    σ=√ ((f1. (x1-x)2 +...+ fn. (xn-x)2) / N)

Coeficiente de variación (CV)

Es el cociente entre la desviación típica y la media  CV =  σ / x

MEDIDAS DE POSICIÓN

Nos informa del lugar que ocupa un dato dentro de un conjunto ordenado de valores.

1. Quartiles2. Percentiles

Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero, segundo y tercer cuartil.

Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil).

Page 16: Estadística conceptos

Pk=Li+

k . N−Fi−1100fi