ESTADÍSTICA BASICA-LIBRO

ESTADÍSTICA

BÁSICA

Ing. Colón Govea L., M.Sc.

1

PREFACIO

El libro Estadística Básica ha sido desarrollado con el propósito de coadyuvar al aprendizaje de la estadística. Se ha estructurado en forma sencilla, con el propósito de inducir en el estudiante y lector un conocimiento práctico de ciertos fundamentos estadísticos que se detallan en forma muy ampliada en otras publicaciones, pero que aquí, se justifica su concreción por los siguientes motivos.

a. Entregar una publicación en forma comprensible aún para los que no poseen una sólida formación estadística.

b. Presentar procedimientos sistematizados y simplificados en la resolución de los cálculos numéricos.

c. Introducir al alumno en la comprensión de la necesidad y oportunidad de la aplicación de procedimientos estadísticos no sólo en la ciencia sino también en la tecnología y en las distintas ramas del saber.

En el desarrollo de los contenidos, de ninguna manera se prescinde del rigor científico, que para efectos de una investigación más profunda debe considerarse. El propósito es proporcionar al estudiante una obra de consulta práctica

2

y objetiva de los fundamentos y métodos matemáticos, que puedan convencerlo de que se trata de una materia que puede aprender y llegar a dominar para la solución de sus problemas profesionales.

3

CONTENIDO Pág.

1.0 INTRODUCCIÓN A LA ESTADÍSTICA 11.1 Estadística Descriptiva 31.2 Estadística Inferencial 61.3 Población 71.4 Muestra 8

2.0 TIPOS DE VARIABLES. 112.1 Variables y Atributos 11

3.0 DATOS ESTADÍSTICOS 193.1 Ordenación de datos por agrupación 20

3.1.1 Distribución de frecuencias. 213.2 Tabla de Frecuencia Tipo A 233.3 Ordenación de los datos por agrupación 263.4 Tabla de Frecuencia Tipo B 283.5 Distribución de frecuencias por agrupación 293.6 Características de las tablas tipo B 33

4.0 GRAFICAS DE FRECUENCIAS. 364.1 El histograma 364.2 El polígono de frecuencias 384.3 Las barras 39

4.4 Los gráficos circulares 414.5 Las curvas 41

5.0 MEDIDAS DE TENDENCIA CENTRAL 435.1 Media aritmética 43

5.1.1 Media aritmética simple sin agrupar. 455.1.2 Media aritmética de una serie estadística 46

4

http://www.eumed.net/libros/2007a/239/index.htm

Pág.

5.1.3 Media aritmética con datos agrupados 475.2 Mediana. 545.3 Moda 585.4 Media Geométrica 625.5 Media armónica 635.6 Media Cuadrática 64

6.0 MEDIDAS DE POSICIÓN 686.1 Cuartiles 696.2 Deciles 726.3 Percentiles 77

7.0 MEDIDAS DE DISPERSIÓN 817.1 Recorrido. 827.2 Desviación Media 827.3 Varianza 877.4 Desviación Estándar 88

7.4.1 Desviación típica de una serie estadística 897.4.2 Desviación típica de frecuencias 907.4.3 Desviación típica de una serie de intervalo 91

7.5 Coeficiente de Variación 93

8.0 MEDIDAS DE DISTRIBUCIÓN 978.1 Asimetría 978.2 Coeficiente de Curtosis 100

9.0 ANÁLISIS DE ASOCIACIÓN 1049.1 Covariancia 1059.2 Correlación 107

9.2.1 Diagrama de Puntos o dispersión 108

5

Pág.

9.3 Regresión Lineal Simple 1129.4 La Regresión como ecuación predictiva 120

10.0 Análisis de varianza de la regresión simple 121

11.0 PROBABILIDAD 12911.1 Espacio Muestral 13311.2 Suceso o Evento 137

11.2.1 Tipos de sucesos o eventos 13811.3 Probabilidad de sucesos 139

11.3.1 Suceso contenido en otro 13911.3.2 Igualdad de sucesos 14011.3.3 Unión de dos o más sucesos 13111.3.4 Intersección de sucesos 14211.3.5 Sucesos incompatibles 14311.3.6 Sucesos complementarios o contrarios 14411.3.7 Unión de sucesos complementarios 145

12.0 CÁLCULO DE PROBABILIDADES 14712.1 Medición de la probabilidad 148

13.0 PERMUTACIONES, COMBINACIONES, VARIACIONES 154

13.1 Permutaciones 15513.2 Combinaciones 15613.3 Variaciones 16213.4 Combinaciones, Variación , Permutaciones 163

14.0 PROBABILIDAD CONDICIONADA 170

6

Pág.

15.0 PROBABILIDAD COMPUESTA 179

16.0 TEOREMA LA PROBABILIDAD TOTAL 182

17.0 TEOREMA DE BAYES 185

18.0 INDEPENDENCIA DE SUCESOS 188

19.0 DISTRIBUCIONES DE PROBABILIDAD 19119.1 Distribuciones discretas y continuas 191

19.1.1. Distribuciones discretas: Bernoulli 19219.1.2 Distribuciones discretas: Binomial 19519.1.3 Distribuciones discretas: Poisson 19919.1.4 Distribuciones Hipergeométrica 20419.1.5 Distribuciones discretas: Multinomial 20819.1.6 Distribuciones Multihipergeométrica 21019.1.7 Distribuciones continuas: Uniforme 21319.1.8 Distribuciones continuas: Normal 216

7

1.0 INTRODUCCIÓN A LA ESTADÍSTICA

Es la ciencia que estudia el comportamiento de los fenómenos de masa e investiga las características generales de un colectivo prescindiendo de las particularidades que tuvieran cada uno de sus elementos. No se detiene a analizar el comportamiento de un caso aislado; estudia siempre grupos, conjuntos o colectivos de casos.

Existen casos de datos donde con frecuencia se encuentran fenómenos en que no es posible predecir el resultado de un caso aislado. Por ejemplo, una investigación usa el término de población para definir el grupo de vehículos a motor matriculados. Una investigación sobre los efectos de las emisiones gaseosas en la generación de tumores carcinógenos, definirá su población en relación a la totalidad de personas que trabajan en las industrias de hidrocarburos.

Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee.

La Estadística no analiza el comportamiento de un caso aislado; estudia siempre grupos, conjuntos o colectivos de casos. Si estadísticamente se desea analizar un número de repuestos defectuosos que recibe un taller de reparaciones, la estadística inicia su trabajo seleccionando y examinando

8

un grupo numeroso de unidades y obtiene después, la proporción de repuestos defectuosos.

En muchas ocasiones, cuando no se puede predecir el resultado de casos aislados, se afirma que el resultado depende del azar o que es concretamente aleatorio.

La Estadística tiene como propósito describir los fenómenos, tales como, realizar predicciones o inferencias sobre ellos. En el primer caso se aplica la Estadística Descriptiva y en el segundo, se usa la Inferencia Estadística.

Entre otros conceptos la Estadística cita los siguientes:

“La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares”. (Gini, 1953).

Murria R. Spiegel, (1991) dice: “La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.

9

“La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos”. (Yale y Kendal, 1954).

Establecer una definición para la estadística resulta difícil. El concepto de Estadística y sus aplicaciones directas o indirectas es muy amplio. En todo caso, a la Estadística incumbe la recogida, ordenación, resumen y análisis de cualquier tipo de conjunto de datos o colectivos, lo que significa que no tiene sentido pensar en un dato aislado o individual como terreno de trabajo de la Estadística, siempre analiza un grupo de elementos (personas, animales, cosas, experimentos, etc.)

1.1 Estadística Descriptiva

Comprende el análisis y descripción de un conjunto de datos, para obtener conclusiones sobre las características y sus relaciones existentes con otras poblaciones, a fin de compararlas. La estadística descriptiva tabula, representa y describe una serie de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones.

La observación de los elementos de una población puede ser exhaustiva o parcial. Es exhaustiva cuando la observación se refiere a uno o todos los elementos de la

10

población; y, es observación parcial, cuando se refiere a la descripción de los elementos de una muestra.

La estadística descriptiva considera en su análisis las siguientes etapas:

a) Recolección de datosb) Organización de datos

Tabulación Graficación

c) Análisis y medición de datos.

Recolección de datos.

En la recolección de datos se consideran los siguientes conceptos básicos:

Población: conjunto de observaciones efectuadasIndividuo: cada elemento de la población.Atributo: es la característica que se investiga; puede ser cualitativa como la calidad, condición, sexo, religión, nacionalidad; o cuantitativa, como la resistencia, dureza, estatura, peso, superficie.

Por ejemplo: Se aplica un estudio estadístico para investigar la resistencia a la tracción de unos grilletes.

Población: conjunto de grilletes.Individuo: cada grilleteAtributo: la resistencia a la tracción.

11

Organización de los datos

Puede hacerse por medio de la Tabulación a través de una serie simple, o a través de la agrupación de datos, este método se utiliza cuando el número de observaciones es muy grande.

La organización de los datos puede hacerse también a través de los gráficos de barras, sectores circulares, mapas, curvas.

Los gráficos permiten visualizar e interpretar en forma más clara el fenómeno que se estudia.

Análisis y medición de datos

Bajo este procedimiento se puede describir un conjunto de datos y calcular algunas medidas que resumen la información y que permiten establecer comparaciones.

El análisis y medición de datos se logra con el empleo de las medidas de posición, entre ellas, la media aritmética, la moda y la mediana.

También pueden utilizarse las medidas de dispersión como la varianza y desviación estándar, las cuales, nos dan información de la forma cómo están distribuidos los datos.

12

1.2 Estadística Inferencial

Se fundamenta en el análisis de los resultados de una muestra para inducir o inferir el comportamiento o característica de la población a que pertenece. Infiere propiedades de gran número de datos recogidos de una muestra tomada de la población.

De acuerdo con Berenson y Levine; “Estadística Inferencial son procedimientos estadísticos que sirven para deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un grupo menor de ellos (muestra)”.

Para establecer una diferencia entre la estadística descriptiva y la inferencial, tenemos el siguiente ejemplo:

Un ingeniero calcula el promedio del consumo de gasolina por recorrido de un grupo automotor. En este caso, la estadística por no describir el rendimiento del grupo y por no hacer ninguna generalización de los diferentes grupos, estaría utilizando la estadística descriptiva.

Por el contrario, si el ingeniero decide utilizar el promedio del consumo obtenido por uno de sus grupos para estimar el consumo promedio en relación a otros grupos, entonces, el proceso de estimación del promedio

13

sería un problema concerniente a la estadística inferencial.

1.3 Población

Según Levin & Rubin (1996) “Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones”. El análisis estadístico siempre se refiere a un conjunto de personas o cosas que denomina población; el término población tiene un amplio significado y puede referirse a personas, objetos, actos, áreas geográficas e inclusive al tiempo. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.

Las partes componentes de la población se conocen como elementos, los cuales¸ pueden ser algo con existencia real como un restaurante, una fábrica, un sistema de tendido eléctrico, un repuesto, o algo más abstracto, como la gravedad, la temperatura, un voto o el intervalo de tiempo.

Los elementos de la población poseen ciertas propiedades, rasgos o cualidades que se denominan caracteres. Por ejemplo, el hombre posee unos caracteres llamados estatura, peso, edad, estado civil, religión, profesión, ingresos, formación académica, condición de

14

salud, etc. El flujo de un río tiene unos caracteres llamados volumen o caudal, velocidad de flujo, densidad, etc.

El tamaño de la población es un factor de gran importancia en la investigación estadística. Este tamaño viene dado por el número de elementos que la integran. Así, ésta es finita cuando el número de elemento es finito e infinito cuando consta de infinitos elementos.

Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística. En lugar de examinar el grupo entero llamado población, se examina una pequeña parte del grupo llamada muestra.

1.4 Muestra

Cuando se desarrollan investigaciones estadísticas, no es posible obtener información sobre toda la población, de aquí que solamente se investigue un subconjunto o muestra de la misma.

El tamaño de la población es un factor de gran importancia en la investigación estadística. Este tamaño

15

viene dado por el número de elementos que la integran. Así, ésta es finita cuando el número de elemento es finito e infinita cuando consta de infinitos elementos.

Se conoce como muestra a una parte de la población a estudiar que sirve para representarla. La muestra se define en base de la población determinada, y las conclusiones que se obtengan de dicha muestra sólo podrán referirse a la población en referencia.

La muestra se caracteriza por ser representativa, contiene las características relevantes de la población en las mismas proporciones de la población donde fue tomada. La población es un todo y la muestra es una fracción o segmento de ese todo. Si se han de aplicar los resultados de la muestra a la población entera, es fundamental que la muestra a estudiar sea cuidadosamente seleccionada. Una cobertura incompleta de la población conduciría a un error, error de muestreo, pues de otra forma no puede esperarse que la muestra sea representativa de la población de manera exacta.

Al valor de una característica en la muestra se da el nombre de estadígrafo o estadístico y al valor de esa misma característica en la población se le llama parámetro.

Un aspecto importante es el tamaño de la muestra. Este está relacionado directamente con la precisión de los

16

resultados que se obtendrán. Cuanto mayor sea el tamaño de la muestra estará más cerca del tamaño de la población y sus resultados serán más precisos.

La importancia de estudiar muestras en lugar de poblaciones, entre otras, es:

El estudio de pocos individuos permite ahorrar el tiempo.

Disminución de los costos. Estudia de la totalidad de los elementos bajo una

característica determinada. Mejora la calidad de las observaciones y

mediciones realizadas a un reducido número de individuos, antes que realizarlas a toda la población.

Ejercicios.

Resuma los siguientes conceptos:

Estadística. Población. Elemento. Estadística descriptiva. Estadística inferencial. Muestra. Variables categóricas. Parámetro. Estadígrafo.Diferencie estadística descriptiva de la inferencial.Escriba ejemplos de casos que deben ser analizados bajo la estadística inferencial.Identifique en cuatro ejemplos lo que constituye la población, individuo y atributo.

17

2.0 TIPOS DE VARIABLES.

2.1 Variables y Atributos

En una muestra o población se estudia una serie de variables en cada individuo o elemento. Por lo general, se estudia una a una las variables sin llegar a plantearse ninguna asociación entre ellas. El número de variables o datos de una muestra determinan el tamaño de la muestra y suele representarse con la letra n.

Es importante diferenciar que el dato individual es un dato de un sólo individuo, mientras que el dato estadístico es un dato de una muestra o de una población en su conjunto. Por ejemplo, el consumo eléctrico de la vivienda de Pedro es un dato individual, mientras que el promedio del consumo eléctrico de las viviendas del cantón o provincia es un dato estadístico.

En una investigación, el primer problema que se presenta en el análisis estadístico, es el de definir el método más apropiado para resumir la información, a fin de presentar lo más esencial de ella. Es importante establecer la distinción que existe entre dos tipos de información, los atributos y las

18

variables, toda vez, que ellas implican procedimientos diferentes.

En una población los caracteres de los elementos son de dos clases, cuantitativos y categóricos o cualitativos.Los caracteres cuantitativos o variables son los que describen mediante números la resistencia, la intensidad de flujo de un caudal, el salario, la edad, las ventas, el volumen, la distancia, las medidas ergonómicas.

Estas variables o caracteres cuantitativos difieren de elemento a elemento, no se presentan con la misma intensidad en cada uno de ellos, es decir, no todo material tiene la misma resistencia, ni todo vehículo la misma potencia. Por consiguiente, los individuos o elementos de una población presentan distintos números, que son los valores de la variable.

Los atributos son las propiedades de los fenómenos que pueden ser medidos cualitativamente, expresan una descripción cualitativa, no numérica. Los categóricos o atributos se expresan mediante palabras como la profesión, el estado civil, la condición de saludable o no de una persona o el hecho de un producto ser o no defectuoso. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de modalidades. Cuando un atributo tiene distintas formas de presentación se conoce como

19

modalidad: Por ejemplo, la condición de funcionamiento de los barcos pesqueros de Esmeraldas no presentan una misma modalidad.

En las variables cualitativas y cuantitativas se puede mencionar:

Cualititativas.

Cuantitativas o numéricas

Las ordinales, son aquellas que teniendo más de dos modalidades se enuncian siguiendo una cierta ordenación ascendente o descendente y no de otra manera. Por ejemplo, la variable gravedad de un accidente de tránsito, podría tener como orden natural entre sus modalidades leve, moderado, grave, etc.

Variable: Accidente de tránsito.Escala: Leve

Moderado Grave Crítico Muerte

Diferencia: Existe diferencia entre los diferentes niveles de la escala, entre los accidentes leves con los de nivel crítico o muerte.

20

DiscretasContinuas

OrdinalesPurasDicotómica

Variable: Grado de militar y/o policialEscala: Soldado

SargentoSuboficialOficialGeneral

Diferencia: Existe diferencia entre los grados jerárquico no solo en años de experiencia sino en años de estudio.

Las variables cualitativas puras, carecen de un orden natural preestablecido entre sus modalidades, y pueden tener cualquier tipo de ordenación, como por ejemplo el grupo sanguíneo o la nacionalidad de una persona.

En este tipo de variables se carece de un ordenamiento previo, más bien es arbitrario, por ello se ha establecido tres parámetros para entender mejor este tipo de escala; variable, escala y diferencia, por ejemplo:

Variable: Profesión Escala: Ingeniero

MédicoAbogadoEnfermeroOdontólogo

Diferencia: No existe diferencia entre los profesionales.

Variable: Sexo Escala: Masculino

Femenino

21

Diferencia: Ninguna.

Variable: Estado civil Escala: Soltero

CasadoDivorciadoViudo

Unión estableDiferencia: Ninguna.

Las dicotómicas, tienen sólo dos modalidades posibles y no tiene sentido señalar si son o no ordinales. Ejemplo, el sexo, el pertenecer o no a una asociación, o en general cualquier situación que sólo admita una respuesta sí o no.

Las variables cuantitativas son las propiedades de los fenómenos que se pueden medir cuantitativamente. Los caracteres cuantitativos o variables, son susceptibles de medición. Son aquellos que pueden ser expresados mediante números. Como por ejemplo, la densidad, el peso, la estatura, el salario, la edad, etc. Se llama constante, cuando la variable toma solamente un valor.

Cuando las variables toman diferentes valores para representar los diferentes elementos de una población se las conoce como valores de la variable.

22

Las variables cuantitativas se clasifican en discretas y continuas. Las primeras sólo pueden asumir determinados valores y no es posible que llegue a tomar algún valor comprendido entre dos números consecutivos; es un número entero que no admite fracciones. Ejemplo, el número de motores de un taller. El número de alumnos de un aula de clases.

Variable: Número de visitas Escala: De 1 a 3 visitas

De 4 a 6 visitasDe 7 a 9 visitasDe 10 a 12 visitas

Amplitud: Entre 1 y 3, existe una amplitud de 2

Variable: Número de caries dental Escala: De 1 a 3 caries

De 4 a 6 cariesDe 7 a 9 caries

Amplitud: Entre 1 y 3 caries, existe una amplitud de 2 caries

Las variables continuas pueden tomar cualquier valor en un intervalo de los números reales. La velocidad de recorrido por hora de un vehículo. El peso de una persona, etc.

Variable: PESO EN GRAMOS Escala: 6,5 Kg

23

7,5 Kg8,5 Kg9,5 Kg

Amplitud: Entre 6,5 y 9,5 kg existe una amplitud de 4,0 kg.

Variables Independientes y Variables Dependientes

Si a cada valor de X le corresponde uno o más valores de la variable Y, entonces, Y es una función de X, y se representa por:

X será la variable independiente Y la dependiente.

Por ejemplo, la torsión T de un eje es función de su resistencia R.

Ejemplo de identificación de variables:

Descripción de la variable IdentificaciónTiempo de funcionamiento de un motor

Cuantitativa, continua.

Distancia recorrida por un vehículo.

Cuantitativa, continua.

Ingreso de visitas al taller. Cuantitativa, discreta.

24

Cantidad de motores eléctricos.

Cuantitativa, discreta.Color de una dínamo

circuitado.Categórica.

Preferencia por la marca de un repuesto.

Categórica.

Estatura de los empleados. Cuantitativa continua.

25

3.0 DATOS ESTADÍSTICOS

Los datos estadísticos pueden ser el resultado de un censo o de una muestra. Es de un censo cuando las características observadas se la han realizado sobre todos los elementos de la población, pero si se ha tomado de una parte de ella, se trata de una muestra.

Es importante insistir que sólo se podrán hacer estimaciones confiables cuando las características de los elementos de la muestra sean representativas de las características de la población de donde se tomó.

Todo dato estadístico es el resultado de las observaciones realizadas a las personas o cosas que ocasionan el fenómeno que se va ha estudiar.

Para lograr una buena descripción y análisis con los datos, éstos deberán ordenarse y clasificarse antes de que se realice su recopilación.

Si se desea conocer el comportamiento de un grupo de barras metálicas debe hacérselo sobre la base de: tipo de material, dimensiones, densidad, etc.

En un censo de población a las personas se les toma datos sobre: nombres, apellidos, edad, origen, lugar donde vive, ingresos económicos, etc.

Durante la recolección de datos se consideran los conceptos de población, individuo y atributos (que pueden ser

26

cualitativos o cuantitativos). Por ejemplo: se desea realizar un estudio de las densidades de maderas de un bosque.

Población: Conjunto de densidades Individuo: cada densidad Atributo: la densidad.

En cuanto a la organización de los datos, éstos pueden ser tabulados a través de una serie simple o por medio de su agrupación. La agrupación se emplea para los casos cuando las observaciones son muy grandes.

3.1 Ordenación de los datos por agrupación o distribución de frecuencias.

Bajo este método se registran las frecuencias de cada valor de la variable y se determina la frecuencia absoluta, frecuencia relativa, frecuencia relativa en porcentaje, frecuencia acumulada y frecuencia acumulada en porcentaje.

La Frecuencia absoluta expresa el número de veces que la variable u observación toma un cierto valor; mientras que la frecuencia relativa se establece por el cociente entre la frecuencia absoluta de cada valor de la variable dividida por el total de observaciones.

27

3.1.1 Distribución de frecuencias.

Con el fin de poder identificar el comportamiento característico de un fenómeno y facilitar el análisis exhaustivo de los datos, se procede a estudiar el comportamiento de las variables y conocer su distribución, describiendo y entendiendo la forma como varían los valores de la característica estudiada en los individuos de la muestra o población.

La distribución de una variable entrega información sobre los valores que una variable puede tomar en los individuos observados y la frecuencia con que estos valores ocurren.

Al conjunto de datos o variables, de valor cualitativo o cuantitativo, que tiene cada elemento de la muestra se denomina distribución. La forma de simplificar los datos que equivale a las veces que se repiten, nos conduce a la definición de los siguientes conceptos:

Frecuencia: es el número de veces que se presenta cada valor de la variable

Frecuencia absoluta (f) es el número de veces que el valor de una variable aparece dentro de un conjunto de datos. Por ejemplo, si una muestra recoge la densidad de algunos minerales y dentro de ella, la del cobre se repite 20 veces, ésta será la f y n corresponderá al

28

tamaño total de la muestra, o sea, a la totalidad de todos los minerales observados.

La totalidad de los datos (n) equivale a la sumatoria de las frecuencias absolutas. Matemáticamente se expresa:

Frecuencia relativa (fi) equivale al valor de la frecuencia absoluta de la variable dividida por la totalidad de datos o tamaño muestral (n). Del ejemplo anterior, si f es 20 y el tamaño total muestral n es 100, es decir, el total de los minerales observados, entonces fi = 20/100 = 0.2

Las frecuencias relativas, por lo general, se expresan como porcentajes, que en nuestro caso es de 20% en relación al total.

Las frecuencias absolutas y relativas son aplicables a cualquier tipo de variable, y de ahí su importancia; además, pese a su simplicidad, dan lugar a conceptos muy importantes, como el de proporción, y son la base sobre la que se construye cualquier resumen de los datos.

29

En toda investigación estadística se llega a la acumulación de valores cuantitativos y cualitativos correspondientes a los diversos valores de las variables que se pueden resumir en lo que se conoce como tablas de frecuencia. Luego, las tablas de frecuencia, es el procedimiento de simplificación de los datos que agrupan diversos valores de una variable.

Tabla de frecuencias: es una tabla que presenta en forma ordenada los distintos valores de una variable y sus correspondientes frecuencias.

Para entender como funcionan, analizaremos dos tipos de tablas de frecuencia.

3.2 Tabla de Frecuencia Tipo A

Se pide a una comisión técnica que valore el concurso de merecimientos de los profesionales que participan para el ingreso a una empresa con la siguiente escala de puntuación: Excelente (6), Muy Bueno (5), Bueno (4), Regular (3), Malo (2) y Muy Malo (1)

Los resultados de la calificación para diez concursantes fueron:

30

Profesional Nivel 1 52 23 44 35 56 57 48 39 510 4

Nivel de calificación

Frecuencia (f)

1 02 13 24 35 46 0

Total… 10

Los miembros de la comisión técnica no valoraron a los profesionales ni como Malos ni como Excelentes; mientras que la mayoría de los profesionales se valoraron como Muy Bueno y Bueno.

31

El cuadro expone la calificación para cada concursante.

Luego, se simplifican y se interpretan los datos.

Como en la catalogación de los datos la amplitud presenta una distancia o variación

Obsérvese en el cuadro anterior que la sumatoria de las frecuencias es igual al número de profesionales concursantes.

El análisis de las tablas de frecuencia se complementa con la frecuencia relativa (fi), frecuencia acumulada (fa) y frecuencia relativa en porcentaje (fi%) y acumulada en porcentaje (fa%). Las frecuencias absolutas y relativas son aplicables a cualquier tipo de variable, a más de su simplicidad permiten establecer la proporción de los datos.

Ejemplo: De los datos de una encuesta de usuarios de energía eléctrica sobre el consumo de Kw se obtuvieron los siguientes datos:

32

Nivel de calificación

Frecuencia (f)

fa fi fa%

1 0 0 0,0 0,02 1 1 0,1 0,13 2 3 0,2 0,34 3 6 0,3 0,65 4 10 0,4 1,06 0

Total… 10 1,0

3 7 2 0 5 8 3 9 4 1 2 5 2 7 3 2 3 1 2 8

2 0 4 3 3 7 4 0 3 2 3 1 1 8 2 5 3 7 2 9

4 9 4 7 3 4 3 5 3 2 2 1 4 3 3 8 4 7 1 9

5 0 4 2 3 1 4 4 3 7 3 5 4 6 3 0 5 3 4 6

Ordenac ión de l o s da to s ( apa recen como

U=usua r io , C=consumo) como una ser ie s imple:U C U C U C U C1 1

811

30

21

37

31

432 1

912

31

22

37

32

443 2

013

31

23

37

33

464 2

014

31

24

37

34

465 2

115

32

25

38

35

476 2

516

32

26

39

36

477 2

517

32

27

40

37

498 2

718

34

28

41

38

509 2

819

35

29

42

39

531

020

20

35

30

43

40

58

3.3 Ordenación de los datos por agrupación o distribución de frecuencias.

Bajo este método se registran las frecuencias de cada valor de la variable y se determina la frecuencia absoluta, frecuencia relativa, frecuencia relativa en

33

porcentaje, frecuencia acumulada y frecuencia acumulada en porcentaje.

La Frecuencia absoluta expresa el número de veces que la variable u observación toma un cierto valor; mientras que la frecuencia relativa se establece por el cociente entre la frecuencia absoluta de cada valor de la variable dividida por el total de observaciones.

La distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia.

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendríamos una tabla de frecuencia muy extensa que aportaría muy poco valor a efectos de síntesis.

Distribución de frecuencias de datos simples.

f fi fi % fa fa %18 1 0,025 2,50 1 2,5019 1 0,025 2,50 2 5,0020 2 0,050 5,00 4 10,0021 1 0,025 2,50 5 12,5025 2 0,050 5,00 7 17,5027 1 0,025 2,50 8 20,0028 1 0,025 2,50 9 22,5029 1 0,025 2,50 10 25,00

34

30 1 0,025 2,50 11 27,5031 3 0,075 7,50 14 35,0032 3 0,075 7,50 17 42,5034 1 0,025 2,50 18 45,0035 2 0,050 5,00 20 50,0037 4 0,100 10,00 24 60,0038 1 0,025 2,50 25 62,5039 1 0,025 2,50 26 65,0040 1 0,025 2,50 27 67,5041 1 0,025 2,50 28 70,0042 1 0,025 2,50 29 72,5043 2 0,050 5,00 31 77,5044 1 0,025 2,50 32 80,0046 2 0,050 5,00 34 85,0047 2 0,050 5,00 36 90,0049 1 0,025 2,50 37 92,5050 1 0,025 2,50 38 95,0053 1 0,025 2,50 39 97,5058 1 0,025 2,50 40 100,00

40 1 100

3.4 Tabla de Frecuencia Tipo B

Se emplean estas tablas cuando los datos observados son numerosos y la amplitud de los valores de las variables es considerable. Se toma a la amplitud como la diferencia entre el menor y el mayor valor de la observación.

35

Debido a los datos numerosos se hace necesario agruparlos en Intervalos de Clase. La agrupación de los valores de la variable en intervalos de clase permitiría simplificar las fuentes de datos. Por ejemplo, si tuviéramos una valoración de 1 a 75, podríamos establecer intervalos de clase entre 0-15, 15-30, 30-45, 45-60 y 60-75.

3.5 Distribución de frecuencias por agrupación de datos

Para aplicar este procedimiento es importante definir los siguientes conceptos:

Amplitud total o recorrido de la variable (A).- Se la define como la diferencia que existe entre el valor mayor y el valor menor de las observaciones.

A = Obmayor – Obmenor

Intervalo de clase.- Comprende los números extremos y los incluidos entre ellos. Por ejemplo: se tiene un intervalo de 60 – 64

60 6461 – 62 – 63

36

Límites de clase.- Está formado por los números extremos que forman el intervalo de clase. Los límites de clase en el anterior intervalo serian 60 y 64. Sin embargo, los límites reales se obtienen restando 0.5 al límite inferior (Li) y sumando 0.5 al límite superior (Ls).

Límite inferior: 59.5

Límite superior: 60.5

Ancho del intervalo (I).- El ancho del intervalo o intervalo de clase se lo obtiene por la diferencia entre el límite real superior (Lrs) menos el límite real inferior (Lri).

I = lrs - lri

I : ancho del intervalo

Lrs : limite real superior

Lri : limite real inferior

O también mediante lo siguiente: I = Ls – Li + 1

Marca de clase.- Es el valor medio de cada intervalo.

Mc = marca de clase

37

Li = limite inferior

Ls = limite superior

Número de intervalos.- Es un número entero que refleja la totalidad de clases.

ni = número de intervaloI = ancho del intervalo A = amplitud

Los intervalos deben ser no menor que 5 ni mayor a 15. Con un número de 5 intervalos de clase las frecuencias son muy concentradas. Cuando los intervalos son mayores a 15 las frecuencias se presentan muy dispersas, lo cual, dificulta su representación gráfica y cálculos matemáticos.

Ejemplo de ordenación de los datos por agrupación o distribución de frecuencias de la producción alcanzada por setenta obreros, fue la siguiente:

51 49 45 56 49 46 45 40 38 6136 65 55 50 50 45 47 43 37 6545 45 45 50 51 56 39 61 55 5249 47 41 52 49 41 60 79 36 4250 51 49 48 55 67 36 48 40 4151 50 49 45 44 45 41 37 66 57

38

49 34 45 65 70 54 50 46 37 41

Para establecer los intervalos de clase se procede:

a) Si los va ha ordenar en forma descendente, tome el mayor valor de la observación asignándolo como el límite superior del que será el primer Intervalo de clase, de acuerdo con los datos anteriores, tenemos:

I = Ls – Li +1

De donde: 6 = 79 – Li + 1 74

Luego, el primer intervalo de clase estaría determinado por aquellos que alcanzan una producción entre 74 – 79 y artículos.

El resto de intervalos lo deduce restando, sucesivamente, el ancho del intervalo (I) tanto al límite inferior como al superior.

INTERVALO f fa fi fi %

74 - 79 1 70 0,01 1,43

68 - 73 1 69 0,01 1,43

62 - 67 5 68 0,07 7,14

56 - 61 6 63 0,09 8,57

50 - 55 16 57 0,23 22,86

44 - 49 23 41 0,33 32,86

39

Amplitud: A = 75 – 34 = 41Ancho intervalo: I = 6

Número de intervalos: ni = (41/6)+1≈8

38 - 43 11 18 0,16 15,71

32 - 37 7 7 0,1 10

Totales 70 1 100

3.6 Características de las tablas tipo B

Utiliza en el cálculo las marcas de clase. Los valores asumidos por las variables son

elevados. Sólo se utilizan variables cuantitativas (discretas

y continuas). Su elaboración tiene mayores procedimientos que

las tablas Tipo A. La interpretación y análisis se centra en los

intervalos de clase. Presenta un componente adicional: las marcas de

clase.

EJERCICIOS.

1. Completar los datos que faltan en la siguiente tabla estadística, donde f, fa y fi representan, respectivamente, la frecuencia absoluta, acumulada y relativa:

x f fa Fi

1 4 0,082 4 3 16 0,164 7 0,145 5 28 6 38 7 7 45

40

http://www.eumed.net/libros/2007a/239/index.htm

8

2. La frecuencia relativa de 1 es 0,08 = 4/N, de donde N = 50. Complete la frecuencia y frecuencia absoluta de la observación de 3.

X f fa fi

1 4 4 0,08

2 4 8 0,08

3 0,16

4 7 23 0,14

5 5 28 0,10

6 10 38 0,20

7 7 45 0,14

8 5 50 0,10

3. Construya una tabla de frecuencias con los datos de màxima temperatura que se registrò en la ciudad.

29, 30, 32, 28, 29, 31, 34, 28, 31, 33, 29, 30, 30, 31, 31, 30, 29, 29, 34, 33, 33, 29, 29. 30, 32, 31, 31, 30, 30, 29, 30, 31

4. La resistencia a dureza de 65 piezas se registran en la siguiente tabla. Construir la tabla de frecuencias.

Dureza 51-60 61-70 71-80 81-90 91-100 101-110f 10 7 12 9 14 11

41

5. Un tornero observa el número de fallas por lotes de producción de las piezas elaboradas, la cual, se registra en la siguiente tabla.

Lotes Fallas f fi

1 8 8 0,17

2 10 15 0,31

3 5 p1 p2

4 4 9 0,19

5 6 11 0,23

6 3 5 0,10

42

4.0 GRAFICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS.

Las distribuciones de frecuencias no sólo se representan en tablas sino también en gráficos. Los gráficos permiten facilitar la comprensión de los resultados, puestos que, fundamentalmente, representan las frecuencias de cada modalidad o valor, pero no añade ninguna información sobre la que contendría una tabla de frecuencias. Hay dos formas de representar las distribuciones de frecuencias, por medio de un histograma o por un polígono de frecuencias.

En las gráficas las áreas (o longitudes) han de ser proporcionales a las frecuencias y los detalles deben ser lo suficientemente visibles. Se recomienda no representar demasiada información en una gráfica

Los datos de las variables u observaciones pueden adecuadamente también expresarse mediante gráficos, tales como: barras, sectores circulares, mapas, curvas, etc.

4.1 El histograma se utiliza para representar una tabla de frecuencias de intervalos de clase. Es la gráfica adecuada para representar variables cuantitativas continuas, en muchas ocasiones estos histogramas son llamados erróneamente diagramas de barras.

43

Sobre el eje horizontal (X) se representan los intervalos de clase y sobre el eje vertical (Y), las frecuencias de los intervalos de clase.

El histograma consiste en un conjunto de rectángulos adyacentes cuya base (todos ellos con base de igual amplitud) representa un intervalo de clase y cuya altura representa la frecuencia absoluta o relativa de acuerdo con la distribución de frecuencias del intervalo que estemos representando. En la base del rectángulo, bien puede colocarse el intervalo o su punto medio de clase.

No obreros

Producción Histograma de la producción media de setenta obreros

44

4.2 El polígono de frecuencias Es Empleado con variables cuantitativas, tanto discretas como continuas, partiendo del diagrama de columnas, barras o histograma, según el tipo de tabla de frecuencia manejada.

El polígono se construye uniendo los puntos medios de los lados superiores de cada rectángulo. Si se quiere cerrar el rectángulo, se agregan dos intervalos: uno anterior y otro posterior al último y se prolonga el polígono hasta los puntos medios de estos intervalos.

# Obreros

ProducciónPolígono de frecuencias de la producción media de setenta obreros

45

4.3 Las barras se utilizan generalmente para representar atributos cualitativos o cuantitativos discretos. La longitud es igual a la frecuencia de cada observación. Pueden ser barras simples o múltiples, según se trate de representar uno o más atributos. Las barras pueden ser horizontales o verticales.

Los diagramas de barras asocian a cada modalidad de una variable a un rectángulo y la superficie refleja su frecuencia. Las bases de los rectángulos son todas iguales; pero, las alturas corresponden a las frecuencias.

Ejemplo:

Producción de PETROINDUSTRIAL el 16 de diciembre de 2008

En el ejemplo de los gráficos de barras vertical y horizontal los rectángulos van separados.

46

LPG 6.575Jet A-1 3.921Asfalto C-20 7.239Resido 10.329

Producción total diaria en barriles(16-dic-2008)

47

4.4 Los gráficos circulares o gráficos de torta se emplean para comparar datos. Cada sector del gráfico representa el porcentaje que corresponde a la frecuencia de un cierto valor de la variable. Ejemplo: Producción de azúcar (Año 2007) en miles de sacos de 50 Kg de los siguientes ingenios:

Ingenio Producción PorcentajeSan Carlos 3.322 34.39Ecudos 3.159 32.70Valdez 3.180 32.91

4.5 Las curvas se utilizan generalmente para representar la variación de una variable a través del tiempo (años, meses,

48

horas, etc.). Sobre el eje horizontal figuran los períodos de tiempo.

Año 2003Precipitación

(mm)Enero 197,7Febrero 186,9Marzo 133,1Abril 68,2 Mayo 133,0Junio 39,7Julio 1,4Agosto 20,4Septiembre 41,9Octubre 24,4Noviembre 43,6Diciembre 45,2

49

5.0 MEDIDAS DE TENDENCIA CENTRAL.

Las medidas o parámetros de centralización, conocidos también como medidas de tendencia central o posición central, permiten encontrar un valor lo más representativo posible de todos los valores de la muestra, es decir, se utilizan para encontrar un valor que represente a todos los datos.

El valor que represente a todos los datos no será el valor más elevado ni el valor más pequeño, lo más adecuado, es entonces buscar un valor central que represente al grupo antes que al individuo.

Las medidas de tendencia central permiten resumir la localización de los datos, ubicando el punto alrededor del cual se centran los mismos.

Las medidas más utilizadas son:

Media aritmética Mediana Moda Media geométrica Media armónica

5.1 Media aritmética

La media es la medida de tendencia central más utilizada y puede definirse como el promedio aritmético de una

50

distribución. Se calcula sumando los valores de los datos y dividiendo su resultado para la cantidad de ellos.

Si los datos provienen de la población el promedio se representa por la letra griega µ; si lo es de una muestra,

por

La media aritmética o promedio ( ) se calcula sumando

todas las observaciones y luego dividiendo el total entre el número de elementos observados.

El símbolo ∑ indica que debe efectuarse una sumatoria, X es el símbolo de una puntuación y N es el número total de casos o puntuaciones.

La sumatoria es un símbolo muy utilizado en matemáticas que sirve para simplificar fórmulas estadísticas. Una sumatoria nos permite representar sumas muy grandes, de n sumandos o incluso sumas infinitas y se expresa con la letra griega sigma (Σ).

Por lo general, después de una sumatoria aparece una variable con un suscrito representado por la letra i (ΣXi). Este suscrito indica qué valores de la variable se deben sumar, Para determinar cuáles valores, es necesario sustituir la i por los valores que se indican arriba y debajo de la sumatoria

51

http://es.wikipedia.org/wiki/Sigma

http://es.wikipedia.org/wiki/Suma

Los datos provenientes de las poblaciones o muestras pueden ser tratados de dos formas: sin agruparlos o agrupándolos en tablas de frecuencias.

5.1.1 Media aritmética simple con datos sin agrupar.

Es la suma de todos los elementos de la serie dividida por el número de ellos. Se calcula como:

siendo:

: la media

: suma de elementos

n : número de elementos (incluyendo a los de igual valor)k : número de elementos con distinto valor.

Ejemplo.

1. Hallar el promedio de los datos correspondientes a espacios en km recorridos por vehículos.

120, 50, 200, 80, 174, 180, 130

52

2. La media de 5 elementos se sabe que es 15. Sabiendo que cuatro de ellos son: 10, 7, 20, 25 hallar el elemento que falta.

3. Ejemplo: determine la media aritmética de los amperajes de un grupo de motores: 3.5, 3.6, 3.7, 3.8, 3.9, 4.0, 4.2, 4.3, 4.4, 4.9

5.1.2 Media aritmética de una serie estadística de frecuencias o media aritmética ponderada.

Se define como la suma de los productos de cada elemento de la serie por su frecuencia respectiva, dividida por el número de elementos de la serie.

La fórmula matemática para calcular la media o promedio para casos agrupados es:

53

Donde ni corresponde al número de observaciones o frecuencias de cada valor.

Ejemplo: determinar la media aritmética del esfuerzo de torsión para los datos encontrados en los siguientes motores: 280, 220, 278, 250, 260, 220, 250, 278, 280, 260, 250, 250

x f280 2278 220 2250 4220 2

5.1.3 Media aritmética con datos agrupados en una serie estadística de intervalos de frecuencia.

Para la resolución de la media aritmética con datos agrupados en intervalos de frecuencia se tienen tres métodos.

Primer Método

El procedimiento establecido para resolver los cálculos bajo este método se resume en:

54

a. Se establecen los intervalos de clase.b. Para cada intervalo se sacan las frecuencias absolutas.c. Se deduce los puntos medio de clase.d. Se multiplica b y c.e. Se hace la sumatoria de los productos de los puntos

medios de clase por sus frecuencias absolutas respectivas.

f. Se divide la sumatoria obtenida para el número de observaciones.

Fórmula que se emplea:

Ejemplo: calcular la media aritmética, en miles de libras por pulgada cuadrada, de 40 muestras de varios tipos de aluminio, después de haber sido sometidas a un ensayo de máxima tensión.

16 32 27 42 28 34 44 22 18 38

22 40 16 20 42 36 40 42 32 16

36 18 34 25 38 27 20 25 36 34

27 38 36 44 22 32 16 40 27 20

A = 44 – 16 = 28I = Ls – Li +1

55

I = 55 = 44 - Li +1Ni = A/I = 28/5 = 5.6 ≈ 6Li = 40Mc= Punto medio de clase.

X f Mc f*Mc40 – 44 8 42 33635 – 39 7 37 25930 – 34 6 32 19225 – 29 7 27 18920 – 24 6 22 13215 – 19 6 17 102

Total……. 40 1210

Ejemplo.

Una distribuidora de energía eléctrica en la venta de los datos que se registran en el cuadro, tuvo en promedio una pérdida del 25%. ¿Cuánto representó la pérdida, si el precio del Kw/h fue de $ 0.75?

Cons Kw/h

1200 2300 1600 1010 2540 1800 1540900 2400 650 740 1200 848 1900

56

Segundo Método.

El procedimiento de resolución es el siguiente:

a. Repítase los pasos a, b y c del procedimiento del Primer Método.

b. Escoja el punto medio de clase que tenga la mayor frecuencia absoluta y lo denominamos punto medio de clase supuesto Mcs.

c. Se calcula u con la siguiente fórmula:

d. Finalmente, multiplica las frecuencias absolutas por u.

La fórmula es:

e.

Bajo este método resolveremos el mismo ejercicio del caso anterior.

57

X f Mc Mcs u f * u

40 – 44 8 42 42 0 035 – 39 7 37 -1 -730 – 34 6 32 -2 -1225 – 29 7 27 -3 -2120 – 24 6 22 -4 -2415 – 19 6 17 -5 -30

Total……. 40 -94

Aplicamos la fórmula:

Se obtuvo el mismo resultado con este método.

Tercer Método.

Su procedimiento de resolución es:

a. Repítase los pasos a, b y c del procedimiento del Primer Método.

b. Seleccione en forma arbitraria cualquier punto medio de clase y así obtendrá su punto medio de clase supuesto Mcs.

58

c. Deduzca la desviación (d) restando a cada punto medio de clase (Mc) el punto medio de clase (Mcs).

d. Multiplique la frecuencia por la desviación.e. La fórmula que debe emplear es:

Para efectos de comprobación de la consistencia del método, utilizaremos los mismos datos que hemos empleado, a fin de obtener el mismo valor de la media.

X f Mc Mcs d f * d40 – 44 8 42 10 8035 – 39 7 37 5 3530 – 34 6 32 32 0 025 – 29 7 27 -5 -3520 – 24 6 22 -10 -6015 – 19 6 17 -15 -90

Total……. 40 -70

Aplicando la fórmula:

59

Con los tres métodos hemos logrado el mismo resultado.

EJERCICIOS.

1. Considérense los siguientes datos: 7, 12, 23, 10, 6, 2. Se pide:

a. Calcular su media.b. Si los todos los datos anteriores los multiplicamos por

3, cuál será la nueva media.

2. A un conjunto de 5 números cuya media es 6.84 se le añaden los números 12.5 y 6.4. ¿Cuál es la media del nuevo conjunto de números?

3. Calcular la media de una distribución estadística que viene dada por la siguiente tabla:

xi 59 72 47 60 79f 6 15 32 25 12

4. Hallar la media de la distribución estadística de los datos de la siguiente tabla.

x 8 -12 13-17 18-22 23-27 28-32

fi 7 8 5 10 4

60

5.2 Mediana.

Es el valor que divide una serie de datos ordenados en dos partes iguales. El número de datos que queda por debajo y por arriba de la mediana son iguales; eso hace que la mediana sea el valor que está en el centro de la distribución.

Cuando no existe un valor central se puede definir a la mediana como la media aritmética de los valores medios. Esto es, si el número de partidas es par, la mediana es la media aritmética de los valores de las dos partidas medias.

La mediana se calcula según los siguientes casos:

Caso 1. Mediana para datos no agrupados, con número de datos impar.

Ejemplo: 2, 4, 6, 8, 10, 12, 14

Mediana = 8

Mediana para datos no agrupados, con número de datos par.

Ejemplo: 3, 3, 4, 4, 6, 7, 7, 8

Mediana = 5

61

Caso 2. Mediana para datos agrupados.

Calcular la mediana a partir de la siguiente tabla de frecuencia:

En este caso se calcula la Mediana de una serie con datos agrupados sólo por frecuencias, pero sin agrupar en intervalos.

62

X f fa f% fa%5 3 3 6,5 6,510 7 10 15,2 21,715 8 18 17,4 39,120 5 23 10,9 50,025 10 33 21,7 71,730 8 41 17,4 89,135 5 46 10,9 100,0 46 100,0

Procedimiento:

Se calcula la frecuencia acumulada. Se calcula número total de casos

dividiendo suma de frecuencias para 2.

La variable de la frecuencia acumulada inmediatamente superior al resultado del paso anterior es la mediana.

En consecuencia, la frecuencia acumulada inmediata superior a 23 es 33; luego, la mediana es la variable 25.

Caso 3. Mediana para una serie de datos agrupados en intervalos.

En este caso se calcula la Mediana para una serie de datos agrupados por frecuencias y en intervalos.

La mediana se calcula de la siguiente forma:

a. Se ordenan los valores en una tabla con intervalos de clase, frecuencia absoluta y frecuencia acumulada.

b. Se divide la sumatoria de frecuencias absolutas para dos.

c. A este resultado se le busca el valor inmediato superior en las frecuencias acumuladas, el cual, en la línea de valores, nos indicará el intervalo de clase que contendrá la mediana.

d. Al límite inferior de este intervalo de clases se le obtiene el límite real inferior.

e. La frecuencia acumulada menor (fam) se encontrará debajo del valor que señala el numeral 3 anterior.

f. Se calcula la frecuencia del intervalo que contiene a la mediana mediante la fórmula de la mediana.

63

Ejemplo. Calcular la mediana a partir de la siguiente tabla de frecuencia:

Ejemplo: Se registró los amperajes de 30 motores de potencia entre ½ HP hasta 3.0 HP funcionando bajo corriente alternativa trifásica, siendo sus datos:

64

2 4,8 9,2 6,5 8,6 13 8,6 2,5 11 8,23 3,4 8,2 14,4 3 2 13 8,6 6,5 4,2

4,2 8,2 2,5 4,8 6,2 3,7 4,2 3,4 4,8 23 11 6,8 2,8 13 14 4,2 9,2 8,2 13

X f fa10,4 - 14,4 8 40

6,4 - 10,4 12 322,4 - 6,4 17 20-1,6 - 2,4 3 3

40

5.3 Moda

Es el valor de la variable que tiene mayor frecuencia en la muestra y puede definirse para cualquier tipo de variables; es decir, el que se repite un mayor número de veces. Es por tanto, el valor común.

En una distribución puede ocurrir que haya dos o más modas, entonces se habla de distribución bimodal, trimodal, incluso puede no existir la moda, como en la serie 2, 3, 4, 5, 7, 10.

Ejemplo: Se presenta en forma ordenada de menor a mayor las edades de una muestra de 12 jóvenes.

15 15 16 16 17 17 7 17 8 18 19 19

De los datos la edad o valor de 17 es la moda.

La moda en los datos sin agrupar la constituye el conjunto de valores que ocurre con mayor frecuencia; mientras que para datos agrupados es el intervalo de clase con la frecuencia más alta.

65

Si los valores se encuentran en una tabla de frecuencias para datos agrupados, el cálculo de la moda se obtiene realizando la siguiente secuencia:

a. Determinar el intervalo en donde se encuentra la clase modal, que corresponde al intervalo que posee la mayor frecuencia.

b. Obtener el limite inferior de la clase modal (Li)

c. Obtener la amplitud del intervalo de la clase modal (I)

d. Calcular la diferencia entre la frecuencia del intervalo modal y la frecuencia del intervalo contiguo inferior. (d1)

e. Calcular la diferencia entre la frecuencia del intervalo modal y la frecuencia del intervalo contiguo superior (d2)

Ejemplo.

Ejemplo (del Capítulo I Libro I) de ordenación de los datos por agrupación o distribución de frecuencias de la producción alcanzada por setenta obreros.

66

Utilizando los datos de la tabla anterior, tenemos que:

a. La frecuencia absoluta de mayor valor es 23, que

corresponde al intervalo 44 - 49

b. Limite real inferior 43.5

c. La amplitud del intervalo es 6

d. La frecuencia absoluta del intervalo modal es 23

La frecuencia absoluta del intervalo contiguo

inferior es: 11, luego d1 = 23-11 = 12

e. La frecuencia absoluta del intervalo modal es: 23

La frecuencia absoluta del intervalo contiguo

superior es: 16, luego d2 = 7

67

INTERVALO f fa Mc f *Mc74 - 79 1 1 76,5 76,568 - 73 1 2 70,5 70,562 - 67 5 7 64,5 322,556 - 61 6 13 58,5 35150 - 55 16 29 52,5 84044 - 49 23 52 46,5 1069,538 - 43 11 63 40,5 445,532 - 37 7 70 34,5 241.5 70

Se obtiene que la moda sea:

d1 = 23 – 11 = 12

d2 = 23 – 16 = 7

Ventajas y desventajas de la moda

Ventajas

a. La Moda (al igual que la Me) se puede usar como

una localización central tanto para datos

cualitativos como cuantitativos.

b. La Moda (como la Me) no esta indebidamente

afectada por valores extremos, aún cuando los

valores altos sean muy bajos, se escoge el valor

más frecuente del conjunto de datos como el

valor modal.

68

c. Se puede usar la Mo aún cuando los intervalos de

clases están abiertos en sus extremos.

DesventajasDesventajas

a. No siempre hay un valor modal

b. Cuando un conjunto contiene 2, 3 o más modas,

estas son difíciles de interpretar y comparar

5.4 Media Geométrica

La media geométrica de un conjunto de observaciones se trata de la raíz enésima de su producto. El cálculo de la media geométrica exige que todas las observaciones sean positivas.

Los datos que emplea la media geométrica deben ser todos números positivos. Si hay un número negativo la media geométrica o bien negativa o bien inexistente en los números reales. Cuando uno de los datos es 0, entonces el resultado es 0.

Donde:

69

http://es.wikipedia.org/wiki/N%C3%BAmeros_reales

G = media geométrican = numero de partidas de la muestrax = valores de las partidas

70

5.5 Media armónica

Es la media aritmética de los recíprocos y se toma el recíproco de esta media; o también, es el recíproco de la media aritmética del recíproco de las observaciones.

Por lo general se emplea para promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.; no se recomienda en distribuciones de variables con valores pequeños.

Entre las ventajas e inconvenientes que presenta es que en el cálculo intervienen todos los valores de la distribución; y, el cálculo no tiene sentido cuando algún valor de la variable toma valor cero.

Ejemplo:

Caso 1obrero a :

2 corbatas por horaobrero

b :3 corbatas por hora

71

1.- considera al tiempo una constante y la producción un variable.

( 2 + 3 ) / 2 = 2,5 corbatas por hora

Caso 2obrero a: 30 minutos por corbata obrero b: 20 minutos por corbata

2.- cuando se utiliza el tiempo como una variable debe emplearse la

5.6 Media Cuadrática

Es otra medida de tendencia central. Es muy útil cuando las variables toman valores positivos y negativos. Se la utiliza para obtener un promedio que no refleje los efectos del signo, para lo cual, se elevan al cuadrado todas las observaciones desapareciendo los signos

72

CorbataMinH

/24120

5

220

130

11

HX__

negativos. Es más alta que la media aritmética, y por tanto que la geométrica y armónica.

La media cuadrática, es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos.

Su fórmula es:

EJERCICIOS

1. Calcula la media, mediana y moda de esta distribución.

x f fa Fi

1 4 0,08

2 4

3 16 0,16

4 7 0,14

5 5 28

6 38

7 7 45

8

73

http://es.wikipedia.org/wiki/Ra%C3%ADz_cuadrada

2. Observada la producción en miles de arandelas de un conjunto de talleres, se han obtenido los siguientes datos:

Alquileres en miles de

pesetasni

1 - 15 2416 – 30 8631 – 45 13646 - 60 4661 - 75 1276 - 90 4

Calcular la moda y la mediana.

3. Los jugadores de un determinado equipo de baloncesto se clasifican por altura según la tabla siguiente:

Altura 1,70-1,75 1,75-1,80 1,80-1,85 1,85-190

1,90-195 1,95-2,00Número jugadores

1 3 4 8 5 2

Se pide analizar la variable altura para la media, la moda y la mediana.

Ejemplo: En una librería se registran la ventas y se desea:

74

a. Obtener el precio medio por semestre.

b. Para el total de libros vendidos al año el precio medio, el más frecuente y el que divide en dos partes iguales la distribución de frecuencias.

Precio medio en 1er semestre: 2746.5/71= 38.68 dólares

Precio medio en 2do semestre: 2359/58 = 40.67 dólares

Media aritmética:

Precio medio en el 1er semestre: 2746.5/71= 38.68Precio medio en el 2do semestre: 2359/58 = 40.67

Media aritmética: 5105.5 / 129 = 39.58 dólares.

75

Precio x f1 f2 x*f1 x*f2 f1+f2 x(f1+f2)

10 - 25 17,5 22 12 385 210 34 595

26 - 41 33,5 14 16 469 536 30 1005

42 - 57 49,5 25 22 1238 1089 47 2326,5

58 - 73 65,5 10 8 655 524 18 1179

71 58 2747 2359 129 5105,5

6.0 MEDIDAS DE POSICIÓN

Conocidas también como medidas de dispersión se emplean para describir la variación o dispersión en un conjunto de datos.

Lo constituyen indicadores estadísticos que muestran la frecuencia acumulada hasta un valor k cualquiera. Son valores de la muestra o población que puede tomar una variable. Los valores se distinguen por agrupar a cierto porcentaje de observaciones en la muestra o población.

Las medidas de posición, parámetros de posición o cuantiles se caracterizan por ser medidas de posición, aun cuando pueden ser considerados como medidas de centralización o como medidas de dispersión.

Los cuantiles son valores de la distribución de un conjunto de observaciones que la dividen en partes iguales, es decir, en intervalos que comprenden el mismo número de valores. Cuando la distribución contiene un número alto de intervalos o de marcas de clase y se requiere obtener un promedio de una parte de ella, se puede dividir la distribución en cuatro, en diez o en cien partes.

El cuantil se define como el valor de la variable que puede o no estar incluida en la muestra y que supera al % de los datos de la muestra. Permite conocer la posición en que se encuentra un valor dado en relación al conjunto de la muestra o población.

76

Entre las medidas de posición se encuentran:

Los cuartiles dividen a la distribución en cuatro partes.Los deciles dividen a la distribución en diez partes. Los percentiles dividen a la distribución en cien partes.

6.1 Cuartiles

Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales por tres medidas cuartiles, en los que cada uno de ellos concentra el 25% de los resultados.

El cuartil se representa por Qk

k = Número del cuartil 1, 2 o 3

Qk = q-ésimo del cuartil

a. Q1= Valor de la variable que es igual o menor al 25% de los valores de una variable.

b. Q2= Valor de la variable que agrupa el 50% de los datos. Es idéntico a la mediana.

c. Q3= Valor de la variable que es igual o menor al 75% de los valores de una variable.

d. Q4 = Valor de la variable que agrupa el 100% de los datos.

77

Ejemplo: De los datos registrados de los sueldos de treinta trabajadores localizar los valores que correspondan a los Cuartiles.

XX f f a240240 11 3030235 22 2929225 33 2727

Q3 200 55 2424195 33 1919

Q2 185185 22 1616180180 33 1414175 22 1111

Q1 170170 55 99165 44 44

Total……. 3030

78

N: Es igual a la sumatoria de las frecuencias.

PK : Punto del cuartil correspondiente.

P1 = N/4 = 30/4 = 7,5 En relación a este valor ubicamos en la columna de fa el valor inmediato superior; esto es el 9.

Luego, el primer cuartil Q1 corresponde al valor de la variable 170.

Q1 = 170

P2 = 2N/4 = (2 * 30)/4 = 15 Luego, Q2 = 185

P3 = 3N/2 = (3 * 30)/4 = 22,5 Luego, Q3 = 200

El procedimiento responde al cálculo de una serie estadística de frecuencia.

Para el cálculo de Cuartiles de una serie estadística de intervalos se lo hará con el siguiente ejemplo:

Las marcas en segundos (X) realizados por atletas en una competencia de 10 000 m planos se agruparon en la siguiente tabla:

X f faQ 46 - 49 18 54Q 42 - 45 14 36Q 38 - 41 1010 22

34 - 3737 66 1230 - 33 4 626 - 29 2 2Total……. 54

79

: Es igual a la sumatoria de las frecuencias.

facm: Frecuencia acumulada menor.

I: Ancho del intervalo.

P1 = /4 = 54/4 = 13,5 El valor inmediato superior

en la fa es el 22, luego el cuartil está en el intervalo 38 – 41 y se lo determina con la siguiente fórmula:

Q1 = Lri + [ (( N/4 ) – f acm )/ f ] * I

P1 = 13,5Q1 = 37,5 + [(13,5 / 12) / 10] * 4 = 37,95

P2 = 2N/4 = (2*54) /4 = 27Q2 = 41,5 + [(27 / 22) / 14] * 4 = 41,85

P3 = 3N/4 = (3*54)/4 = 40,5Q3 = 45,5 + [(40,5) / 12) / 18] * 4 = 46,25

Resultados:

El 25% de los atletas hicieron 37,95 segundos o menos.El 50% de los atletas hicieron 41,85 segundo o menos.El 75% de los atletas hicieron 46,45 segundos o menos.

6.2 Deciles

Son medidas de localización que dividen un conjunto de observaciones en diez partes iguales, por consiguiente, habrán 10 deciles representado como dk.

Los deciles establecen nueve cortes para definir de diez en diez por ciento los valores de la distribución; de tal manera que el primer decil deja por debajo una décima

80

parte de la distribución, el segundo dos décimas partes, etc., hasta nueve deciles.

k: Numeración de los deciles.

dk: Representa el decil correspondiente.

d1 = Valor de la variable que agrupa el 10% de los datos.



d4= Valor de la variable que agrupa el 40% de los datos.






N = 10 deciles.

La fórmula para calcularlo es:

81

Donde:

Lri : Límite real inferior en el decil k.Σf : Sumatoria de frecuencias.fam : Frecuencia acumulada menor.fdk : Frecuencia del decil k.I : Intervalo de clase del decil k.

Ejemplo: Hallar los deciles de los datos registrados de producción lechera en 125 granjas agropecuarias.

PRODUCCIÓN f fa Pk

95 - 99 4 12590 - 94 7 12180 - 84 12 114 P9

75 - 79 14 102 P8

70 - 74 19 88 P6

65 - 69 13 69 P5

60 - 64 16 56 P4

55 - 59 10 40 P3

50 - 54 15 30 P2

45 - 49 8 15 P1

40 - 44 5 735 - 39 2 2

Total…….. 125

82

Para cada uno de los valores encontrados de Pk se toma en la columna de las frecuencias acumuladas (fa), el valor inmediato superior.

Para P1=16,1 el valor inmediato mayor es 24, luego, en esta posición se encontrará el decil uno (d1) y corresponderá a uno de los valores dentro del intervalo

83

Se procede a determinar la posición de los deciles:

P1= P6=

P2= P7=

P3= P8=

P4= P9=

de clase 85 – 89 que se lo determinará de la siguiente manera:

dk=

d1= 44,5 +

d2 = 49,5 +

d3 = 54,5 +

d4 = 59,5 +

d5 = 64,5 +

84

d6 = 69,5 +

d7 = d6

d8 = 74,5 +

d9 = 79,5 +

6.3 Percentiles

Los percentiles son medidas de posición relativa que dividen el conjunto de datos en cien partes iguales, son como los deciles pero de uno en uno por ciento, y por tanto son noventa y nueve. Los percentiles representan los valores de la variable que están por debajo de un Porcentaje. Ejemplo, el percentil 48 deja por debajo al 48% de la distribución.

Relacionando las medidas de posición, se tiene que la mediana es el segundo cuartil, 5º decil y 50º percentil, así: Mn=Q2= d5=P50. El percentil nos permite des-agregar más aún la distribución que el decil.

85

Determinación de la posición del punto percentil, se lo hace:

Pk =

Donde:

k: Valor del punto percentil 2, 3, 10, 30, 40, 50, etc.

Σf: Sumatoria de frecuencias.

La fórmula para calcular el valor percentil es:

Donde:

Vk: Valor del percentil que se busca.

Lri: Límite real inferior.

Pk: Punto percentil k.

f am: Frecuencia acumulada menor.

f: Frecuencia en el punto percentil.

I: Ancho del intervalo de clase.

Ejemplo: De un registro de la altura de reclutas de un cuartel se está interesado en conocer el 25o punto percentil, 40o y 65o

ALTURA f f a179 - 183 22 115

86

174 - 178 28 93 P65

169 - 173 15 65164 - 168 32 50 P25

y 159 - 163 18 18Total…… 115

V40 = V25 = 165,2

Respuesta:

Tanto el 25% como 40% del total de los reclutas tiene una altura menor a los 165,2 cm: mientras que el 60% de ellos tienen una altura menor a los 176,7 cm.

87

EJERCICIOS

En el estudio de un cierto fenómeno se obtiene la siguiente tabla:

xi 7 10 12 16 19 20 21ni 6 7 16 17 22 19 17

Calcular los quartiles Q1 y Q3 correspondiente.

Los jugadores de un determinado equipo de baloncesto se clasifican por altura según la tabla siguiente:

Altura 1,70-1,75 1,75-1,80 1,80-1,85 1,85-190

1,90-195 1,95-2,00Número jugadores

1 3 4 8 5 2

Se pide calcular los cuartiles 1 y 3.

88

7.0 MEDIDAS DE DISPERSIÓN

Tratan de medir el grado de dispersión que tiene una variable estadística respecto a una medida de posición o tendencia central. La representatividad proviene de su dispersión, a mayor dispersión menor representatividad de la medida de posición y viceversa. Se entiende por dispersión o variabilidad, a la mayor o menor separación de los valores de la muestra, respecto de las medidas de centralización que hayamos calculado.

Podemos concretar diciendo que las medidas de dispersión se basan en la idea de medir las diferencias entre unos datos y otros midiendo las diferencias de cada dato con la media, esto es, usando las desviaciones; pero como éstas siempre suman cero, es preciso considerar su valor absoluto o su cuadrado para que ello no ocurra.

Para comprender el comportamiento de una serie de datos no es suficiente determinar las medidas de tendencia central, es importante conocer cuan alejados se encuentran los datos respecto a su punto de concentración.

La importancia del estudio de las medidas de variación es que pueden medir el grado de variación de una serie de datos y cuan representativo de la distribución es el promedio.

Las medidas de dispersión más utilizadas son:

Recorrido.

89

Desviación media. Varianza. Desviación estándar. Coeficiente de variación.

7.1 Recorrido.

En una observación cuyos datos son numéricos, el recorrido o amplitud es la diferencia entre los valores extremos. El valor de la diferencia depende de los valores de los individuos que se encuentran en los extremos.

El recorrido o amplitud (A) es la diferencia entre el mayor valor y menor valor que se presente entre los datos.

Ejemplo: Si se tienen los valores 22 25 28 30 31 35 36 37 44 47 48

A = 48 - 22 = 26

90

7.2 Desviación Media

La desviación media (Dm) es la media aritmética de los valores absolutos de las desviaciones con relación a un valor medio. Se puede calcular a partir de la media aritmética o de la mediana.

La desviación media es útil para tratar con pequeñas muestras que no requieren análisis muy complejos.

Para conocer con un solo indicador que tan disperso se encuentran un conjunto de datos a un punto de concentración, debemos como primera medida, calcular la distancia de cada dato respecto a la media aritmética.

Por ejemplo:

5 4 2 1 1 1 3 23 2 1 32 1 3 2

4 2 1 1

Tenemos que la media aritmética es 2.2 (indicador de tendencia central por excelencia). El primer dato (5), se aleja de la media en 2.8 hacia la derecha.

91

Gráficamente tendríamos:

2.8

1.8

92

1 2 3 4 5

Para el segundo dato (4) la distancia es de 1,8 respecto a la media aritmética:

Para responder a la pregunta de ¿qué tan disperso están los datos respecto a la media aritmética?, recurriremos nuevamente al promedio simple. Para llegar a una fórmula básica de dispersión, en que las distancias positivas y negativas no se eliminen, modificaremos la fórmula anterior para trabajar solo con distancias positivas mediante el valor absoluto:

Para una serie estadística la desviación media se calcula con la siguiente forma:

Σ(X - ): Sumatoria de las diferencias entre el valor de

la variable y la media aritmética.

Σd : Valor absoluto de la sumatoria de las desviaciones.

93

1) Calcular la desviación media para las densidades de los líquidos.

Densidad Desviación1,26 0,321,06 0,121,04 0,101,02 0,080,90 -0,040,79 -0,150,73 -0,210,72 -0,227,52 1,24

2) Cálculo de la desviación media para una serie estadística de frecuencia.

Se considera en el ejemplo los datos de las mismas densidades pero repetidos.

Densidad X

f X.f d f.d1,26 2 2,52 0,31 0,621,06 1 1,06 0,11 0,111,04 3 3,12 0,09 0,271,02 6 6,12 0,07 0,42

94

0,16 es el valor con que se separan cada una de las densidades con respecto a la media aritmética.

0,90 1 0,90 -0,05 -0,050,79 3 2,37 -0,16 -0,480,73 2 1,46 -0,22 -0,440,72 2 1,44 -0,23 -0,46

Total….. 20 18,99 2,85

3) Cálculo de la desviación media para una serie estadística de intervalos.

Ejemplo: Se registraron las siguientes velocidades iniciales de las balas que imprimieron 33 fusiles, calcular su desviación media.

X f Mc Mcs u f.u d f.d

851 - 900 6 875,5 3,00 18,00 118,2 709,27

801 - 850 4 825,5 2,00 8,00 68,2 272,85

751 - 800 5 775,5 1,00 5,00 18,2 91,06

701 - 750 7 725,5 725,5 0,00 0,00 -31,8 -222,52

651 - 700 6 675,5 -1,00 -6,00 -81,8 -490,73

600 - 650 5 625,0 -2,01 -10,05 -132,3 -661,44

Totales….. 33 20,98 2002,83

95

Donde:

Mc: Punto medio de clase.Mcs: Punto medio de clase supuesto.

7.3 Varianza

La variancia es el promedio de la sumatoria de los cuadrados de las desviaciones. Mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética. Es un indicador del alejamiento de los valores respecto de su valor medio.

El valor de la variancia depende de las desviaciones, cuanto mayor sean las desviaciones en relación a la media aritmética, mayor será el valor de la variancia.

En la varianza el valor de sus unidades no la podemos usar porque se expresan al cuadrado; para hacerlo, es preciso tomar la raíz cuadrado de los mismos, este nuevo valor, se lo conoce como desviación estándar.

96

. I

=

Donde:

N: Número total de casos.

La varianza para datos de la población se representa con σ2 y para datos muestras con S2.

Las fórmulas deben definirse según se trate de datos agrupados o no.

7.4 Desviación Estándar

La desviación estándar es la raíz cuadrada del promedio de la desviación o diferencias de cada uno de los valores con respecto a la media. Equivale a la raíz cuadrada de la varianza.

El mayor valor o menor valor de la desviación estándar, expresa la mayor o menor desviación de los datos respecto a la media. Si no existe variación en los datos o variables observadas, todas ellas serán iguales a su media; por lo tanto, las desviaciones respecto a la media serán iguales a cero y el valor de la desviación estándar es cero.

97

Para el cálculo de la desviación con datos agrupados o no se precede de la siguiente forma:

7.4.1 Desviación típica de una serie estadística.

Ejemplo: Calcular la desviación estándar en decibelios (dB), con los datos de ruido medidos en 10 sitios diferentes.

x x^267,9 4610,4170,2 4928,0468,8 4733,4477,1 5944,4162,7 3931,2971,1 5055,2181,9 6707,6163,2 3994,2482,7 6839,2978,1 6099,61723,7 52843,55

n=10

98

s = 6,85

7.4.2 Desviación típica de una serie estadística de frecuencia.

Ejemplo: Determinar la desviación típica de las lecturas de temperatura obtenida por una estación meteorológica.

x f f.x x^2 f.x^227,1 5 135,5 734,41 3672,0527,4 2 54,8 750,76 1501,5228,9 6 173,4 835,21 5011,2629,1 4 116,4 846,81 3387,2429,2 3 87,6 852,64 2557,9229,5 5 147,5 870,25 4351,2529,8 4 119,2 888,04 3552,1630,3 7 212,1 918,09 6426,63

Total.. 36 1046,5 6696,21 30460,03

99

7.4.3 Desviación típica de una serie estadística de intervalo.

Ejemplo: En cuarenta sitios de la ciudad se midieron los niveles de ruido, calcular las variación de las variables o datos observados en torno al promedio.

x f Mc Mc^2 f.Mc f.Mc^2

80,6 - 84,6 5 82,6 6822,8 413 34113,8

75,6 - 79,6 9 77,6 6021,8 698,4 54195,84

70,6 - 74,6 7 72,6 5270,8 508,2 36895,32

65,6 - 69,6 8 67,6 4569,8 540,8 36558,08

60,6 - 64,6 4 62,6 3918,8 250,4 15675,04

55,6 - 59,6 4 57,6 3317,8 230,4 13271,04

50,6 - 54,6 3 52,6 2766,8 157,8 8300,28

Totales…… 40 2799,0 199009,4

100

S = 1,97

S= 8,87

EJERCICIOS

Se ha preguntado a 40 personas el número de personas que forman sus hogares, teniendo los siguientes resultados:

No personas en el hogar 2 3 4 5 6 7Frecuencia 4 11 11 6 6 2

a. Calcula la media, la mediana, la moda y la desviación típica.

b. Haz el diagrama correspondiente.

101

7.5 Coeficiente de Variación

El Coeficiente de Variación es una medida de variación relativa, más que una medida de variación absoluta, expresa la desviación estándar como un porcentaje de la media.

Se define al coeficiente de variación de Pearson como el cociente entre la desviación estándar y la media aritmética de una distribución.

La fórmula está dada por la expresión:

Como la desviación estándar y la media se expresan en la misma unidad de medida, ésta se anula, obteniéndose una unidad de medición independiente o medida adimensional.

El coeficiente de Pearson se usa cuando se trata de comparar la dispersión entre dos poblaciones en las que las unidades de medida (desviación estándar) son distintas, o que aún teniendo la misma unidad de medida difieren en sus magnitudes.

Ejemplo: Se desea comparar dos muestras sobre la producción de dos parcelas de diferentes años que tienen los siguientes resultados;

102

Datos Parcela 1 Parcela 2

Periodo 3 años 2 añosProducción media 620 Kg 390 KgDesviación estándar 5 Kg 5 Kg

La comparación de las desviaciones estándar podría llevar a concluir que las dos muestras poseen igual variabilidad. Sin embargo, si se calculan los coeficientes de variación para las parcelas se tiene los siguientes resultados:

Parcela 1:

Parcela 2:

Los resultados del coeficiente de variación expresan que a pesar de que las muestras tienen el mismo valor de desviación estándar tienen diferentes dispersiones de sus datos respecto a la media.

Ejemplo: Así, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de 69,6 kg. y su desviación típica (s) = 10,44 y la TAS de los mismos (150, 170, 135, 180 y 195 mm Hg) cuya media es de 166 mm Hg y su desviación típica de 21,3.

103

La pregunta sería: ¿qué distribución es más dispersa, el peso o la tensión arterial? Si comparamos las desviaciones típicas observamos que la desviación típica de la tensión arterial es mucho mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variación:

CV de la variable peso =

CV de la variable TAS =

A la vista de los resultados, observamos que la variable peso tiene mayor dispersión.

A diferencia de la desviación estándar que se expresa con la misma unidad de los datos observados, el coeficiente de variación se expresa en porcentaje, lo cual, facilita comparar el nivel de dispersión de dos muestras.

Por ejemplo, no se puede comparar el nivel de dispersión de una serie de datos de densidad de metales que se expresa gr/cm3, con otra serie que corresponda a la resistencia a la compresión que se expresa en kg/cm2. En cambio, sus coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.

104

Se puede concluir que el coeficiente de variación, además, presenta los siguientes aspectos:

a. Es un valor estadístico útil para comparar la dispersión de conjuntos de datos que tienen distintas desviaciones estándar y distintos promedios.

b. El coeficiente de variación pierde su utilidad cuando la media se aproxima a cero.

EJERCICIOS

1. Los jugadores de un determinado equipo de baloncesto se clasifican por altura según la tabla siguiente:

Altura1.71-1.75

1.76-1.80

1.81-185

1.86-1.90

1.91-1.95

1.96-2.00

# jugadores

1 3 4 8 5 6

Se pide analizar calcular la desviación típica.

105

2. La media y la desviación típica de los puntos conseguidos por Iliana y Rocío en una semana de entrenamiento jugando al baloncesto han sido las siguientes: media de Iliana 22 puntos y desviación típica 4,106. Media de Rocío 22 puntos y desviación típica 2.

a. Calcula el coeficiente de variación de cada una de ellas.

b. ¿Cuál de las dos ha sido más regular?

8.0 MEDIDAS DE DISTRIBUCIÓN

Las medidas de distribución permiten identificar la forma en que se encuentran dispersos los valores de las observaciones en una representación gráfica. La importancia de estas medidas se fundamenta en establecer la distribución prescindiendo del gráfico.

Las medidas de distribución ya no trata de determinar la magnitud de la dispersión de las variables con respecto a la media, sino, la de analizar como los datos se distribuyen en torna a ella.

Las principales medidas de distribución son las de Asimetría y la de Curtosis

8.1 Asimetría

106

La asimetría es la medida que permite determinar si los datos se distribuyen de manera uniforme alrededor de su valor medio. Esta medida cuantifica el grado de asimetría de la distribución en torno a una medida de tendencia central.

De acuerdo como se distribuyen los datos respecto al eje de simetría se presentan los siguientes casos:

Simetría positiva, cuando los datos están por arriba de la media aritmética.

Asimetría negativa cuando la agrupación de valores está por debajo de la media.

107

Simétrica si aproximadamente los valores de la observación se distribuyen por igual a ambos lados de la media.

La asimetría se puede calcular por medio del Coeficiente de asimetría o de Fisher con la siguiente ecuación:

Donde:

g1: Coeficiente de asimetría de Fisher.Xi: Valores de la variable

Media aritmética

f : Frecuencia de cada valor

Para los valores del coeficiente se tiene que:

108

g1 = 0 La distribución es Simétrica. Existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).

g1 > 0 La curva es asimetría positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media.

g1 < 0 La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media. Desde luego entre mayor sea el número, positivo o negativo, mayor será la distancia que separa la aglomeración de los valores con respecto a la media.

8.2 Coeficiente de Curtosis

Es una medida de asimetría que expresa la intensidad de concentración de los valores en la región central de la distribución.

Según Curtosis se presentan tres tipos de distribución:

Distribución mesocúrtica: Se expresa cuando el grado de concentración se encuentra alrededor de los valores

109

centrales de la variable. Cuando esto ocurre se tiene entonces una distribución normal.

Distribución leptocúrtica: Es cuando las observaciones presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

110

Curva Mesocúrtica

Curva Leptocúrtica

Distribución platicúrtica: Es cuando existe un bajo grado de concentración alrededor de los valores centrales de la variable.

Curva Platicúrtica

La fórmula que define el cálculo del Coeficiente de Curtosis es la siguiente:

Para los diferentes valores del coeficiente se tiene:

g2 = 0 (distribución mesocúrtica). g2 > 0 (distribución leptocúrtica).g2 < 0 (distribución platicúrtica).

111

Ejemplo: Calcular el coeficiente de Curtosis para los datos de resistencia óhmica obtenida de algunos de aparatos eléctricos.

Valor f Σ(Xi-Xm)^4*ni Σ(Xi-Xm)^2*ni2,7 1 4,5892 2,14222,8 4 13,8310 7,43802,9 4 10,1988 6,38713,4 2 0,6801 1,16634 1 0,0007 0,0268

4,5 2 0,0256 0,22634,7 3 0,2483 0,86314,8 3 0,4920 1,21495,2 4 4,6143 4,29625,3 3 5,0025 3,87405,5 3 9,5680 5,357611 30 49,2505 32,9924

Media= 4,16

El resultado de -1,5072 correspondiente al Coeficiente de Curtosis señala que se trata de una distribución platicúrtica, esto es, de una baja concentración de los valores centrales de la distribución.

112

9.0 ANÁLISIS DE ASOCIACIÓN.

Es muy frecuente encontrar variables que se encuentran relacionadas entre sí; por ejemplo, la intensidad de la corriente eléctrica se asocia con otros factores como el voltaje y la resistencia. En el crecimiento de una planta están relacionados factores como el tipo del suelo, cantidad de agua, disponibilidad de nutrientes, etc.

La asociación o forma como están vinculadas las variables nos lleva frecuentemente a formular preguntas como: ¿la densidad de los metales está relacionado con su resistencia?, ¿el diámetro de un cableado tiene que ver con la intensidad de la luz eléctrica?, ¿la demanda de un artículo dependerá de su precio en el mercado?

El análisis de asociación de variables permite establecer la relación entre dos o más variables que expresen un cierto grado de dependencia o asociación entre ellas; asociación, que puede medirse por medio de una función o modelo matemático.

El problema principal cuando se analizan datos bivariantes (se caracterizan porque tienen dos medidas, ejemplo: peso y altura, diámetro y resistencia) o multivariantes (con tres medidas, ejemplo: longitud, diámetro y resistencia) es llegar a descubrir y medir la asociación y covariación ente las variables, así como, determinar como las variables varían juntas. A este procedimiento se conoce como Estimación por Asociación.

113

La estimación por asociación es una predicción que busca expresar la naturaleza de las relaciones de las variables, en forma matemáticamente precisa, de modo que se pueda predecir el valor de una variable con base en la otra. Dicha estimación se puede lograr por medio del análisis de regresión y del análisis de correlación.

9.1 Covariancia

Es la medida de la asociación entre las magnitudes de dos características. Cuando la asociación de las magnitudes es pequeña o nula la covariancia tiende a cero.

La covariancia es positiva cuando los valores grandes de una característica tienden a asociarse con los valores grandes de otra. Es negativa, si los valores grandes de una características se asociación con los valores pequeños de otra característica.

Dos variables están variando conjuntamente y en el mismo sentido cuando al crecer los valores de cada uno de ellas, aumentan los valores los valores de la otra. Pero también pueden variar en sentido contrario, esto es, cuando crecen los valores de la una, disminuyen los de la otra.

La variancia de la población X y Y se simboliza con σxy; y los de la muestra, por sxy.

114

La fórmula de la covariancia es:

o

Ejemplo: Calcular el grado de asociación que existe entre el diámetro y la longitud de las probetas.

Var Valores SumasY 4 6 8 9 12 8 10 12 8 6 83X 12 10 19 12 15 20 24 18 25 15 170

Media de Y = 8,3

Media de X = 17,0

115

9.2 Correlación

Permite analizar en una distribución bidimensional la relación que guardan entre sí dos variables. La intensidad de esta relación puede ser determinada por un índice numérico conocido como coeficiente de correlación lineal.

La aplicación del coeficiente de correlación es posible cuando la relación entre las variables es lineal, esto es, si después de graficar los pares de valores de las variables se observa que la nube de puntos se aproxima a una recta.

El coeficiente de correlación de una población bidimensional se representa por (rho), siendo su estimador r.

La correlación puede ser lineal o lineal. Es lineal cuando la relación entre las dos variables puede ser representada por una línea recta, y es no lineal cuando la correlación está representada por una línea curva.

Además, de acuerdo a los fenómenos que relaciona a dos variables, la correlación puede ser perfecta, imperfecta y nula.

En la perfecta la variación de los fenómenos se corresponden en forma igual.

En la correlación imperfecta la variación de uno de los fenómenos se pude corresponder con la variación del

116

otro fenómeno, pero no se puede llegar al valor de una determinación.

En la nula, no existe relación entre los fenómenos.

De acuerdo con el signo la correlación se considera positiva o directa y negativa o inversa.

Es positiva cuando las dos variables aumentan o disminuyen en el mismo sentido.

Es negativa cuando se comportan en sentido contrario.

9.2.1 Diagrama de Puntos o dispersión

Es un gráfico que representa un conjunto de datos y de conclusiones deducibles de esos datos.

Los datos representan los valores de las variables X y Y que pueden encontrarse distribuidos en el primer cuadrante de un sistema de coordenadas; y, el diagrama de dispersión que se establezca se obtendrá por la ubicación de los valores de X en la abscisa y de la variable Y en la línea vertical. La primera se toma como la variable independiente y la Y como la variable dependiente.

De acuerdo con los diagramas de dispersión se ilustran los tipos de correlación.

117

118

En el diagrama de la Figura A todos los puntos tienen una tendencia situarse sobre una línea recta ascendente de izquierda a derecha, con lo que se define una correlación perfecta.

En el diagrama de la Figura B, los puntos también caen sobre una línea recta, pero descendente; siendo también, una correlación perfecta.

La correlación puede asumir valores positivos o negativos. La correlación es positiva cuando una de las variables incrementa la otra se incrementa también y viceversa (cuando ambas decrecen).

La correlación es negativa cuando una de las variables se incrementa, la otra disminuye.

En las Figura C, D y F se presenta una relación evidente, pero ésta no es de tipo lineal. No existe correlación cuando graficado los puntos se muestran como en la Figura G.

119

La fórmula del coeficiente de correlación lineal simple es:

El coeficiente de correlación siempre debe encontrarse en el rango de -1 a +1, lo que equivale a una correlación perfecta.

Como el coeficiente de correlación es una expresión numérica que expresa el grado de concomitancia que existe entra las dos variables, es importante definir la significación de sus valores:

0.70 ≤ r ≤ +1 Correlación alta, perfecta y positiva.0.40 ≤ r ≤ 0.69 Correlación moderada.0.10 ≤ r ≤ 0.39 Correlación baja. r = -1 Correlación alta, perfecta y negativa.

A partir del coeficiente de correlación lineal se calcula el coeficiente de determinación, el cual, permite evaluar qué porcentaje de la variabilidad total de la variable dependiente es atribuible a la variable independiente.

El coeficiente de determinación (rd) equivale al valor del coeficiente de correlación lineal elevado al

cuadrado.

120

9.3 Regresión Lineal Simple

Las variables cuantitativas en la mayoría de los casos se encuentran relacionadas en algún grado con otras. La dependencia, asociación o forma de relacionarse, es lo que hace posible que una de las variables pueda matemáticamente expresarse en función de la otra. Por ejemplo: la resistencia a la flexión está relacionada con la densidad del cuerpo; la resistencia al esfuerzo cortante con el diámetro de una soldadura; la dureza de un cuerpo está relacionada con su densidad; la intensidad del viento se relaciona con su velocidad; el flujo de las emisiones gaseosas con la temperatura; el monto de un salario con el nivel educativo, etc.

En este tipo de relación se considera al valor de la variable dependiente como Y, que depende en cierto grado de la variable independiente X. La variable dependiente es una variable aleatoria, pero los valores de la variable independiente son cantidades fijas que el analista o investigador selecciona y controla.

La relación media entre X y Y se puede describir con una ecuación lineal, cuya representación geométrica es una línea recta.

121

La altura de la línea señala un valor medio de Y para un valor fijo de X.

Cuando X = 0 el valor medio de Y es igual a A.

El valor de A se llama ordenada al origen y es el punto en que la línea recta cruza el eje Y.

La pendiente es el grado de inclinación de la recta. Si es positiva, la recta es creciente. Si es negativa es decreciente. Es el cociente entre el incremento que se produce en la variable dependiente, Y, cuando se incrementa la variable independiente, X.

La pendiente se mide por B que da la cantidad media de cambio de Y por unidad de cambio en el valor de X. B indica el tipo de relación entre X y Y.

La ecuación de regresión para el modelo de regresión lineal bivariante es:

122

Donde A y B son los coeficientes de regresión poblacional. La tarea principal del análisis de la regresión es estimar A y B.

Se puede representar por a y b las estimaciones de A y B, entonces la ecuación de regresión muestral se convierte en:

y = a + bx

de donde:

El coeficiente a se puede determinar también como:

: Media aritmética de valores de x

: Media aritmética de valores de y

Ejemplo:

123

Las siguientes muestras de acero con diferentes porcentajes de concentraciones de carbono1 fueron sometidas a ensayo de resistencia a la tensión (lb/plg2), teniéndose los siguientes datos:

% Carbono 6 22 28 36 41 48 59 72 71

Tensión (miles) 85 110 132 158 201 208 215 275 284

Determine la relación de dependencia que existe entre las variables de la composición de los aceros a diferentes porcentajes de concentración de carbono con la resistencia a la tensión.

Cálculos: Para simplificar las operaciones de cálculo la tensión ha sido dividida para mil.

%Carbonox

Tensióny xy x^2

6 85 510 3622 110 2420 48428 132 3696 78436 158 5688 129641 201 8241 168148 208 9984 230459 215 12685 3481

1 Los aceros al carbono son una mezcla de hierro y carbono, siendo el hierro el solvente y el carbono el soluto. Los átomos de carbono se ubican en los intersticios que existen entre los átomos de hierro.

124

72 275 19800 518471 284 20164 5041383 1668 83188 20291

= 42,55

= 185,44

Respuesta: En cuanto a la relación de dependencia se tiene que por cada unidad de incremento porcentual de carbono en el acero, su resistencia se incrementa 3,06 veces.

Luego, la ecuación de la recta que calcula la predicción de los valores es:

125

a = 185,44 – 3,06*42,55 = 55,26

El ajuste de la recta de regresión y el cálculo de los coeficientes a y b, también puede ser deducidos con el siguiente procedimiento.

a. Construcción del diagrama de dispersión.

b. Uso de fórmulas a desarrollar:

y = a + bx 1

2

126

Tens

ión

% Carbono

y

X

3

c. Elaboración de la tabla de valores:

%Carbonox

Tensióny xy x^2

6 85 510 3622 110 2420 48428 132 3696 78436 158 5688 129641 201 8241 168148 208 9984 230459 215 12685 348172 275 19800 518471 284 20164 5041383 1668 83188 20291

Teniendo los siguientes valores:

d. Sustitución de valores en las fórmulas 2 y 3

127

1668 = 9(a) + b(383)

83 188 = a(383) + b(20 291)

e. Se resuelve el sistema de ecuaciones resultantes y se tiene que:

b = 3.06 a = 55.26

y = 55.26 + 3.06x

Ejemplo.

Se desea conocer el esfuerzo de corte que requiere para cortar un material con una dureza de 760 kg/cm2. Los datos obtenidos de los ensayos fueron los siguientes:

Esf corte

18.8 35.9 7.6 14.8 18.9 24.5 35.7 14.9 22.0 26.8

Dureza 331. 56.9 6.8 27.7 45.7 64.5 72.8 86.0 48.0 47.6

Además, dibuje el gráfico de dispersión y la recta de regresión.

Ejemplo.

128

Si el punto de intersección de la recta de regresión coincide con el punto de cruce en origen de las coordenadas, cuál sería el esfuerzo de corte sabiendo que el valor de la pendiente es de 1.02 y la dureza de 65.22.

129

9.4 La Regresión como ecuación predictiva

La ecuación de la regresión muestral se conoce como ecuación predictiva, porque su función es predecir el valor medio de y; o, el valor de una observación individual de y asociado con un valor determinado de x.

La eficiencia predictiva depende de la variabilidad de los valores individuales de y provenientes de los valores calculados (promedios) de y asociados con los valores de x.

Ejemplo: Si se desea predecir la resistencia de un acero para una concentración de carbono de 20%, se tendría lo siguiente:

yc = 55,26 + 3,06 * 20 = 116,46

Como los valores de la tensión se dividieron para mil, ahora el resultado debe multiplicarse por mil, entonces, la resistencia que se tiene es de 116.460 lb/plg2

130

10.0 ANÁLISIS DE VARIANZA DE LA LÍNEA DE REGRESIÓN SIMPLE.

Es importante conocer el nivel de precisión de la línea regresión con los datos. La línea de regresión es una media movible que proporciona un valor medio de Y asociada con un valor particular de X.

Los valores observados de Y pueden estar por arriba o por debajo de la línea de regresión, de la misma forma como se ubican respecto a la media general de Y.

El análisis de variancia se utiliza para comparar las medias de las variables que participan en un experimento, para probar e inferir si entre ellas existen o no verdaderas diferencias.

Se consideran tres las etapas correlativas que hay que observar para desarrollar el método del análisis de variancia, las cuales son:

a. A su vez, tiene las siguientes fases:i. Se debe identificar las fuentes o causas de

variación con sus correspondientes grados de libertad.

ii. Se determina las sumas de cuadrados para cada una de las fuentes de variación.

iii. Se calcula las variancias o cuadrados medios.

131

iv. Se realiza la prueba de significación, conocida también como Prueba de F o razón de las variancias.

b. Se elabora el cuadro del Análisis de Variancia.c. En esta etapa se procede a la interpretación de los

resultados del análisis estadístico.

El análisis de varianza considera básicamente determinar los siguientes valores:

La suma de cuadrados corregidos para Y.

La suma de cuadrados de reducción o suma de cuadrados de la regresión. SC REDUCCIÓN.

La suma de cuadrados residual. SC Residual.

La suma de cuadrados corregidos para Y, estima la cantidad de variación de los valores individuales de Y respecto al valor medio de Y. La fórmula que lo calcula es:

La suma de cuadrados de reducción determina la cantidad de variación en Y que está asociada con la regresión sobre X. Su fórmula:

132

La suma residual de cuadrados constituye la porción de la variación total en Y que no está asociada con la regresión y se deduce con la fórmula:

SC RESIDUAL =

En el ejemplo que se establece a continuación, mediante el análisis de varianza, se busca conocer el nivel de precisión que tienen los datos con la línea de regresión. Se aplican los datos del ejemplo anterior.

% Carbono 6 22 28 36 41 48 59 72 71

Tensión (miles) 85 110 132 158 201 208 215 275 284

%Carbonox

Tensióny xy x^2

6 85 510 3622 110 2420 48428 132 3696 78436 158 5688 129641 201 8241 168148 208 9984 230459 215 12685 3481

133

72 275 19800 518471 284 20164 5041383 1668 83188 20291

Suma de cuadrados corregidos:

Suma de cuadrados de Reducción:

Suma de cuadrados residual:

SC RESIDUAL = = 1432.90

Cuadro del Análisis de Varianza de la Regresión

FUENTE DE VARIACIÓN

GL SC CM Fc

SC REGRESIÓN (t-1)=1 37315,10 37315,10 182,29

134

SC RESIDUAL (n-2)=7 1432,90 204,70TOTAL (n-1)=8 38748,00

En el análisis de varianza de la regresión se usa la variación inexplicada para probar la cantidad de variación atribuible a los tratamientos, para lo que se aplica la prueba de F.

Para encontrar el valor de la F tabular o Snedecor con el que se va a comparar el valor de Fc, es necesario conocer los grados de libertad del numerador, en este caso, corresponde al de la SC de Regresión, m=1; y los grados de libertad del error, que corresponde a la SC Residual, n=7. Con estos valores se escogen dos niveles: nivel de 0.05 (o nivel al 5%) y nivel 0.01 (o nivel al 1%); luego, con estos datos, el valor tabulado de F tabular tiene:

La regresión se prueba para la F calculada (Fc) y su valor de (en este caso) de 182,29 se compara con la F tabular de Snedecor con 1/7 grados de libertad, se observa que es bastante mayor, lo que permite concluir que la regresión se acepta como significativa al nivel de 0.01, señalándose entonces como altamente significativa.

135

Se determinamos el coeficiente de correlación (r), tenemos que:

El valor obtenido está indicando que existe una alta correlación entre los niveles o porcentajes de carbono en el hierro con su resistencia a la tensión.

Otra forma de calcularlo.

Se procede con los datos del mismo ejemplo y se tiene:

%Carb Tensióndx dy dx.dy dx^2 dy^2

x y

6 85 -36,56 -100,33 3667,74 1336,31 10066,78

22 110 -20,56 -75,33 1548,52 422,53 5675,11

28 132 -14,56 -53,33 776,30 211,86 2844,44

36 158 -6,56 -27,33 179,19 42,98 747,11

136

41 201 -1,56 15,67 -24,37 2,42 245,44

48 208 5,44 22,67 123,41 29,64 513,78

59 215 16,44 29,67 487,85 270,42 880,11

72 275 29,44 89,67 2640,19 866,98 8040,11

71 284 28,44 98,67 2806,52 809,09 9735,11

383 1668 12205,33 3992,22 38748,00

Reemplazando:

Resultado igual que el anterior.

Finalmente, si se calcula el coeficiente de determinación (r2) para evaluar que porcentaje de la variabilidad total de la resistencia a la tensión se atribuye a los niveles o porcentajes de contenido de carbono, se tiene:Coeficiente de Determinación = r2 = 0.98^2 = 0.96

137

El valor del coeficiente de determinación está señalando que un 96% de la variación de las resistencias a la tensión se atribuye o depende de los niveles o concentración de carbono.

Otro procedimiento para calcular el coeficiente de determinación (r2) consiste en dividir la suma de cuadrados de reducción o de regresión para la suma de cuadrados

corregidos

Ejemplo.

Un grupo de máquinas de distintas velocidades produjo los siguientes artículos defectuosos (P), tal como se exponen los datos en el cuadro.

Se pregunta:

a. ¿Cuántos artículos defectuosos se producirían en una máquina que trabaja a una velocidad de 14800 RPM.

b. Determine cuál es el nivel de significación en la producción los artículos defectuosos.

138

11.0 PROBABILIDAD

Introducción

La probabilidad se ha definido de distintas formas, en general, cuando hablemos de probabilidad se lo hace en referencia a la probabilidad de un suceso y se la entiende como una medida cuantificada de la verosimilitud de ocurrencia de un suceso frente a los demás sucesos de un experimento.

Se la define también como el grado de incertidumbre en la ocurrencia de los resultados de un experimento. En todo caso la probabilidad de un suceso es una medida que se puede cuantificar, que toma valores entre cero y uno a diferencia del concepto de posibilidad que es una medida cualitativa.

El estudio de los conceptos y las propiedades del azar más el desarrollo matemático de los mismos, es lo que hace de la probabilidad un instrumento fundamental para toda clase de estudio que contenga incertidumbre.

El azar permite estudios rigurosos y científicos que pueden expresarse a través de fórmulas matemáticas, condiciones en las que probabilidad se fundamenta para determinar la frecuencia con que puede presentarse un resultado determinado cuando se realiza un experimento.

139

La estadística tiene por objeto el estudio y comportamiento de fenómenos. Estos fenómenos son a su vez el resultado de una experimentación, por lo que podemos hablar indistintamente de fenómenos y experimentos aleatorios.

El experimento aleatorio es aquel que puede dar varios resultados, anticipadamente no se puede predecir cual es el que se va a producir en una experiencia concreta.

Los experimentos se pueden clasificar en deterministas y aleatorios. Los experimentos deterministas son aquellos que realizados de una misma forma y con las mismas condiciones iniciales, ofrecen siempre el mismo resultado. Como ejemplo, tenemos que un objeto de cualquier masa partiendo de un estado inicial de reposo, y dejado caer al vacío desde una torre, llega siempre al suelo con la misma velocidad:

Cuando en un experimento no se puede predecir el resultado final, hablamos de experimento aleatorio. Este es el caso cuando lanzamos un dado y observamos su resultado.

Mientras que los aleatorios, aun cuando las condiciones del experimento no cambien el resultado del experimento es impredecible antes de realizarlo. Por ejemplo, ante el hecho de lanzar una moneda al aire no sabremos si saldrá cara o cruz. Son también experimentos aleatorios la cotización de

140

las acciones de una empresa, sus beneficios, sus ventas, su periodo de actividad, etc.). En general diremos que las características de un experimento aleatorio son las siguientes:

a) En circunstancias similares, el experimento se puede repetir u observar de forma indefinida.

b) Aunque no se pueda predecir el resultado si se puede conocer el conjunto de todos los posibles resultados.

c) Cuando se repite pocas veces un experimento, los resultados parecen mostrar un comportamiento caótico, mientras que si se repite un número infinito de veces comienza a obtenerse una regularidad en el comportamiento de los resultados.

Cuando el experimento es aleatorio puede presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto aún realizando el experimento en las mismas condiciones. Nunca se conoce que resultados se va ha obtener. Por ejemplo:

- Si se lanza una moneda al aire y queremos saber cual es la posibilidad que salga un número 1, o que salga un número impar, o que salga un número menor que 3.

141

- Al lanzar una moneda al aire el resultado puede ser cara o cruz, pero anticipadamente no se conoce cual de ellos va a salir.

No se puede aplicar las reglas de la probabilidad a experimentos que no son aleatorios. Por ejemplo, si se selecciona directamente en una moneda la cruz, entonces no se puede hablar de probabilidad, sino de un resultado impuesto por uno mismo.

La probabilidad de un evento se representa con P. Luego, P(A) significa la probabilidad de que ocurra el evento A en una sola observación o experimento.

Cero es el menor valor que puede tener un enunciado de probabilidad lo que significa que el evento es imposible. El mayor valor corresponde a 1 y significa que el evento ocurra. De aquí que:

0 ≤ P(A) ≤ 1

En todo experimento un evento debe o no ocurrir. Por consiguiente, la suma de la probabilidad de la ocurrencia mas la probabilidad de la no ocurrencia siempre será igual a 1. Si se tiene que A´ representa la no ocurrencia del evento A, se tiene:

P(A) + P(A´) = 1

142

11.1 Espacio Muestral

Una de las características del experimento aleatorio es que se puede saber el conjunto de todos sus posibles resultados, aunque los resultados individuales no son predecibles con anterioridad.

Toda experiencia lleva a la obtención de un resultado, pero no siempre éste es previsible con certeza o precisión adecuadas.

A pesar de esta imposibilidad de predicción si podemos plantearnos cuáles son los resultados esperables de un experimento. A este conjunto de resultados lo llamamos espacio muestral.

El espacio muestral puede ser finito o infinito. Es finito si está formado por un conjunto finitos de resultados. En los espacios infinitos se establecen los infinitos numerables e infinitos no numerables. Los espacios finitos y los infinitos numerables se los conoce como espacios discretos, mientras a que los infinitos no numerables se denominan continuos.

Se llama espacio muestral al conjunto de los posible resultados de un experimento o situación aleatoria y se lo representa por la letra E. El resultado de un experimento o prueba se llama resultado, punto muestral, suceso o evento elemental. Cada experimento aleatorio tiene

143

definido su espacio muestral, esto es, un conjunto con todas las soluciones posibles.

Se tendrá siempre presente que un espacio muestral siempre está asociado con un experimento. El espacio muestral puede ser un número, el resultado de una sucesión de caras o sellos, un vector o una función.

Es importante establecer qué se va a hacer y qué se va a observar o contar a la hora de determinar el espacio muestral en un experimento aleatorio

En todo espacio muestral podemos distinguir los siguientes sucesos:

Sucesos elementales, los subconjuntos con un solo elemento.

Suceso seguro, E, el propio espacio muestral.

Suceso imposible, φ, que no posee ningún suceso elemental (no puede verificarse).

Teniendo en cuenta que los sucesos son subconjuntos se suelen usar los diagramas de Venn para representarlos.

144

Si A y B son dos sucesos del espacio muestral E, éste queda dividido en cuatro partes:

Los que están en A y no en B, los que están en B y no en A, los que están en ambos y los que no están ni en a ni en B.Figura 2

En el dibujo se ha indicado el número de sucesos elementales que les corresponden.

Llamaremos P(E) al conjunto de todos los sucesos, es decir a partes de E.

Diremos que el suceso A implica el B, sí siempre que se

verifica A se verifica B. Se indica A B, pues todos los su

sucesos de A pertenecen a B.

Ejemplo 6. A = “sacar un dos” ; B = “sacar par”

Dos sucesos son iguales cuando contienen los mismos sucesos elementales; se puede expresar esto diciendo que

se implican mutuamente, A B y B A.

145

Definición: Se llama suceso contrario (o

complementario) de A, y se representa por , Ac ó Ac, al

formado por los sucesos elementales de E que no están en A.

Es decir se verifica o Ac cuando no se verifica A.

Ejemplo:

a. En un experimento se trata de determinar al azar los primeros 10 motores con problemas de ignición en una fábrica de automóviles.

Para este ejemplo, el espacio muestral que además es finito y discreto, viene dado por:

E={1,2,3,4,5,6,7,8,9,10}

Adicionalmente, para este experimento se puede determinar otros tipos de eventos como:

A ={la totalidad de motores son reparables}

146

Ac

B={los motores reparables son al menos 4}

Al conjunto de todos los posibles sucesos elementales lo denominamos espacio muestral.

b. Si tiramos una moneda al aíre una sola vez, el espacio muestral será cara o cruz.

Si el experimento consiste en lanzar una moneda al aire dos veces, entonces el espacio muestral estaría formado por (cara-cara), (cara-cruz), (cruz-cara) y (cruz-cruz).

11.2 Suceso o Evento

A partir de los resultados elementales de un experimento se presenta un suceso o evento, el cual, se trata de un conjunto de resultados elementales del experimento. Algunos autores usan los términos evento o acontecimiento para nombrar lo que aquí llamamos suceso.

Los resultados de cualquier prueba de un experimento corresponden a un elemento del espacio muestral.

Se llama suceso o evento, dentro de un espacio muestral, a cualquier subconjunto del espacio muestral.

147

Un suceso se realiza, cuando el resultado del experimento aleatorio es uno de los sucesos posibles. Por ejemplo, los resultados de la tirada de una moneda darán cruz o cara, pero no ambas; esto es, que los puntos muestrales o eventos elementales son mutuamente excluyentes, estos dos eventos o sucesos no podrán ocurrir simultáneamente en una sola prueba.

11.2.1 Tipos de sucesos o eventos

Antes de calcular las probabilidades de un experimento aleatorio hay que definir los tipos de sucesos.

Suceso elemental: hace referencia a cada una de las posibles soluciones que se pueden presentar.

Ejemplo: al lanzar una moneda al aire, los sucesos elementales son la cara y la cruz. Al lanzar un dado, los sucesos elementales son el 1, el 2, .., hasta el 6.

Suceso compuesto: es un subconjunto de sucesos elementales.

Ejemplo: lanzamos un dado y queremos que salga un número par. El suceso "numero par" es un suceso compuesto o evento, integrado por 3 sucesos elementales: el 2, el 4 y el 6

O, por ejemplo, jugamos a la ruleta y queremos que salga "menor o igual que 18". Este es un suceso

148

compuesto formado por 18 sucesos elementales (todos los números que van del 1 al 18).

11.3 Probabilidad de sucesos

Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar dos sucesos entre sí, así como de las posibles relaciones que se pueden establecer entre los mismos. Vamos a ver ahora cómo se refleja esto en el cálculo de probabilidades.

11.3.1 Suceso contenido en otro.- Se dice que A está

contenido en B y lo indicaremos por A B si todos

los elementos de A pertenecen a B. Las posibles soluciones del primer suceso también lo son del segundo, pero este segundo suceso tiene además otras soluciones suyas propias.

Ejemplo: lanzamos un dado y analizamos dos sucesos:

a) que salga el número 6: A={6}

b) que salga un número par: B={2,4,6}

Vemos que el suceso a) está contenido en el suceso b):

A B

Siempre que se da el suceso a) se da el suceso b), pero no al contrario.

149

Cuando un suceso puede estar contenido en otro, entonces, la probabilidad del primer suceso será menor que la del suceso que lo contiene.

Tomando el mismo ejemplo, tenemos:

P(A) = 1/6 = 0,166

P(B) = 3 / 6 = 0,50

Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es menor que la probabilidad del suceso que lo contiene, suceso b). Por tano el suceso A está contenido en el suceso B.

11.3.2 Igualdad de sucesos.- A = B, en este caso, las probabilidades de ambos sucesos son las mismas. Se presenta cuando siempre que se cumple uno de ellos se cumple obligatoriamente el otro y viceversa.

Ejemplo: lanzamos un dado al aire y analizamos dos sucesos, A) que salga número par, y B) que salga múltiplo de 2. Las soluciones coinciden en ambos casos.

a. que salga número par: A = {2,4,6}b. que salga múltiplo de 2: B = {2,4,6}

Vemos que las soluciones coinciden en ambos casos.

P(A) = 3 / 6 = 0,50

150

P(B) = 3 / 6 = 0,50

11.3.3 Unión de dos o más sucesos.- A ∪ B. Producirá otro suceso formado por todos los elementos de los sucesos que se unen; lo que es lo mismo, la probabilidad de la unión de dos sucesos es igual a la suma de las probabilidades individuales de los dos sucesos que se unen, menos la probabilidad del suceso intersección

Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que el resultado sea mayor que 3. El suceso unión estaría formado por los siguientes resultados: el 2, el 4, el 5 y el 6.

a. que salga número par:

A = {2,4,6}

b. que el resultado sea mayor que 3:

B = {4,5,6}

c. el suceso unión estaría formado por el siguiente resultado:

C = {2,4,5,6}Se expresa:

A ∪ B = {2,4,6} ∪ {4,5,6} = {2,4,5,6}

P(A) = 3 / 6 = 0,50

151

P(B) = 3 / 6 = 0,50

P (A ∪ B) = 2 / 6 = 0,33

Por lo tanto,

Como ejemplo, tenemos que la unión de un suceso cualquiera con su complementario es el suceso seguro:

P (A u B) = (0,50 + 0,50) - 0,33 = 0,666

11.3.4 Intersección de sucesos.- A ∩ B. Es suceso compuesto por los elementos comunes de dos o más sucesos que se intersectan. La probabilidad será igual a la probabilidad de los elementos comunes.

Ejemplo: lanzamos un dado al aire, y analizamos dos sucesos:

a. que salga número par: A = {2,4,6}

b. que sea mayor que 4: B = {5,6}

c. la intersección de estos dos sucesos tiene un sólo elemento: C = {6}

Puede expresarse:

A ∩ B = {2,4,6} ∩ {5,6} = {6}

152

El número 6 es el resultado común a ambos sucesos: es mayor que 4 y es número par.

Su probabilidad será por tanto:

P(A ∩ B) = 1 / 6 = 0,166

11.3.5 Sucesos incompatibles, disjuntos o mutuamente excluyentes.- A ∩ B = Ø. Este tipo de sucesos no pueden ocurrir al mismo tiempo ya que no tienen elementos comunes, por consiguiente, su intersección es el conjunto vacio.

Los eventos son no excluyentes cuando es posible que ocurran al mismo tiempo, sin embargo, esta definición no indica que esos eventos siempre deban ocurrir necesariamente en forma conjunta.

La probabilidad de la unión de dos sucesos incompatibles será igual a la suma de las probabilidades de cada uno de los sucesos y como su intersección es el conjunto vacio no hay que restarle nada.

Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número menor que 3, y b) que salga el número 6. Es evidente que ambos no se pueden dar al mismo tiempo.

153

A ∩ B = {1,2} ∩ {6} = Ø

La probabilidad del suceso unión de estos dos sucesos será igual a:

P(A) = 2 / 6 = 0,333

P(B) = 1 / 6 = 0,166

Por lo tanto,

P(A ∪ B) = 0,33 + 0,166 = 0,50

11.3.6 Sucesos complementarios o contrarios.- En dos sucesos complementarios, el segundo es un subconjunto que contiene todos los sucesos elementales del espacio muestral que no están en el primero. Son aquellos que si no se da uno, obligatoriamente se tiene que dar el otro.

La probabilidad de un suceso complementario a un suceso (A) es igual a 1 - P(A)

Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número par, y b) que salga un número impar. Vemos que si no se da el primero se tiene que dar el segundo (y viceversa).

La probabilidad del suceso (A) es igual a:

154

P(A) = 3 / 6 = 0,50

Luego, la probabilidad del suceso (B) es igual a:

P(B) = 1 - P(A) = 1 - 0,50 = 0,50

Se puede comprobar aplicando la regla de "casos favorables / casos posibles":

P(B) = 3 / 6 = 0,50

O también:

P(A) = {2,4,6} = 3/6

P(B)={1,3,5} = 3/6

P(E) =P(A) + P(B) = 1

Luego:

P( ) = P(E) – P(B) = 1 – 3/6 = 3/6 = 0.5 =50%

11.3.7 Unión de sucesos complementarios.- La probabilidad de la unión de dos sucesos complementarios es igual a 1.

Ejemplo: seguimos con el ejemplo anterior: a) que salga un número par, y b) que salga un número impar.

155

La probabilidad del suceso unión de estos dos sucesos será igual a:

P(A) = 3 / 6 = 0,50

P(B) = 3 / 6 = 0,50

Por lo tanto,

P(A U B) = 0,50 + 0,50 = 1

156

12.0 CÁLCULO DE PROBABILIDADES

Los cálculos de probabilidades realizados sobre un experimento aleatorio siempre se hacen en referencia a la probabilidad de un suceso y la entenderemos como una medida cuantificada de ocurrencia de un suceso frente a los demás sucesos del experimento.

El cálculo debe medir mide la mayor o menor posibilidad de que se dé un determinado resultado.

La probabilidad de un suceso es una medida cuantificable que toma valores entre 0 y 1 o que también pueden ser expresados en tanto por ciento, entre 0% y 100%

Suceso imposible.- Su valore corresponde a cero. Es aquel que no contiene ningún elemento del espacio muestral (E) y por tanto no ocurrirá nunca y se lo representa por Ø

Por ejemplo: Si lanzamos un dado al aire la probabilidad de que salga el número 7 es cero.

Valor del suceso seguro o universal.- Es cuando el suceso coincide con el espacio muestral. El valor de uno corresponde al suceso seguro.

157

Ejemplo: Al lanzar un dado al aire se tiene la probabilidad de que salga cualquier número del 1 al 6; lo cual es igual o 100%.

El resto de sucesos tendrá probabilidades entre cero y uno: que será tanto mayor cuanto más probable sea que dicho suceso tenga lugar.

12.1 Medición de la probabilidad.

La Regla de Laplace permite medir la probabilidad de un suceso A perteneciente a un espacio muestral (E) finito. Se define como el cociente entre los resultados casos respecto al total de resultados posible.

Regla de Laplace o Probabilidad clásica o a priori, se atribuye a los primeros estadísticos que emplearon este concepto y se refiere a que la probabilidad de cualquiera de los sucesos de este tipo de experimentos es conocida incluso antes que los mismos tengan lugar. De hecho no es necesario realizar el experimento para conocer las probabilidades de sus resultados.

La Regla de Laplace se define como:

158

Con la letra P representaremos el término probabilidad para que no surjan dudas de su significado.

Siendo que:

A; B identifican sucesosP(A) probabilidad del suceso AE el espacio muestral (conjunto de todos los

resultados)

Ejemplo:

Calcular la probabilidad de que al lanzar un dado se obtenga un número impar.

Solución:

El espacio muestral es E={1,2,3,4,5,6}

Lamamos A al suceso consistente en que el resultado es impar A={1,3,5}

Como no suponemos que ninguna de las caras ofrece una probabilidad de ocurrencia diferente a las demás, podemos aplicar la regla de Laplace para obtener que

159

Se describen los axiomas:

Primer axioma: P(A) 0

La P de un suceso es un número mayor o igual a 0. No puede haber sucesos cuya probabilidad de ocurrir sea del 120% ni del -4%.

Segundo axioma: P(E) = 1

La P del espacio muestral es 1, es decir del 10%; no podrá asignarse P a sucesos no considerados en el espacio muestral.

Tercer axioma: P(A B) = P(A) + P(B) SI A B=

La P de la unión de dos sucesos es igual a la suma de las P respectivas si, y solo si, su intersección es el conjunto vacío.

Ejemplos con el dado:

160

a) Probabilidad que salga el número 2: Aquí el caso es tan sólo uno, esto es, que salga el dos, mientras que los casos posibles son seis, puede salir cualquier número del uno al seis.

Luego:

P(A) = 1 / 6 = 0,166 = 16.6%

b) Probabilidad que salga un número par: Los casos favorables pueden ser el 2, 4, 6; esto es tres resultados favorables; mientras que los casos posibles son seis.

Luego:

P(A) = 3 / 6 = 0,50 = 50%

c) Probabilidad que salga un número menor que 5: Aquí se tendrían cuatro casos favorables, pudiendo salir el uno, el dos, el tres o el cuatro frente a los seis casos posibles.

Luego:

P(A) = 4 / 6 = 0,666 = 66,6%

d) Cuatro ases contiene un juego de naipes, la probabilidad de obtener un as (A) en una sola extracción es de:

P(A)= 4P(B)= 52

161

Para poder aplicar la Regla de Laplace el experimento aleatorio tiene que cumplir dos requisitos:

1) El número de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al aplicar la regla "casos favorables / casos posibles" el cociente siempre sería cero.

2) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras tuvieran mayor probabilidad de salir que otras, no podríamos aplicar esta regla.

Si el experimento aleatorio no cumple se recurre a otro modelo de cálculo de probabilidades que se basa en la experiencia llamado modelo frecuentista.

Cuando son muchas las veces que se repite un experimento aleatorio, las probabilidades de los diversos posibles sucesos empiezan a converger hacia valores determinados, que son sus respectivas probabilidades.

Ejemplo: si lanzo una vez una moneda al aire y sale "cara", quiere decir que el suceso "cara" ha aparecido el 100% de las veces y el suceso "cruz" el 0%.

Si lanzo diez veces la moneda al aire, es posible que el suceso "cara" salga 7 veces y el suceso "cruz" las 3 restantes. En este caso, la probabilidad del suceso "cara"

162

ya no sería del 100%, sino que se habría reducido al 70%.

Si repito numerosamente este experimento, lo normal es que las probabilidades de los sucesos "cara" y "cruz" se vayan aproximando al 50% cada una. Este 50% será la probabilidad de estos sucesos según el modelo frecuentista.

En este modelo ya no será necesario que el número de soluciones sea finito, ni que todos los sucesos tengan la misma probabilidad.

Ejemplo: si la moneda que utilizamos en el ejemplo anterior fuera defectuosa (o estuviera trucada), es posible que al repetir dicho experimento un número elevado de veces, la "cara" saliera con una frecuencia, por ejemplo, del 65% y la "cruz" del 35%. Estos valores serían las probabilidades de estos dos sucesos según el modelo frecuentista.

A esta definición de la probabilidad se le denomina probabilidad a posteriori, ya que tan sólo repitiendo un experimento un número elevado de veces podremos saber cual es la probabilidad de cada suceso.

163

164

13.0 PERMUTACIONES, COMBINACIONES, VARIACIONES.

Para aplicar la Regla de Laplace, el cálculo de los sucesos favorables y de los sucesos posibles a veces no plantea ningún problema, ya que son un número reducido y se pueden calcular con facilidad:

Por ejemplo: Probabilidad de que al lanzar un dado salga el número 2. Tan sólo hay un caso favorable, mientras que los casos posibles son seis.

Probabilidad de acertar al primer intento el horóscopo de una persona. Hay un caso favorable y 12 casos posibles.

Sin embargo, a veces calcular el número de casos favorables y casos posibles es complejo y hay que aplicar reglas matemáticas:

Por ejemplo: 5 matrimonios se sientan aleatoriamente a cenar y queremos calcular la probabilidad de que al menos los miembros de un matrimonio se sienten junto. En este caso, determinar el número de casos favorables y de casos posibles es complejo.

Las reglas matemáticas que nos pueden ayudar son el cálculo de combinaciones, el cálculo de variaciones y el cálculo de permutaciones.

165

13.1 Permutaciones

Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.

Calcula las posibles agrupaciones que se pueden establecer con todos los elementos de un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los elementos.

Se llama permutación a cada una de las posibles ordenaciones de los elementos de un conjunto finito dado con todo sus elementos diferentes. La permutación es todo de elementos donde interesa el lugar o posición que ocupa cada uno de los elementos que forman dicho arreglo.

Ejemplo:

Enumerar todas las permutaciones 2 a 2 de las letras a, b y c.

Solución:

ab, ac, ba, bc, ca y cb

Dados elementos distintos, cualquier forma de ordenarlos se denomina una permutación. Las formas de ordenar los elementos se denominan permutación.

166

En el conjunto {1,2,3}, cada ordenación posible de sus elementos, sin repetirlos, es una permutación. Existe un total de 6 permutaciones para estos elementos: "1,2,3", "1,3,2", "2,1,3", "2,3,1", "3,1,2" y "3,2,1".

Para calcular el número de permutaciones se aplica la siguiente fórmula:

La expresión Pm representa las permutaciones de m elementos, tomando todos los elementos. Los subgrupos se diferenciaran únicamente por el orden de los elementos.

Ejemplo: P8 son las permutaciones de 8 elementos:

P8 = 8! = 8 * 7 * 6 * 5 * 4 * 3 * 2 * 1 = 40 320

Es decir, tendríamos 40 320 formas diferentes de agrupar 8 elementos

13.2 Combinaciones

Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.

167

Una combinación es un arreglo donde el orden no es importante. Son los grupos que se pueden formar tomando una cantidad n de elementos del total m; considerando como grupo distinto aquel que tiene diferentes elementos. No puede repetirse un elemento dentro de un grupo.

Su símbolo es Cm, n y se lee “combinaciones de elementos tomados de a n“ (en grupos de n elementos). En este caso puede demostrarse que:

Ejemplo: entre 5 personas (a, b, c, d, e), ¿de cuántas formas pueden elegirse tres de ella (por ejemplo, para realizar tres trabajos donde es indistinto quién lo realiza)?

Las alternativas, donde no interesa el orden de los elementos en cada grupo, son:

(a, b, c) (a, b, d) (a, b, e) (a, c, d) (a, c, e) (a, d, e) (b, c, d) (b, c, e) (b, d, e) (c, d, e)

y la cantidad total se calcula como:

168

El arreglo o listado se conoce como combinación. Determina el número de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con los "n" elementos de una nuestra. Cada subgrupo se diferencia del resto en los elementos que lo componen, sin que influya el orden.

La notación para las combinaciones es C(m,n) y se lee como la cantidad de combinaciones de m, de m elementos determinados por n; y, dividido por n!.

Las combinaciones con repetición son los grupos que se pueden formar tomando una cantidad n de elementos del total m; considerando como grupo distinto aquel que tiene diferentes elementos. Sí puede repetirse un elemento dentro de un grupo y n puede ser hasta mayor que m.

Su símbolo es C’m,n y se lee “combinaciones con repetición de m elementos tomados de a n“.

En este caso puede demostrarse que:

Ejemplo: entre 5 personas (a, b, c, d, e), ¿de cuántas formas pueden elegirse tres de ellos para realizar tres trabajos, pudiendo una misma persona ocuparse de dos o más?

169

Respuesta:

Por ejemplo, calcular las posibles combinaciones de 2 elementos que se pueden formar con los números 1, 2 y 3.

Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el cálculo de combinaciones las parejas (1,2) y (2,1) se consideran idénticas, por lo que sólo se cuentan una vez.

Para calcular el número de combinaciones de m cosas tomadas n a la vez, o C(m,n), divide el número de permutaciones P(m,n) entre el número de maneras que n cosas pueden arreglarse lo cual es n!, para lo cual, se aplica la siguiente fórmula:

O también, se aplica la siguiente fórmula:

El termino n! se denomina factorial de n y es la multiplicación de todos los números que van desde n hasta 1.

170

Por ejemplo: 4! = 4 * 3 * 2 * 1 = 24

La expresión C(m,n) representa las combinaciones de m elementos, formando subgrupos de "n" elementos.

Ejemplo: C(10,4) son las combinaciones de 10 elementos agrupándolos en subgrupos de 4 elementos:

= 210

Es decir, podríamos formar 210 subgrupos diferentes de 4 elementos, a partir de los 10 elementos.

Ejemplo:

Debe seleccionarse 3 máquinas para que trabajen en turnos vespertinos de un total de 12 que se encuentran en la sala de torneado. Cuantos grupos de 3 máquinas pueden elegirse sin reparar en el orden en que cada grupo pudiera tener.

Continuando con el ejercicio, anterior: Si el total de máquinas está compuesta de 7 de marca Toledo y 5 de marca Yiler. ¿Cuál es la probabilidad de que en una

171

elección aleatoria, de las 3 máquinas que se elijan 2 sean Toledo y 1 Yiler?

Número de máquinas con 2T y 1Y:

Número total de combinaciones posibles de máquinas = C(12,3)

Calcular y determinar si se trata de una permutación o una combinación:

1. C(8,3) C(11,4) C(40,1) C(16,5)2. Seleccionar 5 cilindros de una producción de 40

3. Escoger 6 bujías de 20 dañadas.

4. Ocho trabajadores se encuentran en la sala de afilado.

5. Escoger 5 relej variados de una caja de 15 relej de diferentes marcas.

6. Cuatro vehículos estacionados en un garaje de capacidad de 10 vehículos.

172

7. Un almacén tiene 12 alternadores de diferentes orígenes. El mecánico del lugar compra tres alternadores cada vez que visita el almacén. ¿El mecánico cuantas combinaciones de diferentes orígenes de alternadores puede comprar?

8. El profesor de resistencia de materiales tiene 15 varillas de una misma dimensión y de diferentes aleaciones. ¿Cuántos grupos diferentes de 3 aleaciones puede hacer para ensayo de los estudiantes?

13.3 Variaciones

Calcula el número de subgrupos de 1, 2, 3, etc. elementos que se pueden establecer con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia de las combinaciones).

Por ejemplo, calcular las posibles variaciones de 2 elementos que se pueden establecer con los número 1, 2 y 3.

Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1) se consideran distintos.

Para calcular el número de variaciones se aplica la siguiente fórmula:

173

La expresión m,n representa las variaciones de m elementos, formando subgrupos de "n" elementos. En este caso, como vimos en la lección anterior, un subgrupo se diferenciará del resto, bien por los elementos que lo forman, o bien por el orden de dichos elementos.

Ejemplo: V10,4 son las variaciones de 10 elementos agrupándolos en subgrupos de 4 elementos:

Es decir, podríamos formar 5.040 subgrupos diferentes de 4 elementos, a partir de los 10 elementos.

13.4 Combinaciones, Variaciones y Permutaciones con repeticiones.

Vamos a analizar ahora que ocurriría con el cálculo de las combinaciones, de las variaciones o de las permutaciones en el supuesto de que al formar los subgrupos los elementos pudieran repetirse.

Por ejemplo: tenemos bolas de 6 colores diferentes y queremos formar subgrupos en los que pudiera darse el caso de que 2, 3, 4 o todas las bolas del subgrupo

174

tuvieran el mismo color. En este caso no podríamos utilizar las fórmulas que vimos en la lección anterior.

a) Combinaciones con repetición:

Para calcular el número de combinaciones con repetición se aplica la siguiente fórmula:

Ejemplo: C(10,4) son las combinaciones de 10 elementos con repetición, agrupándolos en subgrupos de 4, en los que 2, 3 o los 4 elementos podrían estar repetidos:

Es decir, podríamos formar 120 subgrupos diferentes de 3 elementos.

b) Variaciones con repetición:

Para calcular el número de variaciones con repetición se aplica la siguiente fórmula:

175

Ejemplo: Vr(12,3) son las variaciones de 12 elementos con repetición, agrupándolos en subgrupos de 3 elementos:

Es decir, podríamos formar 1728 subgrupos diferentes de 3 elementos.

c) Permutaciones con repetición:

Para calcular el número de permutaciones con repetición se aplica la siguiente fórmula:

Son permutaciones de "m" elementos, en los que uno de ellos se repite " x1 " veces, otro " x2 " veces y así ... hasta uno que se repite " xk " veces.

Ejemplo: Calcular las permutaciones de 10 elementos, en los que uno de ellos se repite en 2 ocasiones y otro se repite en 3 ocasiones:

176

Es decir, tendríamos 33600 formas diferentes de agrupar estos 10 elementos

Ejercicio

1.- Calcular la probabilidad de acertar los 14 signos de la quiniela:

Solución:

Se aplica la Regla de Laplace (casos favorables / casos posibles). El caso favorable es tan sólo uno (acertar los 14 signos). Los casos posibles se calculan como variaciones con repetición de 3 elementos (1, X y 2), tomados de 14 en 14 (los signos que hay que rellenar).

Son variaciones y no combinaciones ya que el orden influye: no es lo mismo (1,1,X) que (1, X, 1). Y son con repetición, ya que cualquiera de los signos (1, X y 2) se puede repetir hasta 14 veces.

Por lo tanto, los casos posibles son:

Y la probabilidad de acertar los 14 resultados es:

177

No demasiado elevada....pero el que la sigue la consigue.

Ejercicio

2.- Y la probabilidad de acertar 12 signos de la quiniela:

Solución:

Aplicamos nuevamente la Regla de Laplace. En este caso los casos favorables se calculan como combinaciones de 14 elementos tomados de 2 en 2, de esta manera obtenemos todas las posibles alternativas de fallar 2 resultados de 14 (lo que equivale a acertar 12 resultados). Utilizamos combinaciones y no variaciones ya que el orden no importa (da lo mismo fallar el 3º y el 6º, que el 6º y el 3º)

Los casos posibles siguen siendo los mismos:

Por lo que la probabilidad de acertar 12 resultados es:

178

Por lo tanto, tenemos más probabilidades de acertar 12 resultados que 14 (¿será por eso por lo que pagan menos?).

Ejercicio

3.- Calcular la probabilidad de, en una carrera de 15 caballos, acertar los 3 que quedan primeros (sin importar cual de ellos queda primero, cual segundo y cual tercero).

Solución:

Se aplica la Regla de Laplace. El caso favorable es tan sólo uno: los 3 caballos que entran en primer lugar. Los casos posibles se calculan como combinaciones de 15 elementos tomados de 3 en 3 (es decir, determinamos todos las posibles alternativas de 3 caballos que pueden entrar en las 3 primeras posiciones). Como el orden de estos 3 primeros caballos no importa, utilizamos combinaciones en lugar de variaciones.

Por lo tanto, los casos posibles son:

179

Por lo que la probabilidad de acertar los 3 caballos ganadores es:

Algo mayor que en las quinielas.... Eso sí, se paga menos.

Ejercicio

4.- Y si hubiera que acertar, no sólo los 3 caballos que ganan, sino el orden de su entrada en meta.

Solución:

El caso favorable sigue siendo uno: los 3 caballos que entran en primer lugar, colocados en su orden correspondiente.

Los casos posibles se calculan ahora como variaciones (ya que el orden influye) de 15 elementos tomados de 3 en 3 (calculamos todas las posibles maneras en que los 12 caballos podrían ocupar las 3 primeras posiciones.

Por lo que la probabilidad de acertar los 3 caballos ganadores es:

180

Menor que en el ejemplo 3º. Ya no vale acertar que 3 caballos entran en primer lugar, sino que tenemos que acertar el orden de su entrada.

181

14.0 PROBABILIDAD CONDICIONADA

Es la Probabilidad de que un evento ocurra dado que otro evento ha ocurrido con anterioridad. Es la probabilidad de que ocurra un suceso A, sabiendo que también sucede otro evento B. La probabilidad condicional se escribe P(A|B), y se lee la probabilidad de A dado B.

Asumamos que se tiene una caja con cuatro bolas numeradas; extraemos de ella una bola e inmediatamente la introducimos para hacer una segunda extracción. La posibilidad de sacar la bola número 2 es la misma que en la primera.

Pero si hacemos lo mismo sin reemplazar la bola extraída, la probabilidad de extraer por ejemplo, la bola número 2 en la segunda extracción, dependerá de la bola extraída en primer lugar.

Sean A y B dos sucesos definidos en el espacio muestral E, la probabilidad de A dado B se denota como:

P(A | B) = P (A ∩B) / P(B)

Siempre que P(B) > 0

Reglas de la Probabilidad:

a) Suma:

Si A y B son eventos excluyentes, entonces:

182

http://es.wikipedia.org/wiki/Probabilidad

P (A U B) = P(A) + P(B) y se lee: La probabilidad de que ocurra A ó B

De otra forma (no excluyentes):

P(A U B) = P(A) + P(B) – P(A∩B)

b) Eventos independientes:

Si A y B son eventos independientes (aquéllos en que la ocurrencia de uno no afecta la ocurrencia del otro), entonces:

P(A∩B) = P(A) * P(B) y se lee: La probabilidad de que ocurra A y B al mismo tiempo.

De otra forma (eventos dependientes):

P(A∩B) = P(A) * P(B | A)

Cuando dos los sucesos A y B son independientes, entonces:

P ( A | B ) = P(A∩B) / P(B)

Dado que A y B son independientes, entonces

P(A∩B) = P(A) * P(B)

y por lo tanto:

183

P ( A | B ) = P(A)

Las probabilidades condicionadas se calculan una vez que se ha incorporado información adicional a la situación de partida:

Ejemplo: se tira un dado y sabemos que la probabilidad de que salga un 2 es 1/6 (probabilidad a priori). Si incorporamos nueva información (por ejemplo, alguien nos dice que el resultado ha sido un número par) entonces la probabilidad de que el resultado sea el 2 ya no es 1/6.

Donde:

P (A | B) es la probabilidad de que se de el suceso B condicionada a que se haya dado el suceso A.

P(A∩B) es la probabilidad del suceso simultáneo de A y de B

P (A) es la probabilidad a priori del suceso A

En el ejemplo que hemos visto:

P(A | B) es la probabilidad de que salga el número 2 (suceso B) condicionada a que haya salido un número par (suceso A).

P (A∩B) es la probabilidad de que salga el dos y número par.

184

P (A) es la probabilidad a priori de que salga un número par.

Por lo tanto:

P (A∩B) = 1/6

P (A) = 1/2

P (A | B) = (1/6) / (1/2) = 1/3

Luego, la probabilidad de que salga el número 2, si ya sabemos que ha salido un número par, es de 1/3 (mayor que su probabilidad a priori de 1/6).

La probabilidad condicionada es en este caso cero, frente a una probabilidad a priori de 1/6.

EJEMPLO.

Se lanza un dado al aire ¿Cuál es la probabilidad de que salga el número 2? Si sabemos que el resultado ha sido un número par, ¿se ha modificado esta probabilidad?

Solución:

El espacio muestral que corresponde a este experimento es

E={1,2,3,4,5,6}

y se debe calcular la probabilidad del suceso A={2}. Si el dado no está trucado, todos los números tienen la misma

185

probabilidad de salir, y siguiendo la definición de probabilidad de Laplace,

Al calcular la probabilidad de A, según la definición de Laplace, previamente se supone que todos los elementos del espacio muestral tienen la misma probabilidad de salir, es decir:

P(1)=P(2)=P(3)=P(4)=P(5)=P(6)

Por otro lado, si ha salido un número par, de nuevo por la definición de probabilidad de Laplace tendríamos

186

Esta misma probabilidad se podría haber calculado siguiendo la definición de la probabilidad condicionada, ya que si escribimos

A ={2}

B={2,4,6}

y entonces

187

que por supuesto coincide con el mismo valor que calculamos usando la definición de probabilidad de Laplace.

2º ejemplo:

En un estudio mecánico se ha determinado que la probabilidad de que un motor tenga problemas de ignición (suceso B) sea del 0,10 (probabilidad a priori).

Además, la probabilidad de que el motor tenga problemas de ignición admisión (suceso A) es el 0,25 y la probabilidad de que el motor tenga a la vez problemas de admisión e ignición (suceso intersección de A y B) es del 0,05.

Calcular la probabilidad de que el motor tenga problemas de ignición si tiene problemas de admisión (probabilidad condicionada P (A | B).

P (B ∩ A) = 0,05

P (A) = 0,25

P(A | B) = 0,05 / 0,25 = 0,20

Por lo tanto, la probabilidad condicionada es superior a la probabilidad a priori. No siempre esto es así, a veces la probabilidad condicionada es igual a la probabilidad a priori o menor.

188

Por ejemplo: probabilidad de que al tirar un dado salga el número 2, condicionada a que haya salido un número impar.

Ejercicio Se lanzan dos dados:

a. ¿Cuál es la probabilidad de obtener una suma de puntos igual a 7?

b. Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los dados haya salido un tres?

Solución:

Sean los sucesos A="la suma de los puntos es 7" y B="en alguno de los dados ha salido un tres".

a. Los casos posibles al lanzar dos dados son 36 y los casos favorables al suceso A son los seis siguientes: (1,6); (2,5); (3,4); (4,3); (5,2) y (6,1).

Por tanto, P(A)=6/36=1/6

b. En este caso, el suceso B/A es salir en algún dado 3, si la suma ha sido 7. Observamos que esta situación ocurre en las parejas (3,4) y (4,3).

Por tanto, P( B|A )=2/6=1/3

189

De tres talleres se registró la producción en porcentaje de piezas defectuosas y buenas, los datos se recogen en el cuadro:

TIPO TALLER 1

TALLER 2

TALLER 3

TOTALDefectuosa 20 10 10 40Buena 40 30 10 80Total 60 40 20 120

Se desea conocer:

a. ¿Qué probabilidad existe que se pueda tomar de toda la producción de los talleres una pieza defectuosa?

b. Calcular la probabilidad de que una pieza tomada sea del Taller 2 y que sea buena.

Respuesta:

a. 0

b.

190

15.0 PROBABILIDAD COMPUESTA

Es la probabilidad de ocurrencia simultánea de dos o más eventos independientes es el producto de las probabilidades de cada evento independiente.

La probabilidad compuesta o regla de multiplicación de probabilidades se deriva de la probabilidad condicionada:

La probabilidad de que se den simultáneamente dos sucesos (suceso intersección de A y B) es igual a la probabilidad a priori del suceso A multiplicada por la probabilidad del suceso B condicionada al cumplimiento del suceso A.

La fórmula para calcular esta probabilidad compuesta es:

Ejemplo 1º. Estudiamos el suceso A (porcentaje de varones mayores de 40 años casados) y el suceso B (varones mayores de 40 años con más de 2 hijos) y obtenemos la siguiente información:

Un 35% de los varones mayores de 40 años están casados.

De los varones mayores de 40 años y casados, un 30% tienen más de 2 hijos (suceso B condicionado al suceso A).

191

Calcular la probabilidad de que un varón mayor de 40 años esté casado y tenga más de 2 hijos (suceso intersección de A y B).

Por lo tanto:

P (A) = 0,35

P (B|A) = 0,30

P (A B) = 0,35 * 0,30 = 0,105

Es decir, un 10,5% de los varones mayores de 40 años están casados y tienen más de 2 hijos.

2º ejemplo: Estudiamos el suceso A (alumnos que hablan inglés) y el suceso B (alumnos que hablan alemán) y obtenemos la siguiente información:

Un 50% de los alumnos hablan inglés.

De los alumnos que hablan inglés, un 20% hablan también alemán (suceso B condicionado al suceso A).

Calcular la probabilidad de que un alumno hable inglés y alemán (suceso intersección de A y B).

Por lo tanto:

P (A) = 0,50

192

P (B|A) = 0,20

P (A B) = 0,50 * 0,20 = 0,10

Es decir, un 10% de los alumnos hablan inglés y alemán.

193

16.0 TEOREMA DE LA PROBABILIDAD TOTAL

El Teorema de la probabilidad total nos permite calcular la probabilidad de un suceso a partir de probabilidades condicionadas:

Ejemplo: supongamos que si llueve la probabilidad de que ocurra un accidentes es x% y si hace buen tiempo dicha probabilidad es y%. Este teorema nos permite deducir cuál es la probabilidad de que ocurra un accidente si conocemos la probabilidad de que llueva y la probabilidad de que haga buen tiempo.

La fórmula para calcular esta probabilidad es:

(Donde i toma valores entre 1 y n)

Es decir, la probabilidad de que ocurra el suceso B (en nuestro ejemplo, que ocurra un accidente) es igual a la suma de multiplicar cada una de las probabilidades condicionadas de este suceso con los diferentes sucesos A (probabilidad de un accidente cuando llueve y cuando hace buen tiempo) por la probabilidad de cada suceso A.

Para que este teorema se pueda aplicar hace falta cumplir un requisito:

194

Los sucesos A tienen que formar un sistema completo, es decir, que contemplen todas las posibilidades (la suma de sus probabilidades debe ser el 100%).

Ejemplo: al tirar una moneda, el suceso "salir cara" y el suceso "salir cruz" forman un sistema completo, no hay más alternativas: la suma de sus probabilidades es el 100%

Ejemplo: al tirar un dado, que salga el 1, el 2, el 3, o el 4 no forman un sistema completo, ya que no contempla todas las opciones (podría salir el 5 o el 6). En este caso no se podría aplicar el teorema de la probabilidad total.

Ejercicio 2º: Van a cambiar a tu jefe y se barajan diversos candidatos:

a) Carlos, con una probabilidad del 60%

b) Juan, con una probabilidad del 30%

c) Luis, con una probabilidad del 10%

En función de quien sea tu próximo jefe, la probabilidad de que te suban el sueldo es la siguiente:

a) Si sale Carlos: la probabilidad de que te suban el sueldo es del 5%.

b) Si sale Juan: la probabilidad de que te suban el sueldo es del 20%.

195

c) Si sale Luis: la probabilidad de que te suban el sueldo es del 60%.

En definitiva, ¿cual es la probabilidad de que te suban el sueldo?:

1.- Los tres candidatos forman un sistema completo

2.- Aplicamos la fórmula:

P (B) = (0,60 * 0,05) + (0,30 * 0,20) + (0,10 * 0,60) = 0,15

Por tanto, la probabilidad de que te suban el sueldo es del 15%.

196

17.0 TEOREMA DE BAYES

El Teorema de Bayes viene a seguir el proceso inverso al que hemos visto en el Teorema de la probabilidad total.

Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente).

Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (¿estaba lloviendo o hacía buen tiempo?).

La fórmula del Teorema de Bayes es:

Tratareremos de explicar esta fórmula con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que este teorema también exige que el suceso A forme un sistema completo.

Ejercicio 1º: El parte meteorológico ha anunciado tres posibilidades para el fin de semana:

a) Que llueva: probabilidad del 50%.

197

b) Que nieve: probabilidad del 30%

c) Que haya niebla: probabilidad del 20%.

Según estos posibles estados meteorológicos, la posibilidad de que ocurra un accidente es la siguiente:

a) Si llueve: probabilidad de accidente del 20%. ………. (inicialmente 10%)

b) Si nieva: probabilidad de accidente del 10% ……... (inicialmente 20%)

c) Si hay niebla: probabilidad de accidente del 5%. …… (inicialmente 5%)

Resulta que efectivamente ocurre un accidente y como no estábamos en la ciudad no sabemos que tiempo hizo (nevó, llovió o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades.

Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan probabilidades a priori (lluvia con el 50%, nieve con el 30% y niebla con el 20%).

Una vez que incorporamos la información de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A|B), que se denominan probabilidades a posteriori.

Vamos a aplicar la fórmula:

198

a) Probabilidad de que estuviera lloviendo:

La probabilidad de que efectivamente estuviera lloviendo el día del accidente (probabilidad a posteriori) es del 71,4%.

b) Probabilidad de que estuviera nevando:

La probabilidad de que estuviera nevando es del 21,4%.

c) Probabilidad de que hubiera niebla:

La probabilidad de que hubiera niebla es del 7,1%.

199

18.0 INDEPENDENCIA DE SUCESOS

Dos sucesos son independientes entre sí, si la ocurrencia de uno de ellos no afecta para nada a la ocurrencia del otro:

Ejemplo: el suceso estatura de los alumnos de una clase y el color del pelo son independientes: el que un alumno sea más o menos alto no va a influir en el color de su cabello, ni viceversa.

Para que dos sucesos sean independientes tienen que verificar al menos una de las siguientes condiciones:

P (B|A) = P (B) es decir, que la probabilidad de que se de el suceso B, condicionada a que previamente se haya dado el suceso A, es exactamente igual a la probabilidad de B.

Ejemplo: la probabilidad de que al tirar una moneda salga cara (suceso B), condicionada a que haga buen tiempo (suceso A), es igual a la propia probabilidad del suceso B.

P (A|B) = P (A) es decir, que la probabilidad de que se de el suceso A, condicionada a que previamente se haya dado el suceso B, es exactamente igual a la probabilidad de A.

Ejemplo: la probabilidad de que haga buen tiempo (suceso A), condicionada a que al tirar una moneda salga cara (suceso B), es igual a la propia probabilidad del suceso A.

200

P (A ∩ B) = P (A) * P (B) es decir, que la probabilidad de que se de el suceso conjunto A y B es exactamente igual a la probabilidad del suceso A multiplicada por la probabilidad del suceso B.

Ejemplo: la probabilidad de que haga buen tiempo (suceso A) y salga cara al tirar una moneda (suceso B), es igual a la probabilidad del suceso A multiplicada por la probabilidad del suceso B

Si el suceso A es independiente del suceso B, entonces el suceso B también es independiente del suceso A.

Ejemplo 1º: analicemos dos sucesos:

Suceso A: la probabilidad de que haga buen tiempo es del 0,4

Suceso B: la probabilidad de tener un accidente es del 0,1

Suceso intersección: la probabilidad de que haga buen tiempo y tener un accidente es del 0,08

Veamos si se cumple alguna de las condiciones señaladas:

P (B|A) = P (A ∩ B) / P (A) = 0,08 / 0,4 = 0,2 (que no es igual a P (B))

P (A|B) = P (A ∩ B) / P (B) = 0,08 / 0,6 = 0,133 (que no es igual a P (A))

201

P (A ∩ B) = 0,08 (que no es igual a P (A) multiplicado por P (B))

Por lo tanto, no se cumple ninguna de las tres condiciones señaladas por lo que estos dos sucesos no son independientes, sino que existe algún grado de dependencia entre ellos.

Ejemplo 2º: analicemos dos sucesos:

Suceso A: la probabilidad de que haga buen tiempo es del 0,4

Suceso B: la probabilidad de salir cara al lanzar una moneda es del 0,5

Suceso intersección: la probabilidad de que haga buen tiempo y que salga cara es 0,2

Veamos si se cumple alguna de las condiciones señaladas:

P (B|A) = P (A ∩ B) / P (A) = 0,2 / 0,4 = 0,5 (igual que P (B))

P (A|B) = P (A ∩ B) / P (B) = 0,2 / 0,6 = 0,4 (igual que P (A))

P (A ∩ B) = 0,2 (igual a P (A) multiplicado por P (B))

Por lo tanto, estos dos sucesos sí son independientes.

202

19.0 DISTRIBUCIONES DE PROBABILIDAD

Las distribuciones de probabilidad presentan una serie de valores que pueden representarse como un resultado en la ejecución de los experimentos.

Las variables aleatorias son las que generan toda distribución de probabilidad. Se conoce como aleatoria porque el valor tomado es completamente al azar.

Las variables aleatorias pueden ser:

Variable aleatoria discreta.

Variable aleatoria contínua.

Variable aleatoria discreta. Tomar únicamente valores enteros y un número finito de ellos.

Variable aleatoria continua (x). Porque puede tomar tanto valores enteros como fraccionarios y un número infinito de ellos dentro de un mismo intervalo.

19.1 Distribuciones discretas y continuas

Las distribuciones discretas son aquellas en las que la variable puede tomar un número determinado de valores:

Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un número de 1 al 6; en una ruleta el número puede tomar un valor del 1 al 32.

203

Las distribuciones continuas son aquellas que presentan un número infinito de posibles soluciones:

Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de una población (72,5 años, 7,513 años, 72, 51234 años).

A continuación estudiaremos exclusivamente las principales distribuciones discretas.

19.1.1. Distribuciones discretas: Bernoulli

Consiste en realizar un experimento aleatorio una sóla vez y observar si cierto suceso ocurre o no, siendo p la probabilidad de que sea así, éxito; y q=1-p el que no lo sea, fracaso. Como se puede observar se trata más que de una variable dicotómica, es decir que únicamente puede tomar dos modalidades, es por ello que el hecho de llamar éxito o fracaso a los posibles resultados de las pruebas obedece más una tradición literaria o histórica, en el estudio de las variables aleatorias que a la situación real que pueda derivarse del resultado.

La distribución de Bernoulli es una distribución de probabilidad discreta, que toma valor 1 para la probabilidad de éxito p y valor 0 para la probabilidad de fracaso q = 1 − p. La función probabilística de una variable de Bernoulli es:

204

http://es.wikipedia.org/wiki/Matem%C3%A1tica_discreta

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad


xi f(xi)

1 P

0 q

1

Luego:

X =

Por lo tanto, si X es una variable aleatoria con esta distribución tenemos:

Pr (X=1) = 1 – P(X=0) = p

Es el modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso:

Cuando es acierto la variable toma el valor 1

Cuando es fracaso la variable toma el valor 0

Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); probabilidad de ser

205

0 q = 1 – p = P(x =0)

1 p = P(x = 1)

admitido en una universidad (o te admiten o no te admiten); probabilidad de acertar una quiniela (o aciertas o no aciertas)

Al haber únicamente dos soluciones se trata de sucesos complementarios:

A la probabilidad de éxito se le denomina p

A la probabilidad de fracaso se le denomina q

Verificándose que:

p + q = 1

Veamos los ejemplos anteriores:

Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire:

Probabilidad de que salga cara: p = 0,5

Probabilidad de que no salga cara: q = 0,5

p + q = 0,5 + 0,5 = 1

Ejemplo 2: Probabilidad de ser admitido en la universidad:

Probabilidad de ser admitido: p = 0,25

Probabilidad de no ser admitido: q = 0,75

206

p + q = 0,25 + 0,75 = 1

Ejemplo. ¿Cuál es la probabilidad de los artículos defectuosos de una máquina que produce el 92 por ciento de artículos aceptables?

A={artículos aceptables}

B={artículos defectuosos}

P(A) + P(B) = 1

P(B) = 1 – P(A)

P(B) = 1 – 0.92 = 0.8

19.1.2 Distribuciones discretas: Binomial

Por sus aplicaciones la distribución Binomial es quizás la más importante, y su análisis es un caso particular de probabilidad de variable aleatoria discreta.

Esta distribución Binomial que corresponde a la realización de un experimento aleatorio cumple con las siguientes condiciones:

En el experimento sólo son posible dos resultados: un suceso llamado éxito (A), o su contrario (B), llamado fracaso.

Al repetir el experimento, el resultado obtenido es independiente de los resultados obtenidos anteriormente.

207

La probabilidad del suceso (A) es constante, es decir, no varía de una prueba del experimento a otra. Si llamamos p a la probabilidad de A, p(A) = P, entonces p(B) = 1 – p = q

La distribución Binomial parte de la distribución de Bernoulli.

La distribución binomial se aplica cuando se realizan un número n de veces el experimento de Bernoulli, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre:

0: si todos los experimentos han sido fracaso

n: si todos los experimentos han sido éxitos

Ejemplo: se tira una moneda 10 veces: ¿cuantas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10

La distribución de probabilidad de este tipo de distribución sigue el siguiente modelo:

Alguien entiende esta fórmula? Vamos a tratar de explicarla con un ejemplo:

208

Ejemplo 1: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?

k es el número de aciertos. En este ejemplo k igual a 6 (en cada acierto decíamos que la variable toma el valor 1: como son 6 aciertos, entonces k = 6)

n es el número de ensayos. En nuestro ejemplo son 10

p es la probabilidad de éxito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5

La fórmula quedaría:

Luego,

P (x = 6) = 0,205

Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda.

Ejemplo 2: ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces?

k (número de aciertos) toma el valor 4

n toma el valor 8

209

p (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666)

La fórmula queda:

Luego,

P (x = 4) = 0,026

Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el números 3 al tirar un dado 8 veces.

Ejemplos:

En una reunión de muchas personas, el 20% de los presentes no habla español. En un grupo de 5 personas tomada al azar:

a) ¿Cuál es la probabilidad de que ninguno hable español?

b) ¿Cuál es la probabilidad de que 4 hablen español.

Experimento aleatorio: repetir 5 veces la prueba de sacar al azar una persona.Variable aleatoria de las 5 pruebas: número de “éxitos” (o sea de personas que no hablen español) en las 5 pruebas.

210

Distribución binomial: X ~ B(5;0,20) es decir n = 5,

p = 0,20 y q = 1- p = 0,80.

a) Suceso=”ninguno habla español” ={X=5}

b) Suceso=”cuatro no hablan español”

19.1.3 Distribuciones discretas: Poisson

Este tipo de distribución es un caso particular de probabilidad de variable aleatoria discreta. Esta distribución debe su nombre al francés Siméon Denis Poisson (1781-1840) y se emplea en la descripción de muchos procesos.

Los éxitos buscados en este tipo de experimentos son expresados por unidad de área, tiempo, pieza, etc.

211

El modelo de Poisson abarca una gran clase de eventos y cada evento, por ejemplo, puede ser el número de ocurrencias de accidentes, errores, desastres u otros factores que aparecen aleatoria e independientemente en un tiempo continuo. Entre otros se cuentan las siguientes:

Cantidad de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc.

Emisión de partículas radioactivas. Volumen de contaminantes en el aire. Número de defectos de una tela por m2 Cantidad de bacterias por cm2 de cultivo Llamadas telefónicas a un conmutador por hora,

minuto, etc. Número de embarcaciones llegadas a un puerto

por día, mes, etc.

Cuando en una distribución binomial se realiza el experimento un número n muy elevada de veces y la probabilidad de éxito p en cada ensayo es reducida, entonces se aplica el modelo de distribución de Poisson:

Se tiene que cumplir que:

p < 0,10

p * n < 10

La distribución de Poisson sigue el siguiente modelo:

212

Vamos a explicarla:

El número e es 2,71828

= n * p (es decir, el número de veces n que se realiza el experimento multiplicado por la probabilidad p de éxito en cada ensayo)

k es el número de éxito cuya probabilidad se está calculando.

Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es independiente de otro producto dado.

Veamos un ejemplo:

La probabilidad de tener un accidente de tráfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, ¿cual es la probabilidad de tener 3 accidentes?

Como la probabilidad p es menor que 0,1, y el producto n * p es menor que 10, entonces aplicamos el modelo de distribución de Poisson.

213

Luego,

P (x = 3) = 0,0892

Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8,9%

Otro ejemplo:

La probabilidad de que un niño nazca pelirrojo es de 0,012. ¿Cuál es la probabilidad de que entre 800 recién nacidos haya 5 pelirrojos?

Luego,

P (x = 5) = 4,602

Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recien nacidos es del 4,6%.

Ejemplo:

Si un banco recibe en promedio (λ =) 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba:

214

a) cuatro cheques sin fondo en un día dado (x=k),

b) 10 cheques sin fondos en cualquiera de dos días consecutivos.

(e= 2.718281828)

Resolviendo para a:

a) k = 4; λ = 6 cheques sin fondo por día y sustituyendo en la fórmula

P(4 cheques sin fondo) = 0.01265 = 1.26%

Resolviendo para b:

b) k=10; = 6 x 2 = 12 cheques sin fondo en promedio que

llegan al banco en dos días consecutivos.

215

P(10 cheques sin fondo)= 0.10483=10.48%

19.1.4 Distribuciones discretas: Hipergeométrica

La distribución hipergeométrica es el modelo que se aplica en experimentos que correspondan a una población finita sin remplazo.

En una urna hay bolas de dos colores (blancas y negras), ¿cuál es la probabilidad de que al sacar 2 bolas las dos sean blancas?

Son experimentos donde, al igual que en la distribución binomial, en cada ensayo hay tan sólo dos posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribución binomial en que los distintos ensayos son dependientes entre sí.

Se puede concluir que los experimentos que tienen este tipo de distribución tienen las siguientes características:

a. Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.

b. Las probabilidades asociadas a cada uno de los resultados no son constantes.

216

c. Cada ensayo o repetición del experimento no es independiente de los demás.

d. El número de repeticiones del experimento (n) es constante.

Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca, en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes (hay dependencia entre los distintos ensayos).

La distribución hipergeométrica sigue el siguiente modelo:

Donde:

217

Vamos a tratar de explicarlo:

N: es el número total de bolas en la urna

N1: es el número total de bolas blancas

N2: es el número total de bolas negras

k: es el número de bolas blancas cuya probabilidad se está calculando

n: es el número de ensayos que se realiza

Veamos un ejemplo: en una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad de que 3 sean blancas?

Entonces:

N = 12; N1 = 7; N2 = 5; k = 3; n = 4

Si aplicamos el modelo:

Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%.

218

Pero este modelo no sólo se utiliza con experimentos con bolas, sino que también se aplica con experimentos similares:

Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al azar ¿Cuál es la probabilidad de que las 3 sean solteras?

Por lo tanto, P (x = 3) = 0,0175. Es decir, la probabilidad de que las 3 personas sean solteras es tan sólo del 1,75%.

219

19.1.5 Distribuciones discretas: Multinomial

La distribución multinomial es similar a la distribución binomial, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber múltiples resultados:

Ejemplo: a unas elecciones se presentaron 2 partidos políticos: el POPO obtuvo un 70% de los votos y el JEJE el 30% restante. ¿Cuál es la probabilidad de que al elegir 5 ciudadanos al azar, 4 de ellos hayan votado al JEJE?

Ejemplo: a esas elecciones se presentaron 4 partidos políticos: el POPO obtuvo un 40% de los votos, el JEJE el 30%, el MUMU el 20% y el LALA el 10% restante. ¿Cuál es la probabilidad de que al elegir 5 ciudadanos al azar, 3 hayan votado al POPO, 1 al MUMU y 1 al LALA?

La distribución multinomial sigue el siguiente modelo:

Donde:

X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que el partido POPO lo hayan votado 3 personas)

220

n: indica el número de veces que se ha repetido el suceso (en el ejemplo, 5 veces)

n!: es factorial de n (en el ejemplo: 5 * 4 * 3 * 2 * 1)

p1: es la probabilidad del suceso X1 (en el ejemplo, el 40%)

Veamos el ejemplo:

Luego:

P = 0,0256

Es decir, que la probabilidad de que las 5 personas elegidas hayan votado de esta manera es tan sólo del 2,56%

Nota: 0! es igual a 1, y cualquier número elevado a 0 es también igual a 1

Veamos otro ejemplo:

En una fiesta, el 20% de los asistentes son españoles, el 30% franceses, el 40% italiano y el 10% portugueses. En un pequeño grupo se han reunido 4 invitados: ¿cual es la probabilidad de que 2 sean españoles y 2 italianos?

221

Aplicamos el modelo:

Luego

P = 0,0384

Por lo tanto, la probabilidad de que el grupo esté formado por personas de estos países es tan sólo del 3,84%.

19.1.6 Distribuciones discretas: Multihipergeométrica

La distribución multihipergeométrica es similar a la distribución hipergeométrica, con la diferencia de que en la urna, en lugar de haber únicamente bolas de dos colores, hay bolas de diferentes colores.

Ejemplo: en una urna hay 7 bolas blancas, 3 verdes y 4 amarillas: ¿cuál es la probabilidad de que al extraer 3 bolas sea cada una de un color distinto?

La distribución multihipergeométrica sigue el siguiente modelo:

222

Donde:

X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que una de las bolas sea blanca)

N1: indica el número de bolas blancas que hay en la urna (en el ejemplo, 7 bolas)

N: es el número total de bolas en la urna (en el ejemplo, 14 bolas)

n: es el número total de bolas que se extraen (en el ejemplo, 3 bolas)

Veamos el ejemplo:

Luego:

P = 0,2307

223

Es decir, que la probabilidad de sacar una bola de cada color es del 23,07%.


En una caja de lápices hay 10 de color amarillo, 3 de color azul y 4 de color rojo. Se extraen 7 lápices, ¿cual es la probabilidad de que 5 sean amarillos y 2 rojos?

Aplicamos el modelo:

Luego

P = 0,0777

Por lo tanto, la probabilidad de que los 5 lápices sean de los colores indicados es del 7,77%.

224

19.1.7 Distribuciones continuas: Uniforme

En estadística la distribución uniforme es una distribución de probabilidad cuyos valores tienen la misma probabilidad.

La distribución uniforme es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad.

Es una distribución continua porque puede tomar cualquier valor y no únicamente un número determinado (como ocurre en las distribuciones discretas).

Se dice que una variable aleatoria X continua tiene una distribución uniforme en el intervalo [a,b] si la función de densidad de probabilidad (FDP) es

Ejemplo: el precio medio del litro de gasolina super durante el próximo año se estima que puede oscilar entre 196 ctvs. y 205 ctvs. americanos. Podría ser, por tanto, de 197, 198, 200 ctvs., etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad.

225

f(x) =

http://es.wikipedia.org/wiki/Funci%C3%B3n_de_densidad

http://es.wikipedia.org/wiki/Funci%C3%B3n_de_densidad

http://es.wikipedia.org/wiki/Probabilidad


http://es.wikipedia.org/wiki/Estad%C3%ADstica

Su función de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto del intervalo, viene definida por:

Donde:

b: es el extremo superior (en el ejemplo, 205 ctvs..)

a: es el extremo inferior (en el ejemplo, 196 ctvs.)

Por lo tanto, la función de distribución del ejemplo sería:

Es decir, que el valor final esté entre 196 ctvs. y 197 ctvs. tiene un 11% de probabilidad, que esté entre 200 ctvs. Y 2001 ctvs., otro 5%, etc.

El valor medio de esta distribución se calcula:

En el ejemplo:

226

Por lo tanto, el precio medio esperado de la gasolina para el próximo año es de 200.5 ctvs.


El volumen de precipitaciones estimado para el próximo año en la ciudad de Sevilla va a oscilar entre 400 y 500 litros por metro cuadrado. Calcular la función de distribución y la precipitación media esperada:

Es decir, que el volumen de precipitaciones esté entre 400 y 401 litros tiene un 1% de probabilidades; que esté entre 401 y 402 litros, otro 1%, etc.

El valor medio esperado es:

Es decir, la precipitación media estimada en Sevilla para el próximo año es de 450 litros.

227

19.1.8 Distribuciones continuas: Normal

La distribución normal se presenta como un caso particular de probabilidad de variable aleatoria continua. Fue el francés Abraham de Moivre (1667-1754) quién la estableció y posteriormente, Carl Friedrich Gauss (1777-1855) elaboró estudios más profundos y formuló la ecuación de la curva; de ahí que también se le conozca, más comúnmente, como la campana de Gauss.

La distribución de una variable normal está completamente determinada por dos parámetros, su media (µ) y su desviación estándar (σ). Con esta notación, la densidad de la normal viene dada por la ecuación:

Esta fórmula determina la curva en forma de campana,

conocida como campana de Gaus. En general, la función de densidad de cualquier v.a. normal tiene una gráfica similar, siempre simétrica respecto de la media.

228

Es el modelo de distribución más utilizado en la práctica, ya que multitud de fenómenos se comportan según una distribución normal.

Esta distribución de caracteriza porque los valores se distribuyen formando una campana de Gauss, en torno a un valor central que coincide con el valor medio de la distribución.

Un 50% de los valores están a la derecha de este valor central y otro 50% a la izquierda

Propiedad

No importa cuáles sean los valores de µ y σ para una distribución de probabilidad normal, el área total bajo la curva siempre es 1, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que:

229

Aproximadamente el 68% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 1 desviación estándar de la media.

Aproximadamente el 95.5% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 2 desviaciones estándar de la media.

230

Aproximadamente el 99.7% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 3 desviaciones estándar de la media.

La distribución Normal viene definida por dos parámetros:

X: N (µ, σ2)

µ: es el valor medio de la distribución y es precisamente donde se sitúa el centro de la curva (de la campana de Gauss).

σ2: es la varianza. Indica si los valores están más o menos alejados del valor central: si la varianza es baja los valores están próximos a la media; si es alta, entonces los valores están muy dispersos.

231

Cuando la media de la distribución es 0 y la varianza es 1se denomina normal tipificada, y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución. Además, toda distribución normal se puede transformar en una normal tipificada:

Ejemplo: una variable aleatoria sigue el modelo de una distribución normal con media 10 y varianza 4. Transformarla en una normal tipificada.

X: N (10, 4)

Para transformarla en una normal tipificada se crea una nueva variable (Y) que será igual a la anterior (X) menos su media y dividida por su desviación típica (que es la raíz cuadrada de la varianza)

En el ejemplo, la nueva variable sería:

Esta nueva variable se distribuye como una normal tipificada, permitiéndonos, por tanto, conocer la probabilidad acumulada en cada valor.

Y: N (0, 1)

232

BIBLIOGRAFÍA

1. Bello, León Darío. 2005. Estadística como apoyo a la Investigación. Editorial L. Vieco e Hijas Ltda.

2. Cabrera, C. and Jaramillo, J. 1997. Estadística

Inferencial. Universidad Técnica de Loja. Ecuador. Pp 510

3. Calzada B, José. 1966. Estadística General con Énfasis en Muestreo. Editorial Jurídica, S.A. Primera Edición. Lima – Perú. Pp 518.

4. Casco F., Ignacio. 2006 Introducción a la probabilidad. Departamento de Estadística. Universidad Calos III de Madrid. Madrid – España.

5. Daniel, Wayne W. 1988. Bioestadística: Base para el análisis de las ciencias de la salud. Noriega editores. Editorial Limusa. Tercera edición. México.

6. Díaz, Ramón et all. 1999. El Análisis de Varianza y sus aplicaciones. Centro de Estudios Forestales de Postgrado. Universidad de los Andes. Mérida Venezuela. Pp 540

233

7. Fantoni C, Héctor. 1975. Distribuciones Bidimensionales de Frecuencias. Regresión y Correlación. Segunda Edición. Guayaquil – Ecuador. Pp 167.

8. _________________ 1980. Generalidades y Distribuciones Unidimensionales de Frecuencias. Segunda Edición. Guayaquil – Ecuador. Pp 221.

9. _________________ 1976. Curso de Estadística General. Análisis Metodológico. Guayaquil – Ecuador. Pp 217

10. Freese, Frank. Linear Regresión Methods for Forest Research. Forest Products Laboratory. Forest Service U.S. Department of Agriculture. Pp 134

11. ____________ 1974. Freese, Frank. Elementary Statistical Methods for Foresthers Products Laboratory. Forest Service U.S. Department of Agriculture in cooperation with the University of Wisconsin. Agriculture Handbook 317. Washington. United State. Pp 134

12. Grisales Romero Hugo. 2002. Estadística Aplicada en Salud Pública: Estadística Descriptiva y Probabilidad. Editorial L-Vieco e Hijas.

234

13. Hoel, Paul. Estadística Elemental. Nueva Edición. Los Angeles – California, 1966. Pp 396.

14. Kalton, G. 1974. Introducción a los conceptos estadísticos. Instituto de Estadística Aplicada y Computación. Universidad de los Andes. Mérida Venezuela. Pp 80.

15. Kazmier, Leonardo. 1998. Estadística aplicada a la administración y a la economía. McGraw Hill Interamericana de Editores, S.A. Mexico.

16. Laplace, Pierre Simon de. 1988. Ensayo Filosófico sobre las Probabilidades. Alianza Editorial. El libro de bolsillo-SEP.

17. Marques de Cantú, María José. Probabilidades y Estadística. Para Ciencias Químico-Biológicas. Editorial McGraw-Hill 1991

18. Meyer, Paul. 1973. Probabilidad y Aplicaciones Estadísticas. Versión en Español. Departamento de Estadísticas. Universidad Católica de Chile. Fondo Educativo Interamericano, S.A. Pp 231.

19. Milton, J. Susan, 2001. Estadística para la Biología y Ciencias de la Salud. Editorial McGraw-Hill. Tercera Edición. España

235

20. Ogaya, Noel. 1980. Algunos aspectos de regresión y correlación. Universidad de los Andes. Facultad de Ciencias Forestales. Mérida venezuela. Pp 97

21. Vidal, Juan. 1984. Estadística. Ejercicios de Inferencia Estadística. Faculta de Economía. Universidad de los Andes. Mérida – Venezuela. Pp 70

22. Ya-Lun Chou. Análisis Estadístico. Nueva Editorial Interamericana, S.A. Primera Edición. Impreso en Mexico, 1972. Pp 85

236

Documents

ESTADÍSTICA BASICA-LIBRO