121
I Licenciatura en Informática Administrativa Probabilidad y Estadística

LIA Probabilidad y a

Embed Size (px)

Citation preview

Page 1: LIA Probabilidad y a

I

Licenciatura en Informática

Administrativa

Probabilidad y Estadística

Page 2: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA II

ÍNDICE

PRIMER DOCUMENTO: MANUAL DEL ESTUDIANTE ----------- ------- 2

1. LOS MATERIALES DIDÁCTICOS. --------------------- ------------------------------------- 2

2. CARACTERÍSTICAS DE LA MODALIDAD EDUCATIVA NO ESC OLARIZADA. ------------------------------------------------------------------------------------------------------------ 4

3. RECOMENDACIONES PARA FACILITAR EL ESTUDIO INDEPE NDIENTE. -- 5

4. CARACTERÍSTICAS PROPIAS DE LA MATERIA DE: ESTADÍ STICA. --------- 7

SEGUNDO DOCUMENTO: GUÍA DIDÁCTICA ----------------- ------------ 9

BIENVENIDA ---------------------------------------- -------------------------------------------------- 9

PRESENTACIÓN DE LA GUÍA DE ESTUDIO ---------------- ------------------------------ 10

OBJETIVOS GENERALES DE LA ASIGNATURA. ------------- -------------------------- 10

DESCRIPCIÓN DEL CURSO. ------------------------------------------------------------------- 10

METODOLOGÍA --------------------------------------- ---------------------------------------------- 11

CRITERIOS DE EVALUACIÓN --------------------------- -------------------------------------- 13

POLÍTICAS DEL CURSO. ------------------------------ ------------------------------------------ 14

AYUDAS -------------------------------------------- --------------------------------------------------- 14

HERRAMIENTAS Y UTILERÍAS -------------------------- ------------------------------------- 14

INTRODUCCIÓN ------------------------------------------------------------------- 16

UNIDAD 01. PROBABILIDAD --------------------------- ----------------------- 17

1.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 17

1.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 17

1.3 LECTURAS RECOMENDADAS ------------------------- ---------------------------------- 17

1.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS - ------------------ 18

UNIDAD 02. VARIABLES ALEATORIAS ------------------- ---------------- 19

2.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 19

2.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 19

2.3 LECTURAS RECOMENDADAS ------------------------- ---------------------------------- 19

2.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS - ------------------ 20

UNIDAD 03. DISTRIBUCIONES DISCRETAS --------------- -------------- 21

3.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 21

3.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 21

3.3 LECTURAS RECOMENDADAS ------------------------- ---------------------------------- 21

3.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS - ------------------ 22

UNIDAD 04. DISTRIBUCIONES CONTINUAS --------------- -------------- 23

4.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 23

4.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 23

4.3 LECTURAS RECOMENDADAS ------------------------- ---------------------------------- 23

4.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS - ------------------ 24

Page 3: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA III

UNIDAD 05. DISTRIBUCIÓN NORMAL -------------------- ----------------- 25

5.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 25

5.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 25

5.3 LECTURAS RECOMENDADAS ------------------------- ---------------------------------- 25

5.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS - ------------------ 26

UNIDAD 06. INFERENCIAS EN UNA POBLACIÓN. ---------- ----------- 27

6.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 27

6.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 27

6.3 LECTURAS RECOMENDADAS ------------------------- ---------------------------------- 27

6.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS - ------------------ 28

TERCERA PARTE: TEXTO DE AUTOAPRENDIZAJE ----------- ------- 30

P R E S E N T A C I Ó N -------------------------------------------------------------------------- 30

UNIDAD 01. INTRODUCCIÓN A LA ESTADÍSTICA PARA INFORMÁTICA --------------------------------------- ------------------------------ 31

OBJETIVOS PARTICULARES ---------------------------- -------------------------------------- 31

TEMAS Y SUBTEMAS: --------------------------------- ------------------------------------------ 31

Importancia y aplicación de la probabilidad y estad ística para la Informática ----------------------------------------------------------------------------------------------------------- 32

El papel de la estadística en la toma de decisiones ----------------------------------- 32

Estadística descriptiva e inferencial y probabilida d----------------------------------- 32

El espacio de los sucesos. -------------------------------------------------------------------------------- 33

Azar, suceso aleatorio -------------------------------------------------------------------------------------- 33 Probabilidad -------------------------------------------------------------------------------------------------- 34 Axiomas de Kolmogorov ----------------------------------------------------------------------------------- 34 Otras propiedades de las probabilidades. ------------------------------------------------------------- 35

ACTIVIDADES DE APRENDIZAJE ------------------------ ------------------------------------ 36

AUTOEVALUACIÓN ------------------------------------ ------------------------------------------- 37

UNIDAD 02. VARIABLES ALEATORIAS ------------------- ---------------- 38

2.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 38

2.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 38

INTRODUCCIÓN: VARIABLES ALEATORIAS ---------------- ------------ 39

Variables Continuas y Discretas ------------------- ------------------------------------------ 40

Variables cualitativas y cuantitativas ------------ ------------------------------------------- 40

Descripción de variables cualitativas ------------------------------------------------------------------- 40 Diagrama de barras. ---------------------------------------------------------------------------------------- 44 Descripción de variables cuantitativas ----------------------------------------------------------------- 45

Organización y clasificación de los datos de las ta blas ----------------------------- 47

Probabilidad básica ------------------------------- ------------------------------------------------ 48

Distribuciones de probabilidad -------------------- ------------------------------------------- 52

Función de probabilidad ----------------------------------------------------------------------------------- 52 Función de distribución ------------------------------------------------------------------------------------ 53

Función de densidad --------------------------------------------------------------------------------------- 54 Función de distribución ------------------------------------------------------------------------------------ 56

Page 4: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA IV

Valor esperado de una variable -------------------- ------------------------------------------- 57

Media --------------------------------------------- ------------------------------------------------------ 59

Varianza ------------------------------------------ ----------------------------------------------------- 60

Desviación estándar o típica----------------------- -------------------------------------------- 61

El coeficiente de variación ----------------------- ---------------------------------------------- 62

Covarianza ---------------------------------------- --------------------------------------------------- 62

Coeficiente de correlación ------------------------ ---------------------------------------------- 63

Ejemplos ------------------------------------------ ---------------------------------------------------- 64

UNIDAD 03. DISTRIBUCIONES DISCRETAS --------------- -------------- 66

3.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 66

3.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 66

Distribuciones de variables discretas ------------- ----------------------------------------- 67

Distribución uniforme ----------------------------- ----------------------------------------------- 67

Distribución binomial ----------------------------- ----------------------------------------------- 68

Distribución hipergeométrica ---------------------- ------------------------------------------- 71

Distribución de Poisson --------------------------- ---------------------------------------------- 73

UNIDAD 05. DISTRIBUCIÓN NORMAL -------------------- ----------------- 77

5.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 77

5.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 77

Distribución normal ------------------------------- ------------------------------------------------ 78

AUTOEVALUACIÓN ------------------------------------ ------------------------------------------- 81

UNIDAD 06. INFERENCIAS EN UNA POBLACIÓN. ---------- ----------- 82

6.1 OBJETIVOS PARTICULARES ------------------------ ------------------------------------ 82

6.2 TEMAS Y SUBTEMAS: ----------------------------- ----------------------------------------- 82

Introducción -------------------------------------- --------------------------------------------------- 83

Distribuciones de muestreo en la media ------------ -------------------------------------- 84

Definiciones --------------------------------------------------------------------------------------------------- 84

Distribución de la media muestral X : ------------------------------------------------------------------ 86 La distribución de muestreo de S2: ---------------------------------------------------------------------- 87 Distribución F: ------------------------------------------------------------------------------------------------ 88 Distribución de la proporción muestral: ---------------------------------------------------------------- 89

Muestreo simple, sistemático, conglomerado y estrat ificado --------------------- 89

Muestreo aleatorio simple --------------------------------------------------------------------------------- 89 Muestreo estratificado -------------------------------------------------------------------------------------- 90 Muestreo por conglomerados ---------------------------------------------------------------------------- 91 Muestreo por etapas ---------------------------------------------------------------------------------------- 93 Muestreo aleatorio sistemático --------------------------------------------------------------------------- 93

Distribuciones de muestreo de la proporción y de la diferencia------------------ 93

Proporción poblacional ------------------------------------------------------------------------------------- 93 Distribución de la diferencia de proporciones -------------------------------------------------------- 94 Distribución del cociente de varianzas ----------------------------------------------------------------- 95

Cuadros de referencia ----------------------------- ---------------------------------------------- 96

AUTOEVALUACIÓN ------------------------------------ ------------------------------------------- 97

Intervalos de confianza --------------------------- ----------------------------------------------- 98

Concepto ------------------------------------------------------------------------------------------------------ 98

Page 5: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA V

Intervalo de confianza -------------------------------------------------------------------------------------- 98

Estimación de la media poblacional a partir de la m edia muestral -------------- 99

Intervalo de confianza para la media, cuando se selecciona una muestra aleatoria de tamaño n de una población con distribución normal con media y varianza conocida. - 99 Intervalo de confianza para la media si se selecciona una muestra aleatoria de tamaño n 30 de una población con distribución diferente a la normal. --------------------------------- 100 Intervalo de confianza para la media si se selecciona una muestra aleatoria de tamaño n<30. --------------------------------------------------------------------------------------------------------- 101

Determinación del tamaño de la muestra para estimar la media --------------- 102

Conceptos básicos ---------------------------------------------------------------------------------------- 102 Tamaño de muestra para estimar la media de la población ------------------------------------ 103

La prueba de hipótesis para media y proporción ---- -------------------------------- 104

Prueba de hipótesis para la media si la población de donde se obtiene la muestra tiene distribución normal con conocida. ------------------------------------------------------------------ 107

Prueba de hipótesis para la media si se selecciona una muestra aleatoria de tamaño n 30 de una población con cualquier distribución. ------------------------------------------------------- 110 Prueba de hipótesis para la media si se selecciona una muestra aleatoria de tamaño n<30 ----------------------------------------------------------------------------------------------------------------- 111 Prueba de hipótesis para la proporción -------------------------------------------------------------- 112

Errores en prueba de hipótesis -------------------- ----------------------------------------- 114

BIBLIOGRAFÍA -------------------------------------- ----------------------------- 116

Page 6: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 1

Manual del Estudiante

Page 7: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 2

PRIMER DOCUMENTO: MANUAL DEL ESTUDIANTE

1. LOS MATERIALES DIDÁCTICOS. La Licenciatura en Informática Administrativa de la Universidad Vasco de Quiroga, con la misión de ofrecer a la comunidad los mejores servicios profesionales a nivel superior, para toda aquella persona que busca la superación personal y académica que en la actualidad se requiere, y que por no poderse ajustar a los sistemas tradicionales necesita de alternativas serias y accesibles para continuar con la construcción de una vida con mayores elementos para su crecimiento, por lo tanto, ofrece los estudios de Informática Administrativa en su Modalidad No Escolarizada. Donde estudiante encontrará:

• La Mejor Alternativa de Estudios Superiores de Lice nciatura en Informática Administrativa en su modalidad No Escol arizada.

MATERIALES DIDÁCTICOS DE ALTA CALIDAD. Son los elementos de apoyo para el aprendizaje, lo constituyen la Guía Didáctica de Estudio y el propio Texto de Autoaprendizaje por asignatura de la Universidad Vasco de Quiroga, diseñados para lograr la mejor comprensión de los diferentes contenidos temáticos y así alcanzar los objetivos académicos preestablecidos.

Los materiales especiales para el Sistema No Escolarizado, están concebidos de tal forma, que se cumplan los objetivos del curso, que satisfagan las necesidades que reclaman las actividades de aprendizaje e integradoras, es decir, que constituyan un verdadero instrumento de apoyo para los estudiantes, mediante el cual se facilite responsablemente el logro de todo el quehacer académico de la asignatura.

Para una mejor identificación y aprovechamiento de los referidos Materiales Didácticos, a continuación se aporta una breve semblanza de éstos:

1. GUÍA DIDÁCTICA DE ESTUDIO . Que constituye precisamente la guía para

el estudiante que se integra a la modalidad no escolarizada y que desea aprobar cada una de las asignaturas. Guía que contiene objetivos generales y particulares de aprendizaje, desarrollo temático y de subtemas, actividades de aprendizaje, actividades integradoras, formas de evaluación y acreditación, bibliografía básica y complementaria, cuestionarios de auto evaluación, glosarios y demás elementos importantes para lograr el autoaprendizaje, que a continuación se detallan:

Las Guías Didácticas de Estudio , se integran por las partes siguientes:

a) Presentación. Que señala el objetivo de la misma (Objetivo de Aprendizaje) . Enunciado propositivo que establece qué se espera de un estudiante al término del proceso de

Page 8: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 3

aprendizaje, (por curso, materia o unidad), la temática, los propósitos de las actividades de aprendizaje e integradoras y los mecanismos para mantener un contacto permanente con los estudiantes.

b) Sugerencias Metodológicas. Descripción del método o técnicas utilizadas por el asesor, importantes para la mejor comprensión de los temas, así como sugerencias en cuanto a la búsqueda de la información, el desarrollo de actividades y los mecanismos de intercambio de experiencias significativas.

c) Criterios de Evaluación. Donde el asesor considere aspectos tales como el desarrollo de actividades de aprendizaje por tema, entrega de actividades integradores, actividades complementarias y exámenes. Criterios que deben de señalarse desde el principio a los estudiantes, con el fin de generar un clima de orden y confianza entre el asesor y el estudiante.

d) Introducción a la Asignatura. Donde se proporcione al alumno un panorama general del contenido y pueda percibir de forma completa el propósito de la asignatura y de la guía didáctica, evitando con esto dispersión y desgaste innecesario de energías.

e) Estructura por Unidad de Aprendizaje. En donde se conformarán los Objetivos de Aprendizaje, los temas, los conceptos y tópicos a revisar, las Fuentes de Información Básicas y Secundarias y, las actividades de aprendizaje. Que buscarán con todo ello verificar el aprendizaje significativo.

f) Actividad de Aprendizaje. Son todas aquellas actividades que el asesor prevé con el propósito de facilitar y comprobar el aprendizaje de los alumnos y la adquisición de las habilidades necesarias para aplicar los conocimientos adquiridos a su vida personal y futuro ejercicio profesional.

g) Actividad Integradora. Que debe buscar el desarrollo de habilidades propuestas para cada curso, una actitud crítica y de análisis ante los objetos de estudio, aplicación de conocimientos en los casos prácticos planteados por el asesor, asimilación del método de trabajo, y sobre todo, calidad y profundidad.

2. TEXTO DE AUTOAPRENDIZAJE . (TEXTO DE AUTOENSEÑANZA). Que consiste en la Selección de información básica y complementaria, necesaria para cubrir los objetivos temáticos de aprendizaje que exige la asignatura, conformado por: • Presentación. • Índice. • Introducción.

Page 9: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 4

• Objetivos Generales de la Asignatura. • Desarrollo del Contenido Temático. • Unidad Temática desarrollada en Temas y Subtemas. • Texto de las Lecturas Básicas correspondientes a la unidad temática. • Actividades de Aprendizaje • Autoevaluación. • Datos Bibliográficos de los Textos Básicos y Complementarios. • Glosario de Términos propios de la Asignatura.

2. CARACTERÍSTICAS DE LA MODALIDAD EDUCATIVA NO ESCOLARIZADA.

La modalidad de Educación No Escolarizada , se basa en el estudio independiente (autodidactismo o proceso autogestivo del aprendizaje), dirigido a personas que por distintas causas no pueden integrarse al sistema tradicional escolarizado, pero que están comprometidos con la superación humana y profesional.

Es por ello que la Lic. en Informática Administrativa de la Universida d Vasco de Quiroga , es la mejor opción de desarrollo para sus protagonistas, debido a que la institución se encuentra constituida por una comunidad académica, que, de modo riguroso y crítico, contribuye a la tutela y desarrollo de la dignidad humana, de la herencia cultural y la develación de la verdad mediante la investigación, la enseñanza y los diversos servicios ofrecidos a las comunidades locales, nacionales e internacionales. En donde los estudiantes son personas que se transforman en sujetos activos y comprometidos en el proceso de aprendizaje, y sus Asesores , son profesionales en contenidos curriculares y aspectos pedagógicos, que utilizan los instrumentos didácticos que le ofrece la tecnología educativa, para orientar, guiar o aconsejar a los estudiantes del sistema no escolarizado, y así alcanzar la verdad. La Lic. Informática Administrativa de la Universida d Vasco de Quiroga, con el propósito de garantizar el éxito de todos estos grandes esfuerzos, ha establecido Curso de Inducción que tiene como propósito dejar en claro la misión de la universidad, tanto en lo general como en lo particular del programa elegido. Además por ser fundamental, informar del perfil y de los compromisos que el aspirante debe cumplir al momento de ser aceptado, y que son:

• El convencimiento de que sus habilidades y limitaciones como estudiantes independientes son los mínimos indispensables para iniciar la licenciatura en este modelo educativo.

• Que está dispuesto a afrontar el reto personal de utilizar los métodos y técnicas de estudio que el sistema requiere.

Page 10: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 5

• Que es capaz de planear adecuadamente su tiempo para el estudio y la evaluación.

• Que está dispuesto a retomar las técnicas de estudio sugeridas por el asesor, así como materiales y actividades.

• No utilizar ningún pretexto para evadir su responsabilidad. • Que valore la importancia de los imprevistos ante sus compromisos de

estudio. Los estudiantes del sistema no escolarizado deben tener la certeza que se cuenta con los mejores asesores , los cuales han demostrado tener disposición y capacidad para:

a) Crear ambientes propicios para el aprendizaje. b) Facilitar la retroalimentación de experiencias que le permita anticiparse a

los problemas, sugiriendo alternativas de solución, buscando respuestas y explicaciones a los mismos.

c) Generar reflexión, confrontación y análisis que permitan la construcción de conocimientos significativos.

d) Respetar el ritmo de aprendizaje y los intereses del estudiante. e) No fragmentar el conocimiento, sino integrar lógicamente los contenidos

con una perspectiva interdisciplinaria. f) Apoyar la investigación como instrumento de generación de respuestas

a interrogantes y soluciones a problemas. g) Provocar que los estudiantes arriben a la síntesis fundada y motivada

del tema visto, a la aportación de nuevas experiencias de aprendizaje, a generar preguntas sobre aspectos dudosos, para que al final generen su propia autoevaluación.

3. RECOMENDACIONES PARA FACILITAR EL ESTUDIO INDEPENDIENTE. PRIMERA. Para obtener mejores resultados de los materiales didácticos del sistema no escolarizado, el estudiante debe consultar las guías, tratar de realizar de forma ordenada las actividades para el logro de objetivos, reunirse con el asesor cuantas veces lo necesite en los tiempos predeterminados y a través de los medios de comunicación elegidos, acudir a los grupos de estudio que existan en su localidad, apoyarse en conferencias complementarias, relacionar lo que aprende con su vida práctica, asistir a las sesiones de retroalimentación, contemplar sus actividades fijas y su tiempo libre, tener presente los tiempos necesarios para el descanso y la vida cotidiana, establecer tiempos fijos de estudio y prever flexibilidad para los imprevistos. Los materiales didácticos para educación no escolarizada, recuérdese que son elaborados por equipos interdisciplinarios, cuyos contenidos forman un paquete

Page 11: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 6

didáctico. Que responden a las preguntas: ¿Por qué se elabora el material? ¿A quién está dirigido? ¿Quién lo selecciona y cómo se va a organizar? ¿Qué medios de comunicación son los más idóneos?

Materiales que provienen y remiten a distintas fuentes de información, con el propósito de provocar la reflexión y actitud crítica de los participantes, su inventiva y originalidad de respuestas, están elaborados en base a los contenidos a enseñar así como los intereses y necesidades de los participantes. Organizados a través de situaciones problemáticas, que requieran una solución y pueda plantearse en el curso. SEGUNDA. Las asesorías serán individuales o grupales. Asesoría Individual. Deberá partir de una evaluación diagnóstica y compromisos de tiempo de estudio y evaluación, para seguir con la obtención de información de la materia a cursar, en donde el estudiante debe de esforzarse por resolver el problema, antes de acudir con el asesor, quien precisamente le clarificará sus dudas y se retroalimentará de información complementaria significativa.

Asesoría Grupal. Que buscará el intercambio de experiencias de aprendizaje, actualizando y profundizando el conocimiento de la materia, que le permita facilitar la elaboración de sus actividades, mediante la socialización y confrontación de opiniones, para aplicar lo teóricamente adquirido al campo de la realidad. TERCERA. Las principales Obligaciones del estudiante son:

• Estudiar personalmente de cada asignatura, ya que de él dependerá el éxito de su aprendizaje.

• Asistir o participar en las Asesorías, de manera presencial o utilizando los medios electrónicos.

• El alumno que no asista o no participe en las asesorías, debe informar a su asesor para acordar conjuntamente las acciones a seguir, sobre todo en aquellos casos en los que la evaluación no se sujete solo a un examen, sino existan además, trabajos que presentar o actividades que desarrollar, las cuales deben ser reportadas puntualmente.

• Acordar con los asesores sobre los procedimientos a seguir para la recepción de trabajos, en el caso de los alumnos foráneos.

• Presentarse en los tiempos y formas establecidas por la Universidad para la práctica de las evaluaciones correspondientes, así como entregar el producto de las actividades solicitadas.

• No recibir o prestar ayuda fraudulenta en las evaluaciones o exámenes correspondientes.

• La asistencia a las asesorías no es obligatoria, pero sí recomendable por las importantes aclaraciones, aportaciones y correcciones que pueda sugerirle el asesor de forma personalizada.

Page 12: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 7

4. CARACTERÍSTICAS PROPIAS DE LA MATERIA DE: ESTADÍSTICA. La Estadística es una rama de las matemáticas que busca interpretar un gran volumen de información como es el caso de la estadística descriptiva, con objeto de conocer algunas características de interés acerca de una población en particular, esta información es de gran ayuda para la Informática, dado que contribuye a diseñar estrategias eficaces para comerciar productos. Por otra parte sabemos lo complicado que es, realizar un estudio que con lujo de detalles describa a una población en su conjunto, por lo que la inferencia estadística busca tomar una muestra que sea representativa de una población y a partir de ahí, tomar decisiones e interpretar sus detalles. Exige del estudiante un conocimiento básico de matemáticas, de razonamiento lógico, capacidad de abstracción y deducción, así como un especial interés por los detalles, pero sin duda es una herramienta poderosa para la interpretación y solución de problemas sociales y empresariales. BIENVENIDO Y MUCHO ÉXITO!

!!!!!BIENVENIDO LA ESTUDIO DE LA ESTADÍSTICA Y MUCH O ÉXITO!!!!!

Page 13: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 8

Guía didáctica

Page 14: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 9

SEGUNDO DOCUMENTO: GUÍA DIDÁCTICA BIENVENIDA

LA UNIVERSIDAD VASCO DE QUIROGA Te da la más cordial bienvenida al estudio de ESTADÍSTICA. Esta asignatura se imparte dentro la modalidad de Educación No Escolarizada y es parte integrante DE LA LICENCIATURA EN INFORMÁTICA ADMINISTRATIVA.

Queremos refrendarte una calurosa felicitación por haber seleccionado esta forma de estudio como una opción de acrecentar tus conocimientos. Solo ten presente que la tecnología es solo una herramienta para poderte hacer llegar el conocimiento y que para poder asimilarlo se requiere de un importante esfuerzo y compromiso por parte tuya. Recuerda que durante este proceso de aprendizaje eres la parte más importante y que nosotros estamos para que puedas lograr con éxito tus metas de estudio; cuentas con todas las herramientas necesarias y un gran equipo de personas expertas en diferentes especialidades están listas para poder auxiliarte en caso de que surja algún inconveniente o problema. Ten presente que para poder acreditar el curso debes de realizar las actividades que te marque tu profesor/asesor. y además debes participar activamente en las reuniones que tu asesor convenga con el grupo para clarificar tus dudas. Para poder seguir satisfactoriamente los cursos que ofrecemos en la modalidad No Escolarizada te requerimos tengas conocimientos básicos de herramientas computacionales y que sepas navegar por internet, ya que éste medio nos puede servir como herramienta en la búsqueda de conocimientos, además de canal de comunicación, el caso que sientas que no cuentas con la experiencia necesaria en el manejo de la computadora te aconsejamos que puedas tomar algún curso especial.

Recuerda siempre que ante cualquier duda, comentario o sugerencia puedes hacérnoslo saber para así poder mejorar y poder brindarte un servicio educativo de calidad, puedes hacerlo a través del asesor de la materia que estés cursando o puedes dirigirte al Coordinador Académico.

Esperamos que disfrutes la experiencia de estudiar en esta modalidad, pronto descubrirás las grandes ventajas y bondades que tiene esta forma de estudio, por lo pronto dedícate a estudiar con empeño y recuerda que no estás solo, estamos contigo. ¡Mucho Éxito!

Page 15: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 10

PRESENTACIÓN DE LA GUÍA DE ESTUDIO Esta guía es un auxiliar para los estudiantes que cursan los estudios en la modalidad No Escolarizada. En especial, busca orientarlos sobre el contenido de la asignatura de ESTADÍSTICA PARA INFORMÁTICA , así como de las actividades que se realizarán durante la duración del mismo. Toda la información se encuentra contenida en esta guía.

CREDITOS El material utilizado para el desarrollo de la presente asignatura fue producido y digitalizado por la Universidad Vasco de Quiroga, a partir de los trabajos e investigaciones realizadas por: Profesor: FAUSTO ARREGUÍN HUERTA Correo Electrónico: [email protected] Título: INGENIERO INDUSTRIAL. OBJETIVOS GENERALES DE LA ASIGNATURA.

Al término del cuatrimestre el alumno será capaz de conocer y aplicar diversas metodologías de recopilación y organización de datos y los representará y analizará mediante tablas, gráficas y diagramas. Conocerá e interpretará las principales distribuciones de probabilidad como herramientas básicas de la toma de decisiones en el área de Informática. Formulará y seleccionará el modelo de distribución adecuado a un problema específico. Explicará la importancia y finalidad del muestreo y su relación con la estimación de parámetros poblacionales. Inferirá sobre el comportamiento de una población de interés mediante el uso de técnicas de muestreo. Conocerá y explicará la utilidad del análisis de regresión para la toma de decisiones. Conocerá y aplicará herramientas computacionales de apoyo para la recopilación, medición y análisis de datos obtenidos de conteo y encuestas.

DESCRIPCIÓN DEL CURSO. El curso de PROBABILIDAD Y ESTADÍSTICA , comprende los siguientes temas generales

Page 16: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 11

1. Recolección análisis y representación de datos. 2. Medidas de centralización y dispersión. 3. Distribuciones de probabilidad. 4. Distribuciones de muestreo. 5. Estimación y decisión estadística Para con todo esto, al concluir con el Aprendizaje de ESTADÍSTICA, contarás con conocimientos que te servirán de referencia para otras materias en el transcurso de tu carrera. METODOLOGÍA La presente GUÍA DIDÁCTICA, se enfoca principalmente a recordarte que en ningún instante estarás sin apoyo, para ello, buscará siempre el intercambio de experiencias entre los interlocutores para aclarar dudas, facilitar la investigación y ofrecer sugerencias sobre el mejor manejo de la información, así como incorporar toda aportación que surja para mejorar el Ambiente de Aprendizaje. Se te sugiere que para lograr de mejor forma estos propósitos, es conveniente que sigas los pasos que se te señalan a continuación: Primer Paso. Conoce los Objetivos Generales y de cada Unidad, sus temas, subtemas, sus conceptos y tópicos, con el fin de obtener un panorama completo de los contenidos a tratar, reflexionando sobre los mismos, obteniendo notas personales sobre lo que es importante destacar en cada lectura. Segundo Paso. Una vez conocido el contenido de cada Unidad de forma muy general (y sólo después de esto, ya que de lo contrario su óptica sería parcial), se dará inicio a la realización de lo que se denomina ACTIVIDADES DE APRENDIZAJE, con las cuales se logrará llegar a conocer, aprender, aplicar, analizar y elaborar cada uno de los conceptos y tópicos de manera sustentada y no simples opiniones. Actividades que posteriormente te podrás AUTOEVALUAR. Tercer Paso. Si después de llevado a cabo lo anterior, quedaron dudas, no te preocupes, éstas se eliminarán si estás en comunicación permanente con tu ASESOR, a quien entregarás las actividades de aprendizaje solicitadas (investigaciones, cuestionarios…), para que sean revisadas, evaluadas y corregidas para tu mejor comprensión. Pero para ello es importante que participes en todas y cada una de

Page 17: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 12

las actividades de aprendizaje que se te recomienden. Utilizando las herramientas informativas que se sugieran y que se puedan tener al alcance. Cuarto Paso. Enseguida, debemos comprobar que el Aprendizaje de la ESTADÍSTICA, sea real y consistente, y esto se logra mediante una forma que se denomina ACTIVIDAD INTEGRADORA. Actividad propia del estudiante y reflejo de la Investigación diaria. Actividad a la cual se le otorga el mayor grado de calificación, al momento de evaluar la participación del alumno, en la materia, y que será proporcionada por tu ASESOR. Quinto Paso. El hecho de que se determinen Objetivos, Temas, Conceptos, Tópicos, Actividades de Aprendizaje y Autoevaluaciones por Unidad, no significa que se trate del conocimiento de contenidos aislados, sino que, todos los conocimientos que se van adquiriendo forman parte del aprendizaje integral, así pues, lo que se aprende al principio del curso se aplica hasta el final, por lo tanto se requiere de dedicación y práctica para que el presente documento sea de gran utilidad y su contenido haga efectivo el aprendizaje significativo.

Tareas a realizar por los alumnos de los Cursos No Escolarizados:

1. Leer los textos de autoaprendizaje. 2. Resolver las Actividades de Aprendizaje, y si el Asesor lo indica,

enviárselas vía correo electrónico para su revisión. 3. Contestar las Autoevaluaciones lo más honestamente posible, con la

finalidad de que midas si has adquirido los conocimientos, ya resueltas, podrás verificar si tus respuestas fueron acertadas en la hoja de respuestas que se ubica al final del documento.

4. Realizar las Actividades Integradoras que te indique tu Profesor/Asesor con la finalidad de otorgarte una calificación.

Finalmente, se aprovecha la oportunidad para señalar la BIBLIOGRAFÍA BÁSICA, con que cuenta el ESTADÍSTICA, y que es precisamente la siguiente:

• ARREGUÍN HUERTA, Estadística para Informática, Universidad

Vasco de Quiroga, 2008 • William Mendenhall, Estadística para Administradores, Grupo

Editorial Iberoamérica, 1988 • Anderson Sweeney Williams, Estadística para administración y

economía, Editorial Math Learning Thomson, 2005. ¡¡¡¡PUES BIEN, CAMINEMOS JUNTOS!!!!!

Page 18: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 13

CRITERIOS DE EVALUACIÓN

Se realizará una evaluación continua sobre la participación en actividades de aprendizaje, elaboración de prácticas, resolución de las autoevaluaciones y las actividades integradoras que señale el Asesor.

De manera fundamental se considerará la calidad del compromiso en cuanto al cumplimiento del alumno a las actividades propuestas, es decir, cumplir en tiempo y forma con las tareas que indique el Asesor, siendo retroalimentado por el mismo.

Si llegamos a este punto, es precisamente porque nos importa conocer nuestro trabajo, saber con que dedicación y seriedad lo hemos venido realizando, pero sobre todo saber, si las metas de aprendizaje se logran, o bien conocer, sobre que aspectos debemos trabajar doblemente en beneficio de todos. Y para ello, se tomarán en cuenta los siguientes C R I T E R I O S : ACTIVIDADES DE APRENDIZAJE 50% DE LA CALIFICACIÓN En las que se calificará:

a) Conocimiento General y Particular de los contenidos trabajados. b) Aplicación de la teoría en la práctica. c) Elaboración de las actividades propuestas. d) Actitud y dedicación.

EXAMEN CUATRIMESTRAL ORDINARIO 50% DE LA CALIFICACIÓN

• Para acreditar cada materia en un ciclo escolar, los estudiantes tendrán hasta dos oportunidades (evaluación ordinaria, y evaluación extraordinaria) si cumplen con las condiciones:

• El alumno que cumpla con el 60% de actividades académicas exigidas por la Universidad-Asesor en la materia respectiva y que haya cubierto el total de sus cuotas, tendrá derecho a presentar examen ordinario (final del semestre) que constituye la primera oportunidad. Actividades que serán dadas a conocer a los estudiantes al inicio de cada materia, llevándose un control minucioso de fechas de entrega, por parte del asesor.

• El alumno que no cumpla en tiempo y forma con el 60% de las actividades académicas, pero sí más del 40% de las actividades, tendrá derecho a presentar el examen extraordinario (esto constituye la segunda) siempre y cuando no esté en esta situación en más de dos materias de las que integra el ciclo escolar que cursa.

• Estos porcentajes pueden llegar a variar, previo aviso del profesor, en algunas unidades en donde se le dará mayor porcentaje a las actividades

En caso que alguno de que el examen extraordinario o no reúna el 40% de las actividades del curso, el estudiante tendrá que tomar el curso nuevamente.

Page 19: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 14

RECUERDA, EL LOGRO DEL APRENDIZAJE ES NUESTRA JUSTI FICACIÓN POR LO TANTO TU PARTICIPACIÓN ES DECISIVA

POLÍTICAS DEL CURSO.

• Los horarios y fechas para asesorías serán establecidas por el asesor o consensadas entre los participantes del curso y se definirán los canales de comunicación que deberán ser utilizados para tal fin.

• Las tareas serán realizadas según las instrucciones del Asesor, algunas de ellas tendrán que se elaboradas individualmente y otras de manera grupal.

• En el caso de actividades grupales, el asesor les indicará la metodología a seguir para que puedan estar en contacto con los demás miembros que conforman el grupo.

• Las actividades a realizar tienen fechas límite de entrega, por lo que se pide se respeten. En caso de no terminarlas dentro de las fechas establecidas la calificación correspondiente a esa actividad será de CERO.

• Algunas de las actividades requieren que se entreguen por escrito, esto será por medio de un archivo magnético, en el formato y con el nombre que se les señale y deberá ser enviado por correo electrónico.

• En el caso de tener problemas para el envío de tareas favor de comunicarlos oportunamente a su Asesor.

• Cualquier situación no contemplada en esta sección será tratada de manera particular por parte del Asesor.

AYUDAS En el caso de requerir ayuda académica se puede enviar correo electrónico al Asesor de la materia, mismo que él proporcionará. El asesor también podrá estar disponible en línea a través de herramientas en línea como lo son los Mensajeros Instantáneos de Hotmail, Yahoo, según lo convenga con el grupo en fecha y horario. HERRAMIENTAS Y UTILERÍAS Todo el material que es desarrollado para nuestros cursos es producido usando programas de uso común, los cuales pueden ser encontrados fácilmente en internet. En caso de no poder utilizar algún material, puede ser el caso de que necesite instalar alguno de estos programas. Si requiere ayuda para su instalación no dude en contactarse con el asesor. Para poder visualizar las lecturas deberá tener instalado en su computadora los programas adecuados, en particular deberá tener el “Acrobat Reader”. Este puede

Page 20: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 15

encontrarse en internet y obtenerse de manera gratuita en la siguiente dirección electrónica:

http://www.latinoamerica.adobe.com/products/acrobat/readstep2.html Una lista de todos los programas que puedes obtener de manera gratuita y que es importante los pudiera tener instalados en su computadora son los mostrados a continuación:

• Acrobat Reader .- Para leer archivos creados en formato “pdf”.

• Antivirus.- Es una versión libre de un antivirus, es importante que te protejas de los virus informáticos.

• ICQ .- Programa de la categoría de mensajeros instantáneos.

• IEXPLORER.- Navegador para internet, para plataformas Windows.

• Mozilla Firefox. Navegador de Internet, para plataformas Linux y Windows.

• MSN Messenger.- El mensajero instantáneo de Microsoft.

• Netmeeting.- Programa de comunicación que permite interactuar en línea

utilizando diversos formatos de archivos.

• Open Office.- Grupo de programas de uso libre similar al Microsoft Office.

• Real One Player .- Reproductor de audio y video.

• WinZip.- Compactador y descompactador de archivos.

• Yahoo Messenger .- Mensajero instantáneo de Yahoo. Si necesita ayuda para saber donde obtener estos programas y conocer la forma de instalar estos programas podemos auxiliarlo con mucho gusto, solo póngase en contacto con el Asesor de la materia y el le dará instrucciones detalladas.

Page 21: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 16

INTRODUCCIÓN

Al predecir el resultado de una elección algunos encuestadores entrevistan a un número predeterminado de personas para conocer sus preferencias políticas, se elabora un pronóstico en base a esa información, para una investigación de mercado nos interesa conocer de un grupo de potenciales compradores cual modelo de auto eligen, en la industria que porción de artículos no cumplen con las especificaciones de producto, al estimar un inventario de medicamento de un hospital, la incidencia de algunas variables sociológicas sobre el consumo de algunos bienes. Todos los casos anteriormente expuestos hacen uso e la estadística, situaciones de carácter común para el estudiante de Informática sin duda. En el mundo laboral la toma de decisiones es algo común, lo lamentable del caso es que una gran proporción de estas decisiones están basadas en corazonadas o en extrapolaciones de decisiones anteriores que corresponden a otro contexto, tiempo y variable. Por tanto contar con información útil y confiable s la clave para que lo que elijamos tenga mayor grado de certidumbre, la estadística nos permite presentar esa información de manera más convincente y útil, nos muestra las variables que inciden en un determinado efecto, nos permite trabajar con una parte de esa información a partir de la cual se pueden inferir comportamientos y resultados. La estadística descriptiva se ocupa de la descripción de un conjunto de datos llamado población, como en el censo de un país, a partir de la cual se describa y extraiga información de un cúmulo de datos. La estadística inferencial, es cuando empleamos una muestra que sea representativa de la población, con objeto de anticipar su comportamiento tomando en consideración una muestra representativa. La probabilidad nos ayuda a razonar a partir de una población conocida hacia una muestra desconocida. En el desarrollo del presente curso también tocaremos el análisis de medidas de tendencia central y dispersión, el trabajo con muestras, así como la regresión lineal simple y múltiple, problemas todos donde buscaremos tomar decisiones más acertadas valiéndonos de las técnicas estadísticas.

!!!!!BIENVENIDO SEAS!!!!!

Page 22: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 17

UNIDAD 01. PROBABILIDAD

1.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Definiciones de probabilidad espacio muestral experimento aleatorio probabilidad de eventos independientes y dependientes, unió e intersección de conjuntos.

• Probabilidades de eventos independientes y dependientes y aplicara el Teorema de Bayes.

1.2 TEMAS Y SUBTEMAS:

UNIDAD 01 1. PROBABILIDAD.

1.1 Definir experimento aleatorio

1.2 Definir espacio muestral de un experimento aleatorio.

1.3 Obtener espacio muestral de un experimento aleatorio dado.

1.4 Definir probabilidad de un punto en el espacio

1.5 Definir espacio muestral equiprobable

1.6 Combinaciones de eventos y probabilidad condicional

1.7 Eventos: definir evento o suceso y ocurrencia de un evento en un espacio muestral dado.

1.8 Obtener la probabilidad de un evento.

1.9 Definir el complemento de un evento y su probabilidad.

1.10 Definir la unión e intersección de eventos.

1.11 Obtener la probabilidad de la unión e intersección de eventos.

1.12 Enunciar y aplicar las leyes de probabilidad.

1.13 Definir eventos mutuamente excluyentes.

1.14 Dada una colección de eventos determinar si son independientes.

1.15 Establecer y aplicar la ley particular multiplicativa para n eventos independientes.

1.16 Teorema de Bayes

1.17 Aplicaciones del teorema de Bayes.

1.18 Técnicas de conteo, diagramas de árbol y principio multiplicativo.

Aplicar las técnicas de conteo a través de permutaciones y combinaciones.

1.3 LECTURAS RECOMENDADAS LECTURA BASICA:

Page 23: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 18

• Arreguín Huerta, Fausto. Apuntes de Estadística para Informática. UVAQ 2008.

LECTURAS COMPLEMENTARIAS:

• William Mendenhall, Estadística para Administradores, Grupo Editorial Iberoamérica.

• Anderson Sweney Williams, Estadística para administración y Informática, Editorial Thomson 2005.

1.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS Estadística descriptiva Estadística Inferencial Probabilidad

Page 24: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 19

UNIDAD 02. VARIABLES ALEATORIAS 2.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Aprenderá: definición de variables aleatorias continuas

• Definición de una distribución de probabilidad como una función puntos percentiles para una distribución normal

• Estimación puntual de parámetros de población o del proceso.

• Concepto de distribución de muestreo.

2.2 TEMAS Y SUBTEMAS:

UNIDAD 02 2 VARIABLES ALEATORIAS

2.1 Definir variables aleatorias discretas y continuas.

2.2 Definir función de probabilidad de una variable aleatoria discreta.

2.3 Obtener la probabilidad de eventos haciendo uso de la probabilidad de una variable aleatoria discreta.

2.4 Definir la función de distribución acumulada de una variable aleatoria discreta.

2.5 Obtener y graficar la función de probabilidad acumulada de una variable aleatoria discreta dada su función de probabilidad.

2.6 Obtener probabilidades de eventos con la función de distribución acumulada.

2.7 Definir función de probabilidad de una variable aleatoria continúa.

2.8 Obtener la probabilidad de eventos haciendo uso de la probabilidad de una variable aleatoria continua.

2.9 Definir la función de densidad de una variable aleatoria continua.

2.10 Obtener y graficar la función de probabilidad acumulada de una variable aleatoria continua dada su función de probabilidad.

2.11 Obtener probabilidades de eventos con la función de distribución acumulada.

2.12 Verificar que una función dada es una función de densidad

2.3 LECTURAS RECOMENDADAS LECTURA BASICA:

• Arreguín Huerta, Fausto. Apuntes de Estadística para Informática. UVAQ 2008.

Page 25: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 20

LECTURAS COMPLEMENTARIAS: • William Mendenhall, Estadística para Administradores, Grupo Editorial

Iberoamérica. • Anderson Sweney Williams, Estadística para administración y Informática,

Editorial Thomson 2005.

2.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS Variables aleatorias

Page 26: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 21

UNIDAD 03. DISTRIBUCIONES DISCRETAS

3.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Conocerá el concepto de función de una variable aleatoria continua y obtendrá probabilidades a partir de la función de densidad.

• Identificara si la función dada es una función de densidad y aplicara el tipo de distribución adecuado para la solución de problemas.

3.2 TEMAS Y SUBTEMAS:

UNIDAD 03 3 DISTRIBUCIONES DISCRETAS

3.1 Definir la imagen de una función de probabilidad. el valor esperado y la varianza de las variables aleatorias discretas que tienen las siguientes distribuciones.

3.2 Bernoulli y binomial

3.3 Geométrica y binomial negativa.

3.4 Hipergeométrica.

3.5 Poisson.

3.6 Reconocer las condiciones bajo las cuales se puede aplicar cada uno de los modelos anteriores a la resolución de problemas. Aleatorias

Resolución de problemas

3.3 LECTURAS RECOMENDADAS LECTURA BASICA:

• Arreguín Huerta, Fausto. Apuntes de Estadística para Informática. UVAQ 2008.

LECTURAS COMPLEMENTARIAS:

Page 27: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 22

• William Mendenhall, Estadística para Administradores, Grupo Editorial Iberoamérica.

• Anderson Sweney Williams, Estadística para administración y Informática, Editorial Thomson 2005.

3.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS

Page 28: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 23

UNIDAD 04. DISTRIBUCIONES CONTINUAS

4.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Definirá la función de densidad a partir de la variable así como la imagen

• Estimación puntual de parámetros de población o del proceso. Concepto de distribución de muestreo

4.2 TEMAS Y SUBTEMAS:

UNIDAD 04 4 DISTRIBUCIONES CONTINUAS. 4.1 Definir la imagen de una función de densidad. la media y las variables aleatorias 4.2 Uniforme. 4.3 Exponencial 4.4 Resolver problemas que involucren las variables aleatorias citadas.

4.3 LECTURAS RECOMENDADAS LECTURA BASICA:

• Arreguín Huerta, Fausto. Apuntes de Estadística para Informática. UVAQ 2008.

LECTURAS COMPLEMENTARIAS:

• William Mendenhall, Estadística para Administradores, Grupo Editorial Iberoamérica.

• Anderson Sweney Williams, Estadística para administración y Informática, Editorial Thomson 2005.

Page 29: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 24

4.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS

Page 30: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 25

UNIDAD 05. DISTRIBUCIÓN NORMAL

5.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Se mostraran los pasos para la hipótesis con el método del valor crítico, frente a la media usando la distribución normal. Errores de tipo I Y II en pruebas de hipótesis..

5.2 TEMAS Y SUBTEMAS:

UNIDAD 05 5 LA DISTRIBUCIÓN NORMAL 5.1 Uso de la distribución normal en el calculo de probabilidades 5.2 Calcular probabilidades para eventos relacionados con una variable normal estándar 5.3 Distribuciones relacionadas con la distribución normal.

5.3 LECTURAS RECOMENDADAS LECTURA BASICA:

• Arreguín Huerta, Fausto. Apuntes de Estadística para Informática. UVAQ 2008.

LECTURAS COMPLEMENTARIAS:

• William Mendenhall, Estadística para Administradores, Grupo Editorial Iberoamérica.

Page 31: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 26

• Anderson Sweney Williams, Estadística para administración y Informática, Editorial Thomson 2005.

5.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS Distribución Normal

Page 32: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 27

UNIDAD 06. INFERENCIAS EN UNA POBLACIÓN.

6.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• .

6.2 TEMAS Y SUBTEMAS:

UNIDAD 06 6 INFERENCIAS EN UNA POBLACIÓN. 6.1 Distribución de muestreo e intervalos de confianza para la media 6.2 Intervalos de confianza. 6.3 Determinar la cota del error de estimación de Mu mediante un coeficiente de confianza con varianza conocida. 6.4 Determinar el tamaño de la muestra mínima. 6.5 Construir intervalos de confianza para la media de una población arbitraria con varianza conocida y desconocida.

6.6 Otros intervalos de confianza.

6.3 LECTURAS RECOMENDADAS LECTURA BASICA:

• Arreguín Huerta, Fausto. Apuntes de Estadística para Informática. UVAQ 2008.

LECTURAS COMPLEMENTARIAS:

• William Mendenhall, Estadística para Administradores, Grupo Editorial Iberoamérica.

• Anderson Sweney Williams, Estadística para administración y Informática, Editorial Thomson 2005.

Page 33: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 28

6.4 CONCEPTOS Y TÓPICOS A REVISAR EN LAS LECTURAS

Page 34: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 29

Texto de Autoaprendizaje

Page 35: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 30

TERCERA PARTE: TEXTO DE AUTOAPRENDIZAJE

P R E S E N T A C I Ó N

Se presenta una síntesis de los principales conceptos de Estadística, así como aplicaciones y ejercicios para motivar el aprendizaje de la materia.

Page 36: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 31

UNIDAD 01. INTRODUCCIÓN A LA ESTADÍSTICA PARA INFORMÁTICA

OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Definiciones de probabilidad espacio muestral experimento aleatorio probabilidad de eventos independientes y dependientes, unió e intersección de conjuntos.

• Probabilidades de eventos independientes y dependientes y aplicara el Teorema de Bayes.

TEMAS Y SUBTEMAS:

UNIDAD 01 2. PROBABILIDAD.

3.7 Definir experimento aleatorio

3.8 Definir espacio muestral de un experimento aleatorio.

3.9 Obtener espacio muestral de un experimento aleatorio dado. 3.10 Definir probabilidad de un punto en el espacio

3.11 Definir espacio muestral equiprobable

3.12 Combinaciones de eventos y probabilidad condicional

3.13 Eventos: definir evento o suceso y ocurrencia de un evento en un espacio muestral dado.

3.14 Obtener la probabilidad de un evento.

3.15 Definir el complemento de un evento y su probabilidad.

3.16 Definir la unión e intersección de eventos.

3.17 Obtener la probabilidad de la unión e intersección de eventos.

3.18 Enunciar y aplicar las leyes de probabilidad.

3.19 Definir eventos mutuamente excluyentes.

3.20 Dada una colección de eventos determinar si son independientes.

3.21 Establecer y aplicar la ley particular multiplicativa para n eventos independientes.

3.22 Teorema de Bayes

3.23 Aplicaciones del teorema de Bayes.

3.24 Técnicas de conteo, diagramas de árbol y principio multiplicativo.

Aplicar las técnicas de conteo a través de permutaciones y combinaciones.

Page 37: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 32

Importancia y aplicación de la probabilidad y estad ística para la Informática Al predecir el resultado de una elección algunos encuestadores entrevistan a un número predeterminado de personas para conocer sus preferencias políticas, se elabora un pronóstico en base a esa información, para una investigación de mercado nos interesa conocer de un grupo de potenciales compradores cual modelo de auto eligen, en la industria que porción de artículos no cumplen con las especificaciones de producto, al estimar un inventario de medicamento de un hospital, la incidencia de algunas variables sociológicas sobre el consumo de algunos bienes. Todos los casos anteriormente expuestos hacen uso e la estadística, situaciones de carácter común para el estudiante de Informática sin duda. El papel de la estadística en la toma de decisiones En el mundo laboral la toma de decisiones es algo común, lo lamentable del caso es que una gran proporción de estas decisiones están basadas en corazonadas o en extrapolaciones de decisiones anteriores que corresponden a otro contexto, tiempo y variable. Por tanto contar con información útil y confiable s la clave para que lo que elijamos tenga mayor grado de certidumbre, la estadística nos permite presentar esa información de manera más convincente y útil, nos muestra las variables que inciden en un determinado efecto, nos permite trabajar con una parte de esa información a partir de la cual se pueden inferir comportamientos y resultados. Estadística descriptiva e inferencial y probabilida d La estadística descriptiva se ocupa de la descripción de un conjunto de datos llamado población, como en el censo de un país, a partir de la cual se describa y extraiga información de un cúmulo de datos. La estadística inferencial , es cuando empleamos una muestra que sea representativa de la población, con objeto de anticipar su comportamiento tomando en consideración una muestra representativa. La probabilidad nos ayuda a razonar a partir de una población conocida hacia una muestra desconocida. Antes de iniciar el estudio de la estadística, analicemos algunos conceptos básicos.

Page 38: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 33

El espacio de los sucesos.

Un experimento , en estadística, es cualquier proceso que proporciona datos, numéricos o no numéricos.

Un conjunto cuyos elementos representan todos los posibles resultados de un experimento se llama espacio muestral y se representa como S. El espacio muestral de un experimento siempre existe y no es necesariamente único pues, dependiendo de nuestra valoración de los resultados, podemos construir diferentes espacios muestrales.

Los elementos del espacio muestral se llaman puntos muestrales y son los distintos resultados del experimento.

Si consideramos el conjunto de las partes de (P(S)) sus elementos son los sucesos. Un suceso , por tanto, es un subconjunto del espacio muestral.

Existen dos tipos de sucesos:

1. Sucesos simples, que son aquellos que comprenden un sólo punto muestral.

2. Sucesos compuestos, que son los que engloban más de un punto del espacio muestral. Todo suceso compuesto se puede considerar como unión de puntos del espacio muestral o unión de sucesos simples.

Azar, suceso aleatorio

El azar, en el lenguaje normal, se considera como la característica de un suceso imprevisible.

En estadística esta definición se modifica añadiendo una propiedad adicional: El azar es la característica de un experimento que produce resultados diversos, impredecibles en cada situación concreta, pero cuyas frecuencias, a la larga, tienden a estabilizarse hacia un valor "límite" en el infinito.

Como consecuencia, se definen los sucesos aleatorios como los resultados de un experimento cuya variación (la de los resultados) es debida al azar.

Page 39: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 34

Probabilidad

La probabilidad de un suceso sólo se define para el caso de sucesos aleatorios.

Hay varias formas de definir la probabilidad.

En primer lugar podemos considerar la definición intuitiva que nos dice que la probabilidad de un suceso es la posibilidad de que éste ocurra. Esta primera definición no parece de gran utilidad por ser difícilmente cuantificable.

También podemos considerar la definición clásica de probabilidad. En esta definición se empieza por considerar todos los resultados posibles de un experimento; después se contabilizan los resultados favorables a nuestro suceso, es decir, todos aquellos en que el experimento resulta en el suceso considerado; por último, suponiendo que existe simetría recíproca de todos los resultados, es decir, que todos los resultados posibles son igualmente posibles, se define la probabilidad como el número de casos favorables dividido por el número de casos posibles.

Esta segunda definición presenta el inconveniente de que no siempre es posible saber cuántos son los resultados posibles de un experimento y no siempre todos los resultados posibles son igualmente probables.

Por tanto, consideraremos la probabilidad definida de otra forma. Supongamos que realizamos muchas veces un experimento y vamos anotando el valor de la frecuencia relativa que, como sabemos, tiende a estabilizarse. Suponiendo que pudiéramos realizar el experimento infinitas veces, el valor de estabilización de las frecuencias en el infinito sería la probabilidad de los sucesos. Es decir, la probabilidad es el valor de la frecuencia relativa en el infinito. Es importante señalar, que este valor de estabilización no es un límite en el sentido matemático de la expresión pues, por ser un suceso aleatorio, nadie puede garantizar una ecuación matemática para el valor de la frecuencia relativa.

Axiomas de Kolmogorov

Todo el cálculo de probabilidades y, con él, toda la estadística se basan en tres propiedades que se asignan a las probabilidades, que se llaman axiomas de Kolmogorov

1. La probabilidad de un suceso es siempre mayor o igual que cero y menor o igual que uno

Si A es un suceso

2. La probabilidad del espacio muestral es igual a uno:

Page 40: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 35

Si S es el espacio muestral

Es evidente, pues si realizamos un experimento siempre ha de suceder alguna cosa. Esta propiedad se expresa como que la probabilidad de un suceso cierto es igual a uno. Si S tiene un único elemento ése es un suceso cierto. Como consecuencia, siguiendo el razonamiento anterior, la probabilidad de que no ocurra nada, lo cual es imposible, o en notación de conjuntos la probabilidad del conjunto vacío (F) es cero.

P(F) = 0

Se llama suceso imposible a aquel cuya probabilidad vale cero.

3. Si A y B son sucesos mutuamente excluyentes, es decir, nunca ocurren simultáneamente (A Ç B = F) la probabilidad de su unión, es decir, de que ocurra uno u otro es la suma de sus probabilidades.

P(A È B) = P(A) + P(B)

Otras propiedades de las probabilidades.

Si A y B son dos sucesos cualesquiera:

Se llama suceso contrario del suceso A al suceso A' que se define como

A’ = S – A. La probabilidad del suceso contrario es:

Page 41: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 36

Se llama probabilidad condicional del suceso B respecto del suceso A a la probabilidad de que, dado que el resultado de un experimento haya sido A sea, simultáneamente, B. Este valor se representa como P(B|A).

Por transposición de términos en la ecuación anterior y en la correspondiente a la probabilidad condicional de A respecto de B llegamos a:

Se dice que dos sucesos A y B son independientes si y sólo si la probabilidad de su intersección es igual al producto de sus probabilidades

Sucesos dependientes Sucesos independientes ACTIVIDADES DE APRENDIZAJE Calcular la probabilidad de que caiga un águila en la tirada de dos monedas.

Eventos 1ª moneda 2ª moneda P(Ei)

E1 A 1/2 A ½ 1/4

Page 42: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 37

E2 S 1/2 S ½ 1/4

E3 A 1/2 S ½ 1/4

E4 S 1/2 A ½ 1/4

Si A= Observar que caiga una águila

P(x=A) = P (E3) + P(E4) = ½

AUTOEVALUACIÓN Encuentra los resultados posibles a un experimento Experimento Resultados Lanzar una moneda Seleccionar una parte para inspección Telefonema para ventas Tirar un dado Jugar un partido de futbol

Page 43: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 38

UNIDAD 02. VARIABLES ALEATORIAS 2.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Aprenderá: definición de variables aleatorias continuas

• Definición de una distribución de probabilidad como una función puntos percentiles para una distribución normal

• Estimación puntual de parámetros de población o del proceso.

• Concepto de distribución de muestreo.

2.2 TEMAS Y SUBTEMAS:

UNIDAD 02 2 VARIABLES ALEATORIAS

2.1 Definir variables aleatorias discretas y continuas.

2.2 Definir función de probabilidad de una variable aleatoria discreta.

2.3 Obtener la probabilidad de eventos haciendo uso de la probabilidad de una variable aleatoria discreta.

2.4 Definir la función de distribución acumulada de una variable aleatoria discreta.

2.5 Obtener y graficar la función de probabilidad acumulada de una variable aleatoria discreta dada su función de probabilidad.

2.6 Obtener probabilidades de eventos con la función de distribución acumulada.

2.7 Definir función de probabilidad de una variable aleatoria continúa.

2.8 Obtener la probabilidad de eventos haciendo uso de la probabilidad de una variable aleatoria continua.

2.9 Definir la función de densidad de una variable aleatoria continua.

2.10 Obtener y graficar la función de probabilidad acumulada de una variable aleatoria continua dada su función de probabilidad.

2.11 Obtener probabilidades de eventos con la función de distribución acumulada.

2.12 Verificar que una función dada es una función de densidad

Page 44: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 39

Introducción: Variables aleatorias Como dijimos, un experimento estadístico es cualquier proceso que proporciona datos. Para su utilización en estadística, estos datos tienen que despojarse de detalles accesorios para convertirse en descripciones numéricas del resultado; la utilización de clasificaciones cualitativas, restringe a la mera descripción las posibilidades de manejo estadístico. Estas descripciones numéricas son observaciones aleatorias. A las observaciones aleatorias se les considera como la expresión en cada caso concreto de una variable aleatoria que toma valores en los resultados del experimento. Así pues, una variable aleatoria es una función cuyos valores son números reales determinados por los elementos del espacio muestral, es decir, una variable aleatoria es una variable matemática cuyos valores posibles son las descripciones numéricas de todos los resultados posibles de un experimento estadístico. A los valores posibles de la variable aleatoria se les asigna una probabilidad que es la frecuencia del resultado al que corresponden. Se pueden distinguir distintos tipos de variables aleatorias según dos criterios de clasificación:

•••• Variables cuantitativas que son las que resultan de experimentos cuyos resultados son directamente numéricos.

•••• Variables cualitativas que son las que proceden de experimentos cuyos resultados expresan una cualidad no numérica que necesita ser cuantificada.

Otra clasificación más operativa de las variables aleatorias sería:

• Variable discreta: Aquella que se define sobre un espacio muestral numerable, finito o infinito. Espacio numerable es aquel cuyos elementos se pueden ordenar, asignándoles a cada uno un número de la serie de los números naturales (del 1 al n ó del 1 al I). Todas las variables con un número finito de valores y todas las que tomen valores en números enteros o racionales (fraccionarios), son variables discretas.

• Variable continua: Es aquella que se define sobre un espacio asimilable al conjunto de los números reales, es decir, un espacio no numerable (o un espacio infinito de tipo C o infinito dos)

En general, la regla de oro es que todas las variables que proceden de experimentos en los que se cuenta son discretas y todas las variables que proceden de experimentos en los que se mide son continuas.

Page 45: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 40

Variables Continuas y Discretas Variables continuas: Son las que pueden adoptar un número infinitamente grande de valores que corresponden a un intervalo de una recta, ejemplos las estatuas y pesos de un grupo de personas, el tiempo entre eventos... Variable discreta: Si el número de valores que puede tomar la variable aleatoria es contable se conoce como variable discreta, ejemplo: número de productos no conformes de un lote, el número de autos compactos en una agencia de ventas. Variables cualitativas y cuantitativas Variables cualitativas: Son aquellas que denotan una cualidad. Característica o atributo, como el sabor de una sopa, la consistencia de una pasta, el matiz de un producto, se describe contando el número de observaciones en cada categoría. Variables cuantitativas: Representan la cantidad o monto de algo. Como los dividendos, la producción petrolera, el tiempo para llenar un formulario. Descripción de variables cualitativas Definiremos las variables cualitativas nominales y ordinales, los conceptos asociados a la distribución de frecuencia y los limitados estadísticos que pueden emplearse en la descripción. El capítulo se cierra con algunos de los procedimientos gráficos empleados para representar las distribuciones de estas variables. Variables cualitativas nominales y ordinales. En una encuesta sobre el gasto turístico se pregunta a los visitantes de una autonomía cuál es la impresión que han obtenido de su viaje. La pregunta y las posibles respuestas son las siguientes: La impresión que ha tenido de su viaje ha sido:

• Muy buena. • Buena. • Normal. • Mala.

También se pregunta cuál es la categoría socio-profesional en la que se sitúa el encuestado: Su profesión es:

Page 46: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 41

• Directivo o empresario. • Administrativo. • Trabajador manual. • Trabajador Autónomo. • Funcionario. • Jubilado. • Estudiante • Otras.

Las anteriores variables son de tipo cualitativo, calificándose como de tipo ordinal (la primera) y nominal (la segunda). La distinción entre ellas es clara. En la pregunta sobre la impresión del viaje, la respuesta “muy buena” indica un nivel de satisfacción mayor que “buena”, ésta última respuesta estaría a su vez por encima de “normal” y “mala” señalaría en nivel mínimo de satisfacción. Las respuestas pueden, en algún sentido, ordenarse de menos a más. En cambio, no es posible ordenar de menos a más las respuestas de una variable como la categoría profesional. Las variables cualitativas nominales únicamente ponen nombre a una característica, las variables ordinales llevan asociadas un orden en las respuestas. Las categorías de una variable nominal, al contrario de las de una variable ordinal, no pueden ordenarse de menos a más. Distribución de frecuencias. Frecuencia relativa y frecuencia relativa acumulada. La principal herramienta de análisis de una variable de tipo cualitativo es el simple recuento del número de los casos dentro de cada categoría. Además de referirnos a las categorías de una variable, emplearemos también el término “valores” de la variable. Supongamos que tenemos una variable A, que puede tomar las categorías A1, A2,…, A I. El primer objetivo es conocer cuántos individuos tienen cada característica. La principal herramienta de análisis de una variable de tipo cualitativo es el simple recuento del número de los casos dentro de cada categoría. En estadística, el número de veces que se repite una de las categorías o valores de la variable se denomina frecuencia o, de manera más precisa, frecuencia absoluta (que denotaremos ni). Por distribución de frecuencias se entiende el registro de todas las posibles categorías o valores de la variable, junto con sus frecuencias asociadas . Además de las frecuencias absolutas se suelen presentar las frecuencias relativas de cada categoría. La frecuencia relativa se define como la frecuencia absoluta dividida por el total de observaciones:

Page 47: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 42

Cuando se trabaja con una variable de tipo ordinal (cuyas categorías se pueden ordenar de menor a mayor) se pueden calcular las frecuencias acumuladas. La idea de acumulación facilita conocer rápidamente el número de observaciones que están por debajo de un determinado valor o categoría. Se distingue entre frecuencias acumuladas absolutas y relativas. La frecuencia absoluta acumulada se define como:

Y la frecuencia relativa acumulada como:

Sólo tiene sentido hablar de valores acumulados cuando las respuestas de la variable se han ordenado de menor a mayor, lo que sólo es posible si la variable cualitativa es de tipo ordinal. La imagen estándar de una distribución de frecuencias es tan sencilla como la que se muestra en el siguiente cuadro. En la misma aparecerían, para el total de n observaciones, los I distintos atributos de la variable, sus frecuencias absolutas, las frecuencias relativas y las frecuencias relativas acumuladas.

Page 48: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 43

Ejemplo 1. Régimen de propiedad de la vivienda. El régimen de propiedad de la vivienda familiar puede considerarse como una variable cualitativa, distinguiendo tres posibles categorías: la vivienda está en alquiler, la vivienda es de propiedad con la hipoteca pendiente o la vivienda es de propiedad sin hipoteca. Ante una muestra concreta de familias, podemos describir de una manera cuantitativa su relación con la propiedad de su vivienda. En el cuadro se muestra la distribución de frecuencias de una muestra de 4791 declarantes. Aunque no es estrictamente necesario suele ser cómodo, cuando se graban los datos, convertir las categorías en etiquetas numéricas. En nuestro ejemplo se ha definido una variable denominada “vivienda” que toma un valor igual a 0 cuando la vivienda es de alquiler, igual a 1cuando la vivienda es de propiedad pero tiene la hipoteca aún vigente y valor 2, si la vivienda es de propiedad y sin hipoteca.

En el cuadro aparecen los siguientes conceptos:

• Los valores que toma la variable (Value). Para esta variable los valores 0, 1 y 2 reflejan las categorías de alquiler, vivienda con hipoteca vigente y vivienda de propiedad (en la columna Value Label se muestran las “etiquetas” de la variable).

• La Frecuencia absoluta (Frequency). El número de individuos que tiene cada una de las categorías.

• La frecuencia relativa (Percent) . Definida como el cociente entre la frecuencia absoluta y el número total de observaciones.

• La frecuencia relativa acumulada (Cum Percent). La frecuencia relativa acumulada se define como la suma acumulada de los porcentajes relativos de las categorías anteriores y hasta la propia categoría.

La vivienda en propiedad y ya pagada, con un 43.1% de los declarantes tiene el mayor porcentaje de individuos. La segunda es la categoría de vivienda en alquiler, con un 36.8% de declarantes. Finalmente, la categoría con menos individuos corresponde a la de declarantes que viven en vivienda de propiedad,

Page 49: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 44

aún no pagada. La importancia de cada una de las categorías es fácil de percibir cuando el número de categorías de la variable es muy pequeño. Los porcentajes acumulados no tienen una interpretación “inocente” cuando se tratan variables de tipo cualitativo. La información de que el 56.9% de los individuos viven en régimen de alquiler o en vivienda propia con hipoteca puede ser una información sin sentido. La frecuencia relativa se define como la frecuencia en cada clase dividida por el total de observaciones:

La frecuencia relativa acumulada en cada clase se define, una vez ordenadas las respuestas desde la categoría inferior a la superior, como:

En variables de tipo cualitativo nominal el porcentaje acumulado de frecuencias no debe leerse de manera automática, puesto que al no existir un orden en las categorías, el sentido de la acumulación puede ser confuso. Diagrama de barras. Los resultados de la distribución de frecuencias se pueden acompañar de ayudas gráficas que facilitan la lectura de la información. El diagrama de barras representa, para cada una de las categorías de la variable (indicada en uno de los ejes de la gráfica), su frecuencia absoluta o relativa (que se muestra en un segundo eje). Su objetivo es disponer de una visualización clara y rápida de la importancia de cada una de las categorías de la variable. En la gráfica se muestra el diagrama de barras correspondiente al ejemplo anterior. El diagrama de barras representa gráficamente las frecuencias (absolutas o relativas) de la variable.

Page 50: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 45

Descripción de variables cuantitativas Las variables de tipo cuantitativo son aquellas que toman, en lugar de categorías, valores numéricos. Las categorías de las variables cualitativas pueden relacionarse con valores numéricos, pero eso no las convierte en cuantitativas, puesto que el número, en su caso, no es más que una “etiqueta”, careciendo de sentido operar matemáticamente con ellos. Escala de intervalo y escala de cociente. Desde un punto de vista teórico se distingue entre variables cuantitativas medidas en escala de intervalo y en escala de cociente . Las variables cuantitativas tienen una escala de intervalo si se pueden ordenar sus valores y, además, se pueden realizar c on ellos las operaciones de suma y resta . La primera característica la comparte con las variables cualitativas ordinales, pero al contrario que en aquéllas, en la escala de intervalo puede medirse la distancia entre distintas observaciones. Permite afirmar, por ejemplo, que un individuo tiene un valor que supera en diez unidades al que toma otro individuo, o que entre dos individuos hay una diferencia de veinte unidades. Las variables con escala de cociente añaden a estas características la de incorporar un origen no arbit rario . La diferencia esencial es que este segundo tipo de variable admite un cero verdadero (toneladas consumidas o número de empleados, por ejemplo, donde el

Page 51: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 46

cero se entiende como inexistencia) y permite el cálculo de proporciones entre los distintos valores (una observación toma un valor que es el doble que el de otra). Normalmente, desde el punto de vista práctico, no siempre se realiza una distinción entre ellas. Distribución de frecuencias. Diagrama de barras. La idea de recuento, es decir, la idea de crear una distribución de frecuencias debe ser, como en el caso de las variables cualitativas, el primer paso del análisis. Observar los distintos valores que toma una variable, ordenarlos de menor a mayor y contar el número de veces que aparece cada valor nos dará una idea de su comportamiento. El único problema que se plantea con una variable de tipo cuantitativo es que suele tomar un número de valores mucho mayor que las posibles categorías de una variable cualitativa. La imagen general que se pretende dar con la distribución de frecuencias puede ser entonces poco útil, porque la información está poco resumida. El trabajo con intervalos de la variable , en lugar de con cada uno de sus posibles valores, es el procedimiento normal para conseguir una imagen sintética de la distribución. Ejemplo 1. Distribución de frecuencias del número de hijos. En este primer ejemplo vamos a obtener la distribución de frecuencias y el diagrama de barras del número de hijos de una muestra de familias españolas. La muestra de 1254 familias está formada por una selección aleatoria de declarantes que ya hemos analizado anteriormente. La distribución de frecuencias para una muestra de esta variable Número de hijos del hogar aparece en el cuadro 1 y su representación en un diagrama en barras en la gráfica

Page 52: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 47

El primer resultado interesante de la distribución es el disponer de los valores que toma la variable, información que a priori no conocíamos. El número de hijos en la muestra toma únicamente valores 0, 1, 2, 3, 4, 5. Organización y clasificación de los datos de las ta blas Se organizan los datos creando clases, alrededor de los cuales se organizan los

datos en el histograma de frecuencias.

Por ejemplo:

Sean los réditos comunes % para 25 acciones.

3.1 4.2 2.3 3.3 2.8

5.3 3.5 3.1 2.6 3.3

4.2 3.7 3.0 2.6 4.0

3.8 4.4 3.2 3.2 3.8

5.1 3.7 2.3 4.3 3.9

n = 25 Observaciones

K = 7 Clases

Rango = 5.3 – 2.3 = 3

Page 53: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 48

Límite de clase = 3/7 = 0.42 ≈ 0.4

Clase Límite Marca Frecuencia Frecuencia

relativa

1 2.3 - 2.7 1 1 1 1 4 4/25

2 2.8 - 3.2 1 1 1 1 1 1 6 6/25

3 3.3 - 3.7 1 1 1 1 1 1 6 6/25

4 3.8 - 4.2 1 1 1 1 4 5/25

5 4.3 - 4.7 1 1 1 3 3/25

6 4.8 - 5.2 1 1 1/25

7 5.3 - ... 1 1 1/25

Probabilidad básica Un experimento aleatorio se caracteriza porque repetido muchas veces y en idénticas condiciones el cociente entre el número de veces que aparece un resultado (suceso) y el número total de veces que se realiza el experimento tiende a un número fijo. Esta propiedad es conocida como ley de los grandes números , establecida por Jakob Bernouilli Podemos definir probabilidad de un suceso como el número al que tiende la frecuencia relativa asociada al suceso a medida que el número de veces que se realiza el experimento crece.

La frecuencia relativa del suceso A:

Propiedades de la frecuencia relativa:

1. 0 fr (A) 1 cualquiera que sea el suceso A. 2. fr( ) = fr(A) + fr(B) si = Ø.

3. fr(E) = 1 fr(Ø) = 0.

Page 54: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 49

Esta definición presenta el inconveniente de tener que realizar el experimento un gran número de veces y además siempre obtendremos un valor aproximado de la probabilidad. La definición axiomática de probabilidad se debe a Kolmogorov, quien consideró la relación entre la frecuencia relativa de un suceso y su probabilidad cuando el número de veces que se realiza el experimento es muy grande. Sea E el espacio muestral de cierto experimento aleatorio. La Probabilidad de cada suceso es un número que verifica: Cualquiera que sea el suceso A, P(A) 0.

1. Si dos sucesos son incompatibles, la probabilidad de su unión es igual a la suma de sus probabilidades.

= Ø P( ) = P(A) + P(B).

2. La probabilidad total es 1. P(E) = 1. Definición de Laplace. En el caso de que todos los sucesos elementales del espacio muestral E sean equiprobables, Laplace define la probabilidad del suceso A como el cociente entre el número de resultados favorables a que ocurra el suceso A en el experimento y el número de resultados posibles del experimento.

Experimento: proceso mediante el cual se obtiene una observación ( o una medida de un fenómeno). Ejemplo:

• Registrar la producción diaria en una fábrica. • La paridad del dólar con el peso.

Eventos A. Los resultados de un experimento se les conoce como eventos y se registran con literales mayúsculas así la probabilidad de un evento A se denota

Page 55: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 50

como P(A)= n/N también conocido como frecuencia relativa de probabilidad, si un conjunto no puede ocurrir P(A)=0, si ocurre con seguridad P(A)=1 Intersección de eventos A y B: Es el evento en donde ambos ocurren, se lee P(AB) Unión de A y B: Denotando como AUB es la probabilidad de que alguno de los 2 eventos ocurra o bien ambos. Eventos mutuamente excluyentes: Donde no pueden ocurrir ambos eventos a la vez, ejemplo que P(AB)=0 A: Suba el dólar - B: Baje el dólar C: No haya variación Si A y B son eventos mutuamente excluyentes la probabilidad de que ocurra A o B estaría dada por P(AUB) =P(A)+P(B) Ejemplo Un inversionista depositará 10000 en un conjunto de 6 inversiones, tomando la decisión en pares de inversiones, despliega el conjunto eventual I1 I2 I2 I3 I3 I4 I4 I5 I5 I6 I1 I3 I2 I4 I3 I5 I4 I6 I1 I4 I2 I5 I3 I6 I1 I5 I2 I6 I1 I6 15 opciones distintas de inversión Si posteriormente se conoce que las tres primeras fueron las más lucrativas, que probabilidad hay de que haya seleccionado solo las más lucrativas. I1 I2 I2 I3 =1/15+1/15+1/15=3/15=0.2=P(A) I1 I3 Probabilidad básica P(A)=1-P(A^) Espacio muestral A A^

Page 56: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 51

La unión de 2 eventos A y B P(A U B)=P(A)+P(B)-P(A П B) Evento A Evento B Espacio muestral Un experimento consiste en tirar un dado, especifique los eventos simples A: Caer 2 B: Caer impar C: Caer un número menor que 4 D: Observar ambos A y B E: Observar A y B, o ambos F: Observar A y C Evento simples: 1,2,3,4,5,6. 1/6-------- 2 3/6-------- 1,3,5, 3/6-------- 1,3,3 O A U B: 4/6------- 1,2,3,4, 1/6-------2 Probabilidad condicional y eventos independientes, dos eventos se relacionan muchas veces de tal manera que la probabilidad de ocurrencia de en evento depende o no de la ocurrencia de otro. P (B/A)= P(AB)/P(A) La probabilidad de B dado que ocurrió el evento A P (A/B)= P(AB)/P(B) Son independientes si la probabilidad de uno, no depende de la ocurrencia del otro. P (B/A)= P(B) P(A/B) =P(A) También P(AB) =P(A)P(B) Ejemplo:

Page 57: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 52

Una casa oferta ropa, las prendas se clasifican según la siguiente tabulación por género y por clase: Línea Sexo Cara Barata Total Masculino 132 147 279 Femenino 516 205 721 Total 648 352 1000

a) Calcular la probabilidad de que el consumidor sea mujer. “A” P(A)=721/100 b) El pedido sea para la línea cara. “B” P(B)=648/1000 c) Que sea para la línea cara y sea una mujer quien compra. P(AB)=516/1000 d) Que el pedido sea para la línea cara, dado que el consumidor es mujer.

P(B/A)=P(AB)/P(A)=516/721. e) Demostrar si A y B son eventos independientes si P(B/A)=P(B) como

516/721≠648/1000 por lo tanto: Son eventos dependientes. Distribuciones de probabilidad Recordemos inicialmente que existen las variables aleatorias, siendo aquellas que se asocian a la ocurrencia de un fenómeno aleatorio. Cuando una de estas variables aleatorias toma diversos valores, la probabilidad asociada a cada uno de tales valores puede ser organizada como una distribución de probabilidad, la cual es la distribución de las probabilidades asociadas a cada uno de los valores de la variable aleatoria. Las distribuciones de probabilidad pueden representarse a través de una tabla, una gráfica o una fórmula, en cuyo caso tal regla de correspondencia se le denomina función de probabilidad. Función de probabilidad

Una variable aleatoria discreta toma cada uno de sus valores con una determinada probabilidad.

La relación entre valores y probabilidades en una variable X se puede expresar de forma tabular de la siguiente manera:

Valores de X x1 x2 ... xi P(X = x) P(x1) P(x2) P(xi)

Page 58: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 53

Este método puede ser complicado, e incluso imposible, si los valores de la variable son muchos o infinitos.

En algunos casos, existe una forma sistemática de aplicación de los valores de la probabilidad a los valores de la variable, de modo tal que se puede establecer una ecuación que ligue ambos. A esta ecuación se le llama función de probabilidad. Por tanto, la función de probabilidad de una variable aleatoria discreta X es una función tal que, al sustituir x por un valor de la variable, el valor que toma la función es la probabilidad de que la variable X asuma el valor x.

Habitualmente, la función de probabilidad se representa como f(x).

f(x) = P(X = x)

Las funciones de probabilidad sólo se definen para los valores de la variable aleatoria y deben cumplir tres propiedades:

1. Como consecuencia del primer axioma.

2. Como consecuencia del segundo axioma.

3. P(X = x) = f(x) Por definición.

Función de distribución

La función de distribución F(x) de una variable aleatoria discreta X, con función de probabilidad f(x), es una función de la variable en la que al sustituir x por un valor, el valor de la función es la probabilidad de que la variable tome valores menores o iguales que dicho valor x.

Page 59: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 54

La función de distribución se define para todos los números reales, no sólo para los valores de la variable. Su máximo es siempre 1 pues cuando el valor que se sustituye es mayor o igual que el valor máximo de la variable, la probabilidad de que ésta tome valores menores o iguales que el sustituido es la probabilidad del espacio muestral.

Normalmente, sus valores se dan de forma tabular. Supongamos, por ejemplo que los valores de la variable X sean x1, x2, x3,... , xn

Función de densidad

Una variable aleatoria continua tiene la característica de tomar cada uno de sus valores con probabilidad infinitesimal, a efectos prácticos, 0. Por tanto, no se pueden expresar en forma tabular.

Sin embargo, aunque no se pueden considerar probabilidades de valores concretos, puede calcularse la probabilidad de que la variable tome valores en determinados intervalos (los intervalos en cuestión pueden ser abiertos o cerrados, sin que se modifique la probabilidad total).

P(a ≤ X ≤ b) = P(X = a) + P(a < X < b) + P(X = b) = P(a < X < b)

Page 60: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 55

Tal como ocurría en el caso de las variables discretas, cuando existe una asignación regular de probabilidad se puede definir una función que nos permita calcular probabilidades para cualquier intervalo de valores, a esta función se le llama función de densidad, f(x)

La función de densidad de una variable aleatoria continua X es una función continua tal que su integral entre los extremos de un intervalo nos da el valor de la probabilidad de que X tome valores en ese intervalo.

La representación gráfica de la función de densidad en un sistema de ejes cartesianos es la de una curva continua, construida de forma tal que la altura de la curva, sobre el eje de las X, en cada punto es el cociente entre el diferencial de la probabilidad en dicho punto y el diferencial de x. Esta construcción es una extensión por diferenciación del concepto de histograma.

Como consecuencia, la integral de f(x) sobre todo el campo de variación de X es igual a 1.

Es evidente que f(x) es siempre positiva pues si no lo fuera cabría la posibilidad de encontrar intervalos para los cuales la integral sería negativa y eso significaría probabilidad negativa, en abierta contradicción con la definición de probabilidad.

La función de densidad siempre se define para todos los valores en el intervalo

(-∞,∞) Esto no ofrece problemas si el campo de variación de X se extiende por todo el intervalo; si no fuera así, la función se define como igual a cero para todos los valores no incluidos en el campo de variación de X.

La función de densidad debe cumplir tres condiciones análogas a las de la función de probabilidad:

como consecuencia del primer axioma

como consecuencia del segundo axioma

por definición

Page 61: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 56

Función de distribución

Para variables continuas también se define la función de distribución, de la siguiente manera:

Las características de F(x) son iguales a las expuestas para el caso de las variables discretas, salvo que, obviamente, nunca se expresan en forma tabular.

En general, cualquiera que sea el tipo de variable, las funciones de distribución nos pueden servir para calcular probabilidades. Por ejemplo, en el caso de las variables continuas:

Dada su definición, resulta que, para variables continuas, la función de densidad es la derivada respecto a X de la función de distribución.

Las funciones de distribución de las variables cont inuas más interesantes están tabuladas.

Page 62: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 57

Valor esperado de una variable Supongamos que hemos realizado n veces un experimento aleatorio que genera una variable X. El valor medio del experimento en estas n repeticiones es la suma de los productos de los valores de la variable por su frecuencia relativa. Cuando n sea igual a infinito, el valor medio del experimento se llama valor esperado o esperanza matemática, E[X].

Si X es una variable discreta con función d probabilidad f(x), el valor esperado de X se calcula según decíamos anteriormente sumando los productos de los valores de la variable por sus respectivas probabilidades.

En el caso de una variable continua

Propiedades del valor esperado

• Al multiplicar todos los valores de una variable por una misma constante, el valor esperado de ésta queda multiplicado por el valor de la constante.

Page 63: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 58

• Al sumar a todos los valores de una variable una misma constante, el valor esperado de ésta queda incrementado por el valor de la constante.

• Si tenemos dos variables X e Y, discretas o continuas, el valor esperado de su suma o diferencia es la suma o diferencia de sus valores esperados

E[X ± Y] = E[X] ± E[Y]

Page 64: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 59

• Si las variables anteriores, X e Y son variables aleatorias independientes ocurre que el valor esperado de su producto es igual al producto de sus valores esperados.

E[X Y] = E[X] E[Y]

Es importante indicar que la independencia de las variables es condición suficiente pero no necesaria para que el valor esperado del producto de dos variables sea igual al producto de sus valores esperados, es decir, ésta es una propiedad de las variables independientes pero se cumple en variables que no son independientes. Media Dada una variable aleatoria X con función de probabilidad o densidad f(x) podemos definir una función de X que sea igual a la variable elevada a un exponente entero no negativo.

El valor esperado de z(x) es el k-ésimo momento de la variable X respecto a su origen y se llama

• k = 0

• k = 1 A este primer momento respecto al origen que es igual al valor esperado se le llama también media aritmética de la variable y se le denomina µX, simplemente µ.

Page 65: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 60

En la mayoría de los casos, la media µ expresa la tendencia central de la variable o el orden de magnitud de sus valores. El resto de los momentos respecto al origen tienen escaso interés en la mayoría de los casos. Varianza Dada una variable aleatoria X con función de probabilidad o densidad f(x) podemos definir una función de X que sea igual a la diferencia entre la variable y su media aritmética elevada a un exponente entero no negativo.

El valor esperado de z(x) es el k-ésimo momento de la variable X respecto a la media y se llama µk.

k = 0

k = 1 Es decir, en cualquier variable aleatoria su primer momento respecto de la media es igual a 0. Esta propiedad se utilizar reiteradamente en las demostraciones estadísticas.

k = 2 Este segundo momento respecto de la media se le llama también varianza .

La varianza de una variable mide la dispersión de sus valores respecto al valor central µ. Para calcular la varianza por un método más sencillo se utiliza la expresión:

Es decir, la varianza de una variable es igual a la media de los cuadrados menos el cuadrado de la media.

Page 66: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 61

Desviación estándar o típica El principal problema de la varianza es que se expresa en unidades cuadráticas que no siempre tienen una interpretación clara. Para obviar este problema se define otra medida de la dispersión que es la desviación típica , σX, o simplemente σ, que se calcula como la raíz cuadrada positiva de la varianza; evidentemente, la desviación típica se mide en las mismas unidades que la variable

Ejemplo Consideremos la siguiente tabla: Xi Xi-X media (Xi-X media)² 5 5-3.8=1.2 1.44 7 3.2 10.24 1 -2.8 7.84 2 -1.8 3.24 4 0.2 0.04 ∑i..n =19 0 22.80 Por lo tanto Ѕ²=22.80/(5-1)=57 Desviación estándar: será la raíz cuadrada de la varianza. Ѕ=√ Ѕ²=√[∑i=1..n (Xi- X media )²/ n-1]

Page 67: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 62

Otra forma para calcular S Xi Xi² 85 7225 70 4900 60 3600 90 8100 81 6561 ∑xi=386 ∑xi ²=30386 X media=386/5=77.2 S²=[∑i=1..n(Xi- X media )²]/n-1= S² =[∑i=1..nXi²-(∑i=1..n Xi)²/n]/n-1 S²=√[(30386-386²/5)/5-1]=12.1 S=√∑i=1..n(Xi- X media )²/n-1 = √586.8/4=12.1 El coeficiente de variación No obstante, la desviación típica no resuelve todos los problemas que se pueden plantear, como por ejemplo la comparación de situaciones en las que la unidad de medida o el orden de magnitud de esta sea diferente. Para resolver esta cuestión se define una medida adimensional de la variabilidad que es el coeficiente de variación , C V, que se calcula como el cociente entre la desviación típica y la media (a veces este cociente se expresa en tanto por ciento multiplicándolo por 100).

Covarianza En este contexto de la medida de la variación se plantea el problema de medir la variación conjunta de variables de variables asociadas. Supongamos que tenemos dos variables aleatorias X e Y, discretas o continuas, con función de probabilidad o densidad conjunta f(x,y) y definimos una función z(x,y) igual al producto de las desviaciones de cada valor a su media respectiva (es decir, z(x,y) tiene la misma estructura que (X - µ)2 = (X - µ) (X - µ) si sustituimos una vez a X por Y).

Page 68: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 63

Al valor esperado de z(x,y) se le llama covarianza de las variables X e Y y se representa como σxy o cov(x,y).

La covarianza es una medida de la variación común a dos variables y, por tanto, una medida del grado y tipo de su relación.

• σxy es positiva si los valores altos de X están asociados a los valores altos de Y y viceversa.

• σxy es negativa si los valores altos de X están asociados a los valores bajos de Y y viceversa.

• Si X e Y son variables aleatorias independientes cov(x,y) = 0 . La independencia es condición suficiente pero no necesaria para que la cov(x,y) sea nula.

cov(x,y) = 0 cov(x,y) > 0 cov(x,y) < 0 Se puede deducir, algebraicamente, un medio más sencillo para calcular la covarianza de dos variables.

Coeficiente de correlación En el caso de la covarianza tenemos el mismo problema que se nos presentó con la varianza, es decir, la covarianza se expresa en términos del producto de las

Page 69: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 64

unidades de medida de ambas variables, lo cual no siempre es fácilmente interpretable. Por otra parte también es difícil comparar situaciones diferentes entre sí. En este caso, ambos problemas se solucionan de una vez mediante la definición del coeficiente de correlación , ρ, que se define como el cociente entre la covarianza y el producto de las desviaciones típicas de las dos variables.

La correlación toma valores entre -1 y 1, siendo su signo igual al de la covarianza. Correlaciones con valor absoluto 1 implican que existe una asociación matemática lineal perfecta, positiva o negativa, entre las dos variables y correlaciones iguales a 0 implican ausencia de asociación. Obviamente, las variables independientes tienen correlación 0, pero nuevamente, la independencia es condición suficiente pero no necesaria. Correlaciones con valores absolutos intermedios indican cierto grado de asociación entre los valores de las variables. Ejemplos Ejemplo 1: Sea x el número observado al tirar un dado, obtenga su valor esperado: X=1,2...,6 con P(1)=P(2)=1/6 E(x)=∑x=1..6XP(x)=1(1/6)+2(1/6)+...+.6(1/6)=21/6 Ejemplo 2: Se compran dos boletos de $ 5 pesos c/u, de un tiraje de 8,000, el auto tiene un costo de $12,000 ¿Cuál será la ganancia esperada del adquiriente de los boletos? X p(x) $= ocurrencia $-7998/8000 Probabilidad de perder o donar $10 $-2/8000.. Probabilidad de ganar el auto E(x)=-10(7998/8000) +11990(2/8000)=-$7 lo esperado es que done 7 pesos Ejemplo 3: Sea X el número de caras en el lanzamiento de 2 monedas, encuentre su valor esperado y varianza. Espacio eventual.

X P(X) E(x) (x- µ)² (x- µ)² P(x)

S.S 0 ¼ 0 (0-1)²=1 ¼ C.S 1 ¼ 1/4 (1-1)²=0 0 S.C 1 ¼ 1/4 (1-1)²=0 0

Page 70: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 65

C.C 2 ¼ 2/4 (2-1)²=1 ¼ ∑=1.0 ∑=1.0 ∑=1/2=δ² Ejemplo 4: Sea una variable aleatoria con la distribución de probabilidad dada X P(x) -1 .05 0 .1 1 .4 2 .2 3 .1 4 .1 5 .05 µ=E(x)=-1(0.05)+0(0-1)+2(0.2)+3(0.1)+4(0.1)+5(0.05)=1.3 δ²=(-1-1.3)²(0.05) (0-1.3)²(0.1) (1-1.3)²(0.4) (2-1.3)²(0.2) (3-1.3)²(0.1) (4-1.3)²(0.1) (5-1.3)²(0.05) δ²=2.27 δ=√2.27=1.506 ¿Qué probabilidad tiene X de caer +/- 2δ? -1.712 a 4.312 =95%

Page 71: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 66

UNIDAD 03. DISTRIBUCIONES DISCRETAS

3.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Conocerá el concepto de función de una variable aleatoria continua y obtendrá probabilidades a partir de la función de densidad.

• Identificara si la función dada es una función de densidad y aplicara el tipo de distribución adecuado para la solución de problemas.

3.2 TEMAS Y SUBTEMAS:

UNIDAD 03 4 DISTRIBUCIONES DISCRETAS

4.1 Definir la imagen de una función de probabilidad. el valor esperado y la varianza de las variables aleatorias discretas que tienen las siguientes distribuciones.

4.2 Bernoulli y binomial

4.3 Geométrica y binomial negativa.

4.4 Hipergeométrica.

4.5 Poisson.

4.6 Reconocer las condiciones bajo las cuales se puede aplicar cada uno de los modelos anteriores a la resolución de problemas. Aleatorias

Resolución de problemas

Page 72: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 67

Distribuciones de variables discretas Debido a que no sabemos la probabilidad de ocurrencia de variables discretas, lo que se hace es trabajar con estimaciones. Precisamente esto nos lleva a modelos teóricos que estiman los resultados, los principales son los que a continuación se presentan. Los modelos de distribuciones de probabilidad de variables discretas que se estudiarán son

1. Uniforme. Es la distribución donde todos los eventos elementales tienen la misma probabilidad.

a. Por ejemplo: tirar un dado, donde la función P(X=x)=1/6 para valores de x=1,2,3,4,5,6.

2. Binomial. Es la que maneja la distribución de la probabilidad de obtener cierta cantidad de éxitos al realizar una cantidad de experimentos con probabilidad de éxito constante y con ensayos independientes.

3. Geométrica. Es la distribución de la probabilidad de realizar cierto número de experimentos antes de obtener un éxito.

4. Hipergeométrica. Es similar a la binomial, pero con un tamaño de muestra grande en relación al tamaño de la población.

a. La función de Excel que proporciona sus valores es DISTR.HIPERGEOM

5. De Poisson. Es la distribución de la probabilidad de que ocurra un evento raro en un periodo de tiempo, un espacio o un lugar.

a. La función de Excel que da los valores de la distribución es POISSON

Distribución uniforme La distribución uniforme es la que corresponde a una variable que toma todos sus valores, x1, x2... , xk, con igual probabilidad; el espacio muestral debe ser finito. Si la variable tiene k posibles valores, su función de probabilidad sería:

Donde k es el parámetro de la distribución (un parámetro es un valor que sirve para determinar la función de probabilidad o densidad de una variable aleatoria) La media y la varianza de la variable uniforme se calculan por las expresiones:

Page 73: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 68

El histograma de la función toma el aspecto de un rectángulo, por ello, a la distribución uniforme se le suele llamar distribución rectangular.

Distribución binomial La distribución binomial es típica de las variables que proceden de un experimento que cumple las siguientes condiciones:

1. El experimento está compuesto de n pruebas iguales, siendo n un número natural fijo.

2. Cada prueba resulta en un suceso que cumple las propiedades de la variable binómica o de Bernouilli, es decir, sólo existen dos posibles resultados, mutuamente excluyentes, que se denominan generalmente como éxito y fracaso.

3. La probabilidad del ‚éxito (o del fracaso) es constante en todas las pruebas. P(éxito) = p ; P(fracaso) = 1 - p = q

4. Las pruebas son estadísticamente independientes, En estas condiciones, la variable aleatoria X que cuenta el número de éxitos en las n pruebas se llama variable binomial. Evidentemente, el espacio muestral está compuesto por los números enteros del 0 al n. Se suele decir que una variable binómica cuenta objetos de un tipo determinado en un muestreo de n elementos con reemplazamiento.

Page 74: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 69

La función de probabilidad de la variable binomial se representa como b(x,n,p) siendo n el número de pruebas y p la probabilidad del ‚éxito. n y p son los parámetros de la distribución.

La media y la varianza de la variable binomial se calculan como:

Media = µ = n p

Varianza = σ2 = n p q

Gráficamente, el aspecto de la distribución depende de que sea o no simétrica Por ejemplo, el caso en que n = 4:

Consideremos los llamados ensayos Bernoulli, éstos son aquellos experimentos cuyo resultado es uno de dos posibles y mutuamente excluyentes, a los que se denominarán éxito y fracaso. Por ejemplo: Los siguientes son ensayos Bernoulli.

• Un tornillo, puede estar defectuoso o no defectuoso. • El sexo de un bebé al nacer: niño o niña. • La respuesta correcta o incorrecta en un examen.

Si consideramos una serie de ensayos Bernoulli que tiene como características: 1. la probabilidad de éxito permanece constante, ensayo tras ensayo; y 2. los ensayos son independientes entre sí; Entonces se tiene lo que se denomina experimento binomial, donde el número de ensayos se denota con n, la probabilidad de éxito con p y la de fracaso con q.

Page 75: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 70

Hay que notar que las probabilidades de éxito y de fracaso están relacionadas de la siguiente manera: p+q=1. Ejemplo: Se conoce que un vendedor determinado puede concluir una compra con 20% de probabilidad de éxito, si entrevista a 4 prospectos.

a) Cuál es la probabilidad de que dos compren el producto b) Que al menos dos compren el producto. c) De que compren el producto. p(2)= [4!/(2!(4-2))]*(0.2)²(0.8)²=0.1536 p(x>2)=p(2)+p(3)+p(4)=0.1808 p(3)= [4!/(3!*1!)]*(0.2)³(0.8)¹=0.0256 p(4)=4C4*(0.2)⁴ (0.8)º=0.0016 Ejemplo: Se realiza un plan de muestreo para conocer la probabilidad de aceptar un lote defectuoso, se selecciona una muestra de los artículos y una aceptación de hasta un artículo defectuoso. Se conoce históricamente que el 5% de los artículos tienen algún defecto. P= aceptar lotes buenos. p= aceptar lotes malos p(x≤1)=p(0)+p(1)=0.91385 p(0)=10C0*(0.05)⁰*(0.95)¹⁰=0.59873 p(1)=10C1*(0.05)¹ (0.95)⁹=0.31512 p(x>1)=1-p(0)-p(1)=0.0861

Ejemplo: Consideremos un examen con tres preguntas de opción múltiple, con cuatro opciones, y que será contestado al azar.

1.- Las flores de la carrastrana frisólea son: a) rojas b) azules c) amarillas d) naranjas 2.- Don Luis Inocuo descubrió el trideralto de magnesio en: a) 1518 b) 1635 c) 1457 d) 1706 3.- El significado de la palabra “^Xkzñ” es a) Lápiz b) árbol c) miedo d) fiera

Con esto contamos con un experimento binomial, ya que la probabilidad de éxito permanece constante en las tres preguntas (p=¼) y las respuestas de una a otra pregunta son independientes entre sí. Se cuenta con una cantidad n=3 de ensayos y q=1-p=3/4. Hay que decir que n y p son los llamados parámetros de la distribución.

Page 76: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 71

Tenemos ahora la variable aleatoria X que representará el número de respuestas correctas, siendo sus posibles valores: 0, 1, 2, y 3. Para calcular la distribución de probabilidad correspondiente, consideraremos como E los éxitos y como F los fracasos (el subíndice indica el número de pregunta). Así pues, tenemos que

P(X=0)= P (F1∩F2∩F3)= P(F1)�P(F2)�P(F3) =(3/4)3 = 27/64 =1�(3/4)

3�(1/4)0

P(X=1)=P [(E1∩F2∩F3)∪(F1∩E2∩F3)∪ (F1∩F2∩E3)]=81/256=3�(3/4)

2�(1/4)1

P(X=2)=P [(E1∩E2∩F3)∪(E1∩F2∩E3)∪ (F1∩E2∩E3)]=9/64=3�(3/4)

1�(1/4)2

P(X=3)=P E1∩E2∩E3)= P(E1)�P(E2)�P(E3)= (1/4)3 = 1/64=1�(3/4)

0�(1/4)3

Al presentar esta información como tabla y su respectivo histograma se obtiene:

X P(X=x)

0 0.422

1 0.422

2 0.141

3 0.016

Distribución hipergeométrica Una variable tiene distribución hipergeométrica si procede de un experimento que cumple las siguientes condiciones:

1) Se toma una muestra de tamaño n, sin reemplazamiento, de un conjunto finito de N objetos.

2) K de los N objetos se pueden clasificar como éxitos y N - K como fracasos.

X cuenta el número de ‚éxitos obtenidos en la muestra. El espacio muestral es el conjunto de los números enteros de 0 a n, ó de 0 a K si K < n.

Page 77: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 72

En este caso, la probabilidad del ‚éxito en pruebas sucesivas no es constante pues depende del resultado de las pruebas anteriores. Por tanto, las pruebas no son independientes entre sí. La función de probabilidad de la variable hipergeométrica es:

Los parámetros de la distribución son n, N y K. Los valores de la media y la varianza se calculan según las ecuaciones:

Si n es pequeño, con relación a N (n << N), la probabilidad de un ‚éxito variar muy poco de una prueba a otra, así pues, la variable, en este caso, es esencialmente binomial; en esta situación, N suele ser muy grande y los números combinatorios se vuelven prácticamente inmanejables, así pues, la probabilidades se calculan más cómodamente aproximando por las ecuaciones de una binomial con p = K / N. La media de la variable aproximada (µ = n p = n (K / N)) es la misma que la de la variable antes de la aproximación; sin embargo, la varianza de la variable binomial es ligeramente superior a la de la hipergeométrica.

El factor por el que difieren ser siempre menor que 1 y tan próximo a 1 como cierto sea que n << N. El aspecto de la distribución es bastante similar al de la binomial. Como ejemplo, mostramos los casos análogos a los de las binomiales del apartado anterior (p inicial = 0,25 y n = 4)

Page 78: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 73

Ejemplo: Un furgón contiene 20 computadoras, de las cuales 2 presentan defectos, si se seleccionan 3 ¿Cuál es la probabilidad de que 2 presenten fallas? P(2)=[3C2*18C1]/20C7=0.01578 Ejemplo: En una selección de personal, de entre 20 doctores se seleccionan 10 ¿Cuál es la probabilidad de que incluyan a 5 de los mejores? N=20 n=10 r=5 P(x=5)=[5C5*15C5]/20C10=1.3003/184756 P(x=5)0.01625

Distribución de Poisson Una variable de tipo Poisson cuenta éxitos (es decir, objetos de un tipo determinado) que ocurren en una región del espacio o del tiempo. El experimento que la genera debe cumplir las siguientes condiciones:

1. El número de éxitos que ocurren en cada región del tiempo o del espacio es independiente de lo que ocurra en cualquier otro tiempo o espacio disjunto del anterior.

2. La probabilidad de un ‚éxito en un tiempo o espacio pequeño es proporcional al tamaño de este y no depende de lo que ocurra fuera de él.

3. La probabilidad de encontrar uno o más ‚éxitos en una región del tiempo o del espacio tiende a cero a medida que se reducen las dimensiones de la región en estudio.

Como consecuencia de estas condiciones, las variables Poisson típicas son variables en las que se cuentan sucesos raros. La función de probabilidad de una variable Poisson es:

Page 79: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 74

El parámetro de la distribución es λ que es igual a la media y a la varianza de la variable.

Esta característica puede servirnos para identificar a una variable Poisson en casos en que se presenten serias dificultades para verificar los postulados de definición.

La distribución de Poisson se puede considerar como el límite al que tiende la distribución binomial cuando n tiende a y p tiende a 0, siendo np constante (y menor que 7); en esta situación sería difícil calcular probabilidades en una variable binomial y, por tanto, se utiliza una aproximación a través de una variable Poisson con media l = n p.

La varianza de la variable aproximada es ligeramente superior a la de la variable binomial.

Las variables Poisson cumplen la propiedad de que la suma de variables Poisson independientes es otra Poisson con media igual a la suma las medias. El aspecto de la distribución depende muchísimo de la magnitud de la media. Como ejemplo, mostramos tres casos con λ = 0,5 (izquierda), λ = 1,5 (derecha) y λ= 5 (abajo) Obsérvese que la asimetría de la distribución disminuye al crecer λ y que, en paralelo, la gráfica empieza a tener un aspecto acampanado.

Page 80: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 75

Empleada para calcular las llegados de clientes, los reclamos de garantías, los accidentes industriales... También se utiliza para aproximar a la binomial cuando n es grande y p pequeño y cuando la media es menor que 7 Ejemplo: Las lesiones en una fábrica tienen una media de 2.7 accidentes por año ¿qué probabilidad existe de que el número de accidentes sea menor que 2? P(x<2)=p(0)+p(1)=(2.7)⁰*e¯ ²·⁷/0!+(2.7)¹*e¯ ²·⁷/1! =0.067205+2.7(0.067205)=0.2486 Ejemplo: Compara un experimento binomial con n=25 y p=0,1 con una Poisson Encuentre p(x≤3) Binomial p(x≤3=p(0)+p(1)+p(2)+p(3)=0.7635 Numero éxito=3 Ensayos=25 Probabilidad de éxito=0.1

Page 81: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 76

Acumulado=3 Poisson p(x≤3)=0.7575 µ=np =25(.1) Difiere tan solo en 0.007 entre binomial y poisson X=3 µ=2.5 Acumulado=3

Page 82: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 77

UNIDAD 05. DISTRIBUCIÓN NORMAL

5.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Se mostraran los pasos para la hipótesis con el método del valor crítico, frente a la media usando la distribución normal. Errores de tipo I Y II en pruebas de hipótesis..

5.2 TEMAS Y SUBTEMAS:

UNIDAD 05 5 LA DISTRIBUCIÓN NORMAL 5.1 Uso de la distribución normal en el calculo de probabilidades 5.2 Calcular probabilidades para eventos relacionados con una variable normal estándar 5.3 Distribuciones relacionadas con la distribución normal.

Page 83: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 78

Distribución normal La distribución normal fue definida por De Moivre en 1733 y es la distribución de mayor importancia en el campo de la estadística.

Una variable es normal cuando se ajusta a la ley de los grandes números, es decir, cuando sus valores son el resultado de medir reiteradamente una magnitud sobre la que influyen infinitas causas de efecto infinitesimal. Las variables normales tienen una función de densidad con forma de campana a la que se llama campana de Gauss. Su función de densidad es la siguiente:

Los parámetros de la distribución son la media y la desviación típica, µ y σ, respectivamente. Como consecuencia, en una variable normal, media y desviación típica no deben estar correlacionadas en ningún caso (como desgraciadamente ocurre en la inmensa mayoría de las variables aleatorias reales que se asemejan a la normal.

La curva normal cumple las siguientes propiedades:

1) El máximo de la curva coincide con la media. 2) Es perfectamente simétrica respecto a la media (g1 = 0). 3) La curva tiene dos puntos de inflexión situados a una desviación

típica de la media. Es convexa entre ambos puntos de inflexión y cóncava en ambas colas.

Page 84: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 79

4) Sus colas son asintóticas al eje X.

Para calcular probabilidades en intervalos de valores de la variable, habría que integrar la función de densidad entre los extremos del intervalo. por desgracia (o por suerte), la función de densidad normal no tiene primitiva, es decir, no se puede integrar. Por ello la única solución es referirse a tablas de la función de distribución de la variable (calculadas por integración numérica). Estas tablas tendrían que ser de triple entrada (µ, σ, valor) y el asunto tendría una complejidad enorme. Afortunadamente, cualquier que sea la variable normal, X, se puede establecer una correspondencia de sus valores con los de otra variable con distribución

Page 85: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 80

normal, media 0 y varianza 1, a la que se llama variable normal tipificada o Z. La equivalencia entre ambas variables se obtiene mediante la ecuación:

La función de distribución de la variable normal tipificada está tabulada y, simplemente, consultando en las tablas se pueden calcular probabilidades en cualquier intervalo que nos interese. De forma análoga a lo pasaba con las variables Poisson, la suma de variables normales independientes es otra normal.

Histograma de una normal idealizada Histograma de una muestra de una variable normal

Ejemplo: Se conoce que el promedio de peso de un límite de 8 personas en un ascensor es de 1200 libras, con una varianza de 9800 libras^2. ¿Cuál será la probabilidad de que 8 personas excedan de 1300 libras? Datos: Varianza=9800 libras^2 Media=1200 libras X= 1300 libras P(x>=1300)=? Sustituimos en nuestro estimador Z=(1300-1200)/98.994=1.0101 Acotación: sigma=(varianza)^1/2=(9800)^1/2 Como 1.0101 es positivo quiere decir que se ubica a la derecha de la media, el dato correspondiente en la tabla de la normal es 0.8438, que representa la

Page 86: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 81

probabilidad acumulada de todas las ocasiones en que ingresaron 8 personas al ascensor y que no excedieron de 1300 libras, por tanto P(x>=1300 libras)=1-.8438=.1562 o 15.62% De 100 mediciones que se realicen en el ascensor poco mas de 15 veces, la suma de los pesos de las personas excederán de 1300 libras. Así la distribución de probabilidad normal, nos ayuda a inferir sobre futuros comportamientos, a partir de registros establecidos, útil para predecir garantías pagaderas a productos que no cumplieron con lo establecido por ejemplo. AUTOEVALUACIÓN Contesta las siguientes preguntas. 1) En una encuesta universitaria se encontró que el 33% de los estudiantes

empleaban tarjeta de crédito. a) En una muestra de 6 estudiantes que probabilidad hay de que 2 tengan

tarjeta de crédito b) Qué por lo menos 2 tengan tarjeta de crédito c) Si la muestra es de 10 estudiantes que ninguno tenga tarjeta de crédito

2) En 1998 se realizó una encuesta para saber la preferencia en el consumo de refrescos de cola. Se encontró que de 10 personas, 6 preferían Coca y 4 Pepsi. Se selecciona una muestra aleatoria de 3 personas. Utilizando la distribución hipergeométrica a) Cuál es la probabilidad que 2 prefieran Coca b) Cual es la probabilidad que la mayoría prefiera Pepsi

3) A una aerolinea llegan en promedio 48 llamadas por hora a) Qué probabilidad hay de recibir 3 llamadas en el intervalo de 5 minutos b) La probabilidad de recibir 10 llamadas en 15 minutos c) Cuál es la probibilidad de ausentarse 3 minutos y no recibir llamadas

4) El tiempo promedio para leer una publicación del Wall Street Journal es de 49 min, suponga una desviación estándar de 16 minutos, normalmente distribuidos. a) Cuál es la probabilidad de tardar cuando menos una hora b) De que tarde menos de 30 minutos en leerla c) Para el 10% que leen asiduamente esta lectura, cuanto tiempo les toma la

actividad.

Page 87: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 82

UNIDAD 06. INFERENCIAS EN UNA POBLACIÓN.

6.1 OBJETIVOS PARTICULARES Al finalizar esta Unidad el estudiante:

• Conocerá técnicas para hacer inferencias de una población

6.2 TEMAS Y SUBTEMAS:

UNIDAD 06 6 INFERENCIAS EN UNA POBLACIÓN. 6.1 Distribución de muestreo e intervalos de confianza para la media 6.2 Intervalos de confianza. 6.3 Determinar la cota del error de estimación de Mu mediante un coeficiente de confianza con varianza conocida. 6.4 Determinar el tamaño de la muestra mínima. 6.5 Construir intervalos de confianza para la media de una población arbitraria con varianza conocida y desconocida.

6.6 Otros intervalos de confianza.

Page 88: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 83

Introducción El nombre "población" se utiliza en estadística por motivos históricos, que tienen que ver con el estudio de características vinculadas a las poblaciones humanas, aunque muchas veces el objeto de estudio sea de una naturaleza completamente distinta. Por ejemplo, si queremos conocer cuál es la proporción de fumadores entre los alumnos de la Escuela (la población), podemos hacer una investigación exhaustiva (censo) entre todos los alumnos matriculados y preguntarles si son fumadores o no lo son, o bien, seleccionar una parte representativa de la población de alumnos para extraer conclusiones que serán extrapoladas a toda la población. Aunque en este caso la población en estudio es una población humana, nos conviene más decir que la población es la característica que se está estudiando. En concreto, definimos la variable aleatoria X que vale 1 si un alumno elegido al azar es fumador, y cero si no lo es. Obsérvese que X tiene una distribución de Bernoulli, b(p) , donde p es la probabilidad de que el alumno elegido al azar sea fumador, esto es, la proporción de fumadores de la Facultad. Decimos entonces que tenemos una población X ~ b(p) , es decir, denominamos población a la variable aleatoria que representa su comportamiento. En un juego de azar, puede que deseemos conocer si una moneda está cargada o no. El comportamiento de esa moneda puede describirse como una variable aleatoria, Y, que vale la unidad si sale cara al hacer un lanzamiento, y cero si sale cruz. En este caso, la población sería la variable aleatoria Y ~ b(p) , donde p sería la probabilidad de obtener cara con la moneda. Obsérvese que, aunque el modelo es el mismo, ahora la población no es humana, ni tan siquiera de objetos. Aunque cuando se trata de una población de personas u objetos, sería posible estudiar a todos los individuos, en general no es posible o conveniente hacerlo, por motivos de coste económico, de tiempo, o de imposibilidad de localizar a todos ellos. Se busca entonces una parte que sea representativa del todo y se le realiza una encuesta. Por ejemplo: si en la Escuela hay 3000 alumnos de los cuales 1000 son fumadores, si escogemos una muestra representativa formada por 30 alumnos, más o menos 10 de ellos deberían ser fumadores. Esta cifra no se alcanza habitualmente con exactitud, achacando las posibles desviaciones al azar, esto es, a que, aunque el proceso de selección de la muestra sea sensato, el azar hace que sea posible, por ejemplo, que los 30 seleccionados sean fumadores (aunque sea bastante raro que ello ocurra).

Page 89: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 84

Cada alumno a encuestar, se representa mediante una variable que se distribuye igual que X. Si, en general, encuestamos a n alumnos, les representaremos

mediante una variable n-dimensional, , que denominaremos muestra .

Una vez encuestados, los resultados serán n números, , que denominaremos realización de la muestra . Así, definimos muestreo como el proceso que nos per mite la extracción de una muestra a partir de una población Hay dos tipos básicos de muestreo:

1. Muestreo probabilístico. En este tipo de muestreo, la probabilidad de aparición en una muestra de cualquier elemento de la población es conocida (o calculable). Es el único científicamente válido, y es sobre el que nos extenderemos especialmente.

2. Muestreo no probabilístico. Es aquel en el que la selección de los elementos de la muestra no se hacen al azar.

El muestreo probabilístico nos garantiza que, a la larga, las muestras que se van obteniendo de la población sean representativas de la misma. Vamos a ver varios tipos de muestreo probabilístico.

• Muestreo aleatorio simple • Muestreo estratificado • Muestreo por conglomerados • Muestreo sistemático • Muestreo por etapas (o polietápico)

Distribuciones de muestreo en la media Nos permiten inferir el comportamiento de una población a partir de la descripción de una muestra representativa. Definiciones Si las variables aleatorias x1.x2...........xn. tienen la misma función de densidad de probabilidad que la de la distribución de la población, y su función de distribución conjunta de probabilidad es igual al producto de las marginales, entonces x1.x2............xn forman un conjunto de n variables aleatorias independientes e idénticamente distribuidas (IID) que constituyen una muestra aleatoria de la población.

Page 90: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 85

Un Parámetro es una caracterización numérica de la distribución de la población de manera que describe, parcial o completamente la función de densidad de población de la característica de interés. Una estadística (un estadístico) es cualquier función de las variables aleatorias que se observaron en la muestra, de manera que esta función no contiene cantidades desconocidas. La distribución de muestreo de una estadística es la distribución de probabilidad que puede obtenerse como resultado de un número infinito de muestras aleatorias independientes, cada una de tamaño n provenientes de la población de interés. TEOREMA: Sean x1.x2...........xn, un conjunto de variables aleatorias independientes normalmente distribuidas con medias E(xi) = µ y varianzas Var(xi) = σi

2, para i = 1.2.......n. Si Y = a1x1 + a2x2 + ......+anxn, en donde a1.a2...an son constantes, entonces “Y” es una variable aleatoria distribuida normalmente Con media E(y) = a1µ1 + a2µ2 +......+ anµn Varianza Var(y) = a1

2σ12 + a2

2σ22 +...+ an

2σn2.

Teorema del límite central Sean x1.x2.........xn, n variables aleatorias independientes idénticamente distribuidas con media µ y varianza σ2 ambas finitas. La suma de esas variables Sn = x1+x2+ ...+ xn es una variable aleatoria con media nµµµµ y varianza nσσσσ2, entonces

Z = 2

n

n

σ

µ−S n se distribuye como una normal N(0;1). En otras palabras, el

teorema expresa que cuando n crece sin límite, la variable z tiende a distribuirse normalmente. Si las variables no son idénticamente distribuidas, se podría

demostrar igualmente que: z = -

2

i

i

∑∑

σµxi se distribuye como una normal

N(0;1), es decir que la suma de variables independientes tiende a ser normal con media suma de medias y varianza suma de varianzas.

Page 91: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 86

Ejemplo: Un embotellador desea reducir los problemas con las agencias de protección al consumidor, por tanto debe medir muy bien la cantidad de líquido en cada botella, debe contener 12 onzas, se miden al azar 10 botellas por hora, si los registros marcan una desviación de 0.2 onzas habrá que registrar la maquina a 12.1 onzas ¿Qué probabilidad habrá de que la media muestral sea menor que 12 onzas? Datos µ=12.1=x~ δx~=δ√n=0.2/√10=0.063 Ζ=[x~-µ]/δx~=[12-12.1]/0.0630=1.59 P(x<12)0.5-0.4441=0.056 Habrá un 5.6% de probabilidad de incumplir la norma de llenado. Ejemplo: Se selecciona una muestra de 25 unidades que tiene una distribución normal, con media de 106 desviación estándar de 12

a) Obtenga la media y desviación estándar de la muestra. b) Encuentre la probabilidad de que x excede a 110. c) Calcule la probabilidad de que la media muestral se desvíe de la media

poblacional µ=106 por más de 4 a) µx~=µ=106 δx~=δ/√n=12/√25=2.4 b) P(x>110)=110-106/2.4=1.666=0.5-0.4515=0.0485 c) P(x>110)+P(x<102)=0.097 Distribución de la media muestral X : Sea x1, x2,… xn una muestra aleatoria de tamaño “n” de una población con función de densidad f(x) con media µ y varianza σ2 . La media muestral representada por

x , es la media aritmética de los elementos de la muestra, es decir: n

x

x

n

1i

i∑== .

Teorema: Sea x1,x2,…..,xn, una muestra aleatoria que consiste de n variables aleatorias independientes normalmente distribuidas con medias E(xi) = µ y varianzas Var(xi) = σ2 , i = 1,2, ……, n. Entonces la distribución de la media muestral x es normal con media µ y

varianza n

σ 2

. En efecto:

E ( x ) = E (n

xi∑ ) = n

1 )(∑ xiE= 1/n(n.µ) ⇒ E( x ) = µ.

Page 92: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 87

Var ( x ) = Var

∑n

xi = n

xiVar

2

)(∑ = n

n2

2σ ⇒ Var ( x ) = n

σ 2

.

De aquí se tiene que x ~N(µ, n

σ 2

.) Luego: Z = ( )

n

x

σµ−

~ N(0,1)

Teorema : Sean x1,x2, ……..xn una muestra aleatoria de tamaño n, de una distribución normal con media µ y varianza σ2. Entonces zi = (xi – µ)/σ son variables aleatorias normales estándar e independientes, i = 1,2,..,n y

∑n

iz12= ∑

=

n

1 i

2

-

σµxi

tiene una distribución χ 2 con n grados de libertad

En la tabla correspondiente a esta distribución, podemos encontrar valores de

χα

2

tales que P ( χ 2 > χα

2

) = α .

χα

2

La distribución de muestreo de S 2: Teorema: Sea X1, X 2,…, Xn, una muestra aleatoria de una distribución normal con media µ y varianza σ2.

Entonces: ( )

2

1i

2

x

σ

∑ −=

n

ix =

( )2

21

σsn −

tiene una distribución χ 2 con (n-1) grados de

libertad. x y s2 son también variables aleatorias independientes.

Page 93: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 88

Ejemplo: Si X1, X2,…., X10 es una muestra aleatoria de una población distribuida normalmente con media 8 y varianza 9. Calcular la probabilidad de que la varianza muestral sea mayor que 3,753 Sea Z una variable aleatoria normal estándar y sea χ 2 una aleatoria Ji-cuadrada con v grados de libertad. Entonces si Z y χ 2 son independientes:

T = v

Z

2χ se dice que tiene una distribución t con v grados de libertad.

Si no se conoce σ y n < 30, se tiene sustituyendo en la expresión anterior:

T =

2

2

1) -(n 1)s -(n

-

σ

σµ nx

= -

x

sn

µ~ t n-1 g.l.

Distribución F: Supóngase que deseamos comparar las varianzas de dos poblaciones normales basados en la información contenida en muestras aleatorias independientes de las poblaciones. Supóngase que una muestra aleatoria contiene n1 variables aleatorias distribuidas

normalmente con una varianza común σ 2

1 y que la otra muestra aleatoria contiene

n2 variables aleatorias distribuidas normalmente con una varianza común σ 2

2.

Si calculamos s2

1 de las observaciones en la muestra 1, entonces s

2

1 es una

estimación de σ 2

1. De manera similar s

2

2 calculada a partir de las observaciones

de la segunda muestra es una estimación para σ 2

2.

Así intuitivamente podríamos pensar en utilizar s

s2

2

2

1 para hacer inferencias con

respecto a las magnitudes relativas de σ 2

1 y σ 2

2; si dividimos cada s

2

1 por

σ 2

1entonces la razón siguiente:

Page 94: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 89

σ

σ2

2

2

2

2

1

2

1

s

s

= s

s 2

2

2

1

2

1

2

2

σσ

tiene una distribución “F” con (n1-1) y (n2-1) grados de libertad. La

definición general de una distribución F es como sigue:

Definición: Sean χ 2

1 y χ 2

2 variables aleatorias independientes con v1 y v2 grados

de libertad respectivamente. Entonces: F =

2

2

2

1

2

1

v

v

χ

χ se dice que tiene una

distribución F con v1 grados de libertad del numerador y v2 grados de libertad del denominador. Distribución de la proporción muestral: En una población binomial, dada una muestra aleatoria (con reemplazamiento), la proporción muestral se define como el cociente del número de elementos de la muestra que tienen la característica deseada, entre el número total de elementos

de la muestra n

x ˆ =p .

E ( p̂ ) = E(x/n) = 1/n E(x) = n

1np ⇒ E ( p̂ ) = p

Var ( p̂ ) = Var(x/n) = 2

1

nVar(x) =

2

1

nn.p.q ⇒ Var ( p̂ ) =

n

qp. luego p̂ ~N

(p; pq/n), es decir:

Z =

npq

p - p̂ ~ N (0,1).

Muestreo simple, sistemático, conglomerado y estrat ificado Muestreo aleatorio simple Es aquel en el que, a priori, todos los elementos de la muestra tienen la misma probabilidad de aparición.

Page 95: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 90

Para realizar un muestreo es necesario hacer una lista de los objetos de donde se seleccionara la muestra, los objetos son unidades muestrales y la lista se llama marco muestral. Supongamos que tengamos una población de 50.000 individuos, y que tenemos un listado con sus nombres. Si queremos elegir 100 personas, lo que necesitamos es que el programa elija al azar a 100 individuos de esos 50.000. Otro ejemplo: el arrendador de una compañía de coches desea estimar el número de kilómetros que recorren sus coches de una flotilla de 280, se seleccionaron 30, teniendo una media de recorrido de 1342 km, con una desviación de 227 km. Para un intervalo de confianza de 95% T^±1.96 [(280)(227)/√30]*√280-30/280 T^=Nx¯ =280(1342) 375,760 ± 21,491 ó 354,269 km a 397,251 km Muestreo estratificado En el muestreo estratificado, los investigadores han de dividir a los sujetos en diferentes subpoblaciones (o estratos), en función de cierta característica relevante, y después lo que hacen es un muestro aleatorio simple de cada estrato. Evidentemente, cada individuo debe pertenecer a un estrato (y solo uno), y cada individuo del estrato habrá de tener la misma probabilidad de ser escogido como parte de la muestra. Ejemplo: Supongamos que, en Morelia, 70% de los niños de primaria van a escuela pública y el 30% a privada. Si queremos 1,000 niños, lo que haremos es dividir los alumnos en 2 estratos (pública y privada) y se eligen aleatoriamente 700 niños de la pública y aleatoriamente 300 de la concertada. Una estación de TV desea estimar el número promedio de horas que pasa una familia viendo TV, se decidió seleccionar una muestra de 1ro de cada distrito No.de familias Tamaño

muestral Media muestral

Varianza muestral

Distrito Ni Ni x~ si² 1 12,473 125 2.92 1.96 2 35,241 352 2.14 1.21 3 23,241 232 3.63 3.24 N=70892

Solución Media estratificada:

Page 96: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 91

x~st=1/N(Nix~₁+N₂x~₂+...+)= 1/70,892(124(2.92)+35,241(2.14)+23,178(3.63))=2.76 Horas diarias

2.76±1.96√1/(70892)²[(12473)(1.96/125)+35241(1.21/352)+23178(3.24/232)]

2.76±0.1 ó 2.66 a 2.86 horas por familia frente a la TV. Un comerciante de electrodomésticos desea estimar el gasto en aparatos caros para el siguiente año. Se realzó una encuesta e 2 pequeñas ciudades con los datos a continuación: Ciudad No.de familias Tamaño

muetral Media muestral

Varianza muestral

Ni ni $ Xi~ si² 1 2149 200 134 40122 2 1872 200 168 37104 4021 T^±1.96√∑Ni²(Ni-ni/Ni) si²/ni

T^=Nx~st=N(1/N(Nixi~+N₂x₂~)=2149(134)+1872(168)=602462

602462±1.96√(2149)²(2149-200/2149)+(1872)²(1872-200/1872))=73882

*40122/200 *37104/200

Gastarán entre $528,580 y $676,344 dólares Para el caso de la televisora estimar la proporción de familias que prefieren los programas de la televisora.

p~st=1/N(Nip1~+N₂p~₂+N₃p₃^)=1/70892(12473(0.21)+35241(0.179+23178(0.34))=0.23

Como la muestra es pequeña en relación a los estratos

0.23±1.96√(1/70892)²((12473)²(0.21)(0.79)/124+(35241)²(0.17)(0.83)/351+(23178)²(0.34)(

0.66)/231)=0.03

Es decir entre el 0.2 y 0.26 prefieren los programas. Muestreo por conglomerados En el muestreo por conglomerados, en lugar de considerar cada elemento de la población, lo que consideramos son “conglomerados de elementos”. El proceso es elegir aleatoriamente uno o varios conglomerados y la muestra estará formada por TODOS los elementos de los conglomerados. Ejemplos:

Page 97: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 92

En las encuestas durante las elecciones, los conglomerados pueden ser las mesas electorales, y lo que se hace es escoger algunas mesas al azar (y de ahí se toman todos los votos de las mesas seleccionadas). En otros ejemplos, los conglomerados pueden ser los bloques de viviendas, los municipios, etc. Ejemplo: Obtener un intervalo de confianza de 95% para el sueldo anual de una persona, en base a los siguientes datos. Familia No. asalariados Ingreso Ingreso total mi $ Xi 1 2 12100,27000 39100 2 1 23000 23000 3 2 18200,12800 31000 4 2 20900,14400 35300 5 1 29000 29000 6 1 26200 26200 7 2 14500,18300 32800 8 2 16900,19400 36300 9 1 48000 48000 10 3 19100,12000,7500 38600 11 1 26300 26300 12 1 35100 35100 13 3 17400,18900,12200 48500 14 2 16200,19900 36100 15 1 13200 13200 16 1 18400 18400 17 2 13100,14700 27800 18 1 21500 21500 19 2 22000,8000 30000 20 2 14400,7500 21500 ∑i=i²⁰mi=33 ∑i=₁²⁰xi=617700 m~=33/20=1.65

M~=19200/12205=1.5731258

x~= 617700/33=18718.18

∑i=₁..n xi²=20669130000

∑i=₁..n ximi=1081800

∑i=₁..n mi²=63

∑i=₁..n(xi-x~mi)²=∑i=₁..nxi²-2x~∑i=₁..nximi+x~²∑i=₁..nmi²

X~±1.96√(12205-20)/12205)(20)(1.5713258)²(2243802645/19)=2243802645

Page 98: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 93

18718.18 ± 3025.08 ó de $15693.1 a $21743.26 Muestreo por etapas En este caso se combina el muestreo aleatorio simple con el muestreo por conglomerados: Primero se realiza un muestreo por conglomerados (v.g., si los conglomerados son colegios en Morelia, se seleccionan aleatoriamente varios de ellos). Segundo, no se eligen todos los alumnos (como ocurriría en un muestro por conglomerados), sino que se elige una muestra aleatoria. (Dicha muestra puede ser obtenida por muestreo aleatorio simple o puede ser estratificado.) Es decir, hemos tenido 2 etapas de muestreo. Y claro está, es posible tener más de 2 etapas... Muestreo aleatorio sistemático Supongamos que tengamos una lista de N elementos (e.g., estudiantes de secundaria) y queramos una muestra de tamaño “n”. En este caso, lo que se hace es ordenarlos (v.g., en función de los apellidos) y después se elige aleatoriamente un elemento entre los N/n=k primeros, y luego se elige de manera sistemática el que esté k lugares después del primer elemento, y así sucesivamente. Ejemplo: Tenemos 10000 estudiantes (en una lista) y queremos obtener una muestra de 100 estudiantes. Primero elegimos al azar un estudiante entre los 10000/100=100 primeros (supongamos que salga el 26), el segundo elemento será el estudiante 100+26 (126), el siguiente será el 226, luego el 326, etc. Distribuciones de muestreo de la proporción y de la diferencia Proporción poblacional Una proporción poblacional se define como =X/N, donde X es el número de elementos en la población que poseen cierta característica y N es el total de elementos de la población. Una proporción muestral se define como p = x/n, donde x es el número de elementos en la muestra que poseen cierta característica y n es el total de elementos de la muestra.

Page 99: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 94

Cuando se desea estimar una proporción, el tamaño de la muestra siempre debe ser grande, es decir, n 30. Si la muestra se obtiene con reemplazo, x tiene distribución binomial y debido a que la muestra es grande, por el teorema central del límite se aproxima a una distribución normal; por consiguiente:

Debido a que se desconoce la proporción poblacional, se utiliza la proporción muestral para estimar la varianza, por lo tanto:

Distribución de la diferencia de proporciones De dos poblaciones se toman dos muestras aleatorias independientes de tamaños n1 30 y n2 30, y en cada una de ellas se observa una característica o cualidad. La proporción muestral de elementos con una característica se define como:

Page 100: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 95

Distribución del cociente de varianzas De dos poblaciones con distribución normal y varianzas poblacionales y se toman dos muestras aleatorias independientes de tamaños n1 y n2 . Como se vió, en la distribución de la varianza se llega a una distribución chi-cuadrado y del cociente de dos chi-cuadrado se obtiene una distribución F de Snedecor.

Conocidas las distribuciones en el muestreo de los principales estimadores, se tiene la fundamentación teórica que nos permite desarrollar el tema correspondiente a los intervalos de confianza y las pruebas de hipótesis.

Page 101: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 96

Cuadros de referencia

Page 102: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 97

AUTOEVALUACIÓN Se desea conocer las horas que en promedio se dedican a la lectura en una ciudad Determina la media estratificada y un intervalo de 95% de confianza para la media

Sector hogares Muestra Media muestral Desv. Est. NiXi (Ni^2*DE)/ni

Norte 60280 301.4 1.15 0.27 69322 3255120 Sur 48956 244.78 1.23 0.31 60215.88 3035272 Oriente 34785 173.925 1.28 0.22 44524.8 1530540 Poniente 62367 311.835 1.02 0.26 63614.34 3243084

Page 103: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 98

Intervalos de confianza Concepto Hasta ahora se ha hablado de la estimación puntual, en donde se halla un solo valor o indicador del comportamiento de una variable, pero no se sabe qué tan cerca está el valor estimado del parámetro y generalmente se necesita más que un valor exacto, un rango dentro del cual esperamos que esté el valor del parámetro; por esta razón, es de gran utilidad la estimación por intervalo en donde se tiene en cuenta la dispersión de los datos y de antemano se conoce la confiabilidad de la estimación. En esta unidad se desarrolla el tema correspondiente a los intervalos de confianza para la media, la proporción y la varianza. Intervalo de confianza Cuando se selecciona una muestra aleatoria y se obtiene un estimador puntual (promedio, proporción, etc.), no se sabe qué tan cerca está dicha estimación del parámetro, por ésta razón es necesario construir un intervalo de confianza, en donde además de tener en cuenta el grado de dispersión o variación de los datos y el tamaño de la muestra se establece un nivel de confianza o probabilidad de que el valor del parámetro esté contenido en dicho intervalo o rango. Para obtener un intervalo de confianza se determinan los valores Z1 y Z2 y a, tales que la confiabilidad de que el parámetro q esté dentro de los límites Z1 y Z2 sea - a , es decir:

Donde: 1- = Se conoce como confiabilidad o nivel de confianza y generalmente está entre el 90 y el 99% = Nivel de significancia o margen de error, del 1 al 10%

Z1 y Z2 = son percentiles correspondientes a una distribución de probabilidad, la cual depende de la distribución en el muestreo del estimador con el que se esté trabajando. Los valores de estos percentiles también dependen del nivel de confianza. Gráficamente, se hallan dos valores tales que el área que hay entre Z1 y Z2 sea 1- y el área restante ( ) se divide en dos partes iguales, quedando /2 en la parte

Page 104: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 99

inferior y el otro /2 en la parte superior de la distribución, tal como se observa en la figura. Por esta razón de ahora en adelante Z1 y Z2 se notarán como y .

Nivel de confianza y nivel de significancia

Estimación de la media poblacional a partir de la m edia muestral Como en el caso de las distribuciones en el muestreo, se tienen varios casos, los cuales dependen de las características de la población y el tamaño de la muestra. Intervalo de confianza para la media, cuando se sel ecciona una muestra aleatoria de tamaño n de una población con distribu ción normal con media y varianza conocida. En este caso, por las condiciones de la muestra se utiliza la distribución normal estándar, por lo tanto y pertenecen a una distribución normal estándar. Como se trabaja con una distribución normal, y son iguales pero con diferente signo, es negativo y es positivo, por lo tanto en la fórmula se incluye el signo y y se reemplazan por Z. Para obtener el intervalo de confianza para la media se utiliza la siguiente expresión:

(6.1) Donde Z pertenece a una distribución normal estándar. Interpretando este intervalo se dirá que el promedio poblacional estará entre:

con una confiabilidad del (1- ) por ciento.

Page 105: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 100

Ejemplo: Un proceso manufacturero usado por una fábrica durante los últimos 10 años, tiene una distribución normal con desviación estándar de 8 unidades por hora. Se desea estimar un intervalo de confianza del 90 por ciento para el promedio de unidades por hora producido con dicho proceso. Para tal efecto, se toma una muestra aleatoria de la producción por hora durante 25 horas y se obtiene un promedio de 160 unidades. Solución: Como la distribución de la población es normal y se conoce la desviación estándar poblacional, se utiliza la expresión 2.1 para calcular el intervalo de confianza. El valor de Z se halla en una tabla de la distribución normal. La confiabilidad es del 90 por ciento, por lo tanto el nivel de significancia o a (0.1) se divide en dos y se deja a /2 en la cola inferior y a /2 en la cola superior. En la figura 2.2, el área que hay de - a Z es 0,95 y para ésta área el valor de Z en la distribución normal es 1,64

Percentil de la distribución normal

Interpretación: El promedio de unidades por hora producidas en dicha fábrica está entre 157 y 163 con una confiabilidad del 90 por ciento. Intervalo de confianza para la media si se seleccio na una muestra aleatoria de tamaño n 30 de una población con distribución diferente a la normal. Por las condiciones de la muestra, se utiliza la siguiente expresión:

Page 106: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 101

(6.2) Donde Z pertenece a una distribución normal estándar. Ejemplo: En un estudio elaborado acerca de la duración de 51 bombillas de semáforos en cierta ciudad, se determinó un promedio de duración de 1.795 horas con una desviación estándar de 489 horas. Halle un intervalo con el 95 por ciento de confiabilidad para estimar la media poblacional. Solución

Como el tamaño de la muestra es mayor que 30, se utiliza la expresión 2.2 y para una confiabilidad del 95 por ciento, el valor de Z en la distribución normal es 1,96. Reemplazando:

Interpretación: Con una confiabilidad del 95 por ciento, la duración promedio de las bombillas de semáforos de dicha ciudad, está entre 1,661 y 1,921 horas. Intervalo de confianza para la media si se seleccio na una muestra aleatoria de tamaño n<30. Como la muestra es pequeña, se utiliza la siguiente expresión para despejar el intervalo de confianza para , obteniéndose:

(6.3) En donde Z pertenece a una distribución t con (n-1) grado de libertad. Si se trabaja con la desviación estándar corregida, se utiliza la expresión, obteniéndose:

(6.4) En donde Z pertenece a una distribución t con (n-1) grado de libertad.

Page 107: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 102

Ejemplo: Se desea hallar un intervalo de confianza para la estatura promedio de todos los estudiantes de ingeniería industrial de la Universidad. Para tal efecto, de los estudiantes de dicha carrera se seleccionó una muestra aleatoria de 15 personas a quienes se les preguntó su estatura en metros, obteniéndose los siguientes resultados: ESTATURA: 1.50 1.63 1.50 1.69 1.69 1.79 1.73 1.69 1.56 1.70 1.65 1.74 1.70 1.70 1.65 Halle un intervalo de confianza del 95 por ciento. Solución: Con la información disponible se calculó el promedio aritmético y la desviación estándar, los que respectivamente son 1,6613 y 0,0808 n = 15 y 1- = 0,95 Como la muestra es pequeña se utiliza la expresión 2.3. El valor de Z se halla en una tabla de la distribución t con 14 grados de libertad, que para un nivel de confianza del 95 por ciento es 2,145. Reemplazando:

Interpretación . Con un 95 por ciento de confiabilidad, se puede afirmar que la estatura promedio de los estudiantes de ingeniería industrial de la universidad, está entre 1,62 y 1,71 mts. Determinación del tamaño de la muestra para estimar la media Conceptos básicos A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.

1. Parámetro . Son las medidas o datos que se obtienen sobre la población. 2. Estadístico . Los datos o medidas que se obtienen sobre una muestra y por

lo tanto una estimación de los parámetros. 3. Error Muestral , de estimación o standard. Es la diferencia entre un

estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que

Page 108: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 103

se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.

4. Nivel de Confianza . Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.

5. Varianza Poblacional . Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

Tamaño de muestra para estimar la media de la pobla ción Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:

1.- Obtener el tamaño muestral considerando que :

donde:

: z correspondiente al nivel de confianza elegido

: varianza poblacional e: error máximo 2.- Comprobar si se cumple

Page 109: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 104

si esta condición se cumple el proceso termina aquí, y ese es el tamaño adecuado que debemos muestrear. Si no se cumple, pasamos a una tercera fase: 3.- Obtener el tamaño de la muestra según la siguiente fórmula:

Ejemplo: La Secretaria de Salud planea un estudio con el interés de conocer el promedio de horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de 0.1, ¿cuál debe ser el tamaño muestral que empleemos?

Buscamos en las tablas de la curva normal el valor de que corresponde con

el nivel de confianza elegido: = ±1.96 y seguimos los pasos propuestos arriba.

1.-

2.- Comprobamos que no se cumple , pues en este caso 10,000 < 3,706*(3,706 - 1); 10,000 < 13,730,730

3.-

La prueba de hipótesis para media y proporción Dentro del proceso de inferencia, además de la estimación puntual y la por intervalo, en muchas ocasiones es necesario hacer pruebas de hipótesis, las cuales se hacen con base en la información muestral.

Page 110: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 105

Se verá la prueba de hipótesis para la media y la proporción. Hipótesis Una hipótesis estadística es un supuesto acerca del valor de un parámetro de una población determinada. Este supuesto debe comprobarse con la información suministrada por una muestra aleatoria obtenida de dicha población. Cuando se realiza una prueba de hipótesis, se plantean dos hipótesis que deben ser mutuamente excluyentes; una es la hipótesis nula que se nota como H0 y la otra es la hipótesis alternativa que se nota como H1 . Se debe establecer un criterio o regla de decisión según la cual se rechace, o no, la hipótesis nula. Si se rechaza la hipótesis nula (H0) se acepta hipótesis alternativa (H1). Para establecer esta regla de decisión la distribución de probabilidad se divide en dos categorías mutuamente excluyentes: la que lleva al rechazo de H0, es decir está en la zona de rechazo y la que lleva al no rechazo de H0 , es decir, está en la zona de no rechazo. Debido a que se está trabajando con una muestra aleatoria, cuando se realiza una prueba de hipótesis se pueden cometer dos tipos de errores. La hipótesis nula (H0) es en realidad verdadera, pero debido a que los datos muestrales parecen ser inconsistentes con ella, se la rechaza (ERROR TIPO I) y la probabilidad de cometer un error tipo I se llama nivel de significancia ( ). Puesto que cuando se comete un error tipo I, seguiríamos una acción errónea, se puede definir el nivel de significancia como la probabilidad de decidirnos por H1 dado que H0 es verdadera. Por otro lado, podemos no rechazar H0 siendo en realidad falsa, a este error se le llama ERROR TIPO II. Formulación de hipótesis El primer paso en la prueba de hipótesis es el planteamiento de las hipótesis, lo que en algunos casos no es una tarea fácil. Hay tres tipos de hipótesis, a saber: 1. Prueba de hipótesis a dos colas H0: = k H1: k 2. Prueba de hipótesis a una cola superior

Page 111: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 106

H0 : = k ó H0: k H1 : > k ó H1 : > k 3. Prueba de hipótesis a una cola inferior H0 : = k ó H0 : k H1 : < k ó H1 : < k Nótese que las hipótesis siempre se plantean para un parámetro . Una vez establecidas las hipótesis, se selecciona el nivel de significancia o margen de error ( ) el que generalmente se fija entre el uno y el diez por ciento. El tercer paso es la estadística a probar o estadística de trabajo, la cual depende de la distribución en el muestreo del estimador con el que se esté trabajando y de los supuestos correspondientes a la población y al tamaño de la muestra. Cuando se realizan los cálculos siempre se supone que la hipótesis nula (H0) es cierta. El cuarto paso es establecer la regla de decisión, la cual depende de la distribución de probabilidad de la estadística a probar, del nivel de significancia ( ) y de la hipótesis alternativa (H1). Finalmente se toma la decisión de no rechazar la hipótesis nula o rechazarla. Prueba de hipótesis para la media El promedio aritmético poblacional es un indicador muy importante, por lo tanto, frecuentemente se desea probar si dicho promedio ha permanecido igual, ha aumentado o ha disminuido. A través de la prueba de hipótesis se determina si la media poblacional es significativamente mayor o menor que algún valor supuesto. Hipótesis Se puede plantear uno de los siguientes tres tipos de hipótesis: 1. Prueba de hipótesis a dos colas H0 : = k H1 : k 2. Prueba de hipótesis a una cola superior H0 : = k ó H0 : k H1 : >k ó H1 : > k

Page 112: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 107

3. Prueba de hipótesis a una cola inferior H0 : = k ó H0 : k H1 : < k ó H1 : < k En las distribuciones en el muestreo se vio que para el caso de la media, hay tres situaciones, por consiguiente la estadística de trabajo a utilizar depende de los supuestos de la población y del tamaño de la muestra Prueba de hipótesis para la media si la población d e donde se obtiene la muestra tiene distribución normal con conocida. La estadística de trabajo a usar corresponde a la expresión:

Donde: es el valor que se está suponiendo en la hipótesis nula (H0). Regla de decisión: Si se ha planteado la hipótesis alternativa como: H1 : k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura

Regla de decisión para una prueba de hipótesis a dos colas.

y pertenecen a una distribución normal estándar. Si el valor de la estadística de trabajo (Zx) está entre y no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir:

Si se ha planteado la hipótesis alternativa como:

Page 113: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 108

H1 : > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribución, como se aprecia en la figura 3.2

Regla de decisión para una prueba de hipótesis a una cola superior.

pertenece a una distribución normal estándar. Si el valor de la estadística de

trabajo (Zx) es menor que no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir,

Si se ha planteado la hipótesis alternativa como: H1 : < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribución, como se aprecia en la figura

Regla de decisión para una prueba de hipótesis a una cola inferior.

Z pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zx) es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir,

Page 114: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 109

Ejemplo: Un proceso manufacturero usado por una fábrica durante los últimos años da una producción media de 100 unidades por hora con una desviación estándar de 8 unidades. Se acaba de introducir en el mercado una nueva máquina para realizar ese tipo de producto. Aunque es muy cara comparada con la que está ahora en uso, si la media de producción de la nueva máquina es de más de 150 unidades por hora, su adopción daría bastantes beneficios. Para decidir si se debiera comprar la nueva máquina, a la gerencia de la fábrica se le permite hacer un ensayo durante 35 horas, hallándose un promedio de 160 unidades por hora. Con ésta información qué decisión se debe tomar si se asume un nivel de confianza del 99 por ciento. Solución: Según el enunciado, solo se compra la máquina si la producción es de más de 150 unidades por hora, por lo tanto las hipótesis son: H0 : = 150 H1 : > 150 Para elegir la estadística de trabajo se tiene en cuenta que se conoce la varianza poblacional, por lo tanto se usa la expresión

por el planteamiento de la hipótesis alternativa se trabaja a una cola superior. En la distribución normal, con una confiabilidad del 99 por ciento el valor de Z es 2,33. Como puede observarse en la siguiente figura, la estadística de trabajo está en la zona de rechazo de la hipótesis nula, por lo tanto, se acepta que la producción promedio por hora es superior a las 150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nueva máquina.

Regla de decisión para una prueba de hipótesis a una cola inferior.

Page 115: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 110

Prueba de hipótesis para la media si se selecciona una muestra aleatoria de tamaño n 30 de una población con cualquier distribución. La estadística de trabajo a usar es la expresión:

Regla de decisión: Es la misma que en el caso anterior y depende en todo caso de la hipótesis alternativa. Ejemplo: La duración promedio de las llantas producidas por una fábrica de llantas, según experiencias registradas es de 46.050 kms. Se desea probar si el promedio poblacional ha cambiado; para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una duración promedio de 45.050 kms. con una desviación estándar de 3.070 kms. Solución H 0 : = 46.050 H1 : 46.050 Teniendo en cuenta que el tamaño de la muestra es grande, como estadística de trabajo se utiliza

Por la hipótesis alternativa, la regla de decisión es a dos colas. La tabla a utilizar es la de la distribución normal. Asumiendo un nivel de confianza del 95 por ciento, los correspondientes valores de Z son -1,96 y 1,96. Como puede observarse en la figura, el valor de la estadística de trabajo está en la zona de rechazo de la hipótesis nula, por consiguiente, con una confiabilidad del 95 por ciento se acepta que la duración promedio de las llantas ha cambiado.

Page 116: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 111

Regla de decisión para una prueba de hipótesis a dos colas

Prueba de hipótesis para la media si se selecciona una muestra aleatoria de tamaño n<30 En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida. Si se utiliza la varianza sin corregir ( ) la estadística de trabajo es la expresión

Si se utiliza la varianza corregida la estadística de trabajo es la expresión:

Ejemplo: En su calidad de comprador comercial para un supermercado, se toma una muestra aleatoria de doce (12) sobres de café de una empacadora. Se encuentra que el peso promedio del contenido de café de cada sobre es 15,97 grs. con una desviación estándar de 0,15. La compañía empacadora afirma que el peso promedio mínimo del café es de 16 grs. por sobre. ¿Puede aceptarse ésta afirmación si se asume un nivel de confianza del 90 por ciento? Solución: Se desea probar si el peso mínimo es de 16 grs., es decir mayor o igual a 16 grs., así que las hipótesis adecuadas son: H0 : 16 H1 : < 16

Page 117: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 112

Teniendo en cuenta que el tamaño de la muestra es pequeño, como estadística de trabajo se utiliza la expresión

Como lo indica la hipótesis alternativa, se trabaja a una cola inferior en la tabla de la distribución t con 11 grados de libertad y una confiabilidad del 90 por ciento, el valor de Z es - 1,363 Como puede observarse, la estadística de trabajo (-0,663) está ubicada en la zona de no rechazo de la hipótesis nula, por lo tanto, con un nivel de confianza del 90 por ciento no se rechaza que los empacadores de café tienen la razón, por lo tanto se concluye que el peso promedio de los sobres de café es mayor o igual a 16 grs.

Regla de decisión para una prueba de hipótesis a una cola inferior

Prueba de hipótesis para la proporción Frecuentemente se desea estimar la proporción de elementos que tienen una característica determinada, en tal caso, las observaciones son de naturaleza cualitativa. Cuando se analiza información cualitativa y se está interesado en verificar un supuesto acerca de la proporción poblacional de elementos que tienen determinada característica, es útil trabajar con la prueba de hipótesis para la proporción. Hipótesis: Como en el caso de la media, se puede plantear uno de los siguientes tres tipos de hipótesis: 1. Prueba de hipótesis a dos colas

Page 118: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 113

H0 : = k H1 : k 2. Prueba de hipótesis a una cola superior H0 : = k ó H0 : k H1 : > k ó H1 : > k 3. Prueba de hipótesis a una cola inferior H0 : = k ó H0 : k H1: < k ó H1 : < k Cuando se va a estimar una proporción el tamaño de la muestra (n) siempre debe ser mayor a 30, por lo tanto se tiene un solo caso. La estadística de trabajo a utilizar es la expresión

Regla de decisión: Si se ha planteado la hipótesis alternativa como: H1: k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución.

y pertenecen a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp) está entre y no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si < Zp < no se rechaza H0 . Si se ha planteado la hipótesis alternativa como: H1 : > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribución, pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp ) es menor que no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp <

no se rechaza H0 . Si se ha planteado la hipótesis alternativa como: H1 : < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribución

Page 119: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 114

Z pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp ) es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp > Z no se rechaza H0. Ejemplo: Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria que suministra a una fábrica guardan las formas especificadas. Un examen de 200 de esas piezas reveló que 160 de ellas no eran defectuosas. Pruebe si lo que afirma el fabricante es cierto. Solución H0 : 0,9 H1 : < 0,9 Para realizar una prueba de hipótesis para la proporción se utiliza la expresión:

Asumiendo una confiabilidad del 95 por ciento, el valor correspondiente a Z en la distribución normal es -1,64 Como puede observarse en la figura, el valor de la estadística de trabajo se encuentra en la zona de rechazo de la hipótesis nula, por consiguiente, con una confiabilidad del 95 por ciento se concluye que la afirmación del fabricante no es cierta.

Regla de decisión para una prueba de hipótesis a una cola inferior

Errores en prueba de hipótesis Tabla de decisiones

Page 120: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 115

Ho Decisión verdadera Falsas Rechazar Ho Error tipo 1 Decisión correcta Aceptar Ho Decisión correcta Error tipo 2 La probabilidad de cometer un error tipo 1, se denota con la letra α. La probabilidad de cometer un error tipo 2 se denota con la letra β.

Page 121: LIA Probabilidad y a

Licenciatura en Informática Administrativa

UNIVERSIDAD VASCO DE QUIROGA 116

Bibliografía William Mendenhall, Estadística para Administradores, Grupo Editorial Iberoamerica, 1988 Anderson Sweeney Williams, Estadística para administración y economía, Editorial Math Learning Thomson, 2005.