23
Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírez Junio 2015

Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Irene Patricia Valdez y AlfaroMarco Antonio Gómez Ramírez

Junio 2015

Page 2: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

ESTADÍSTICA CON EXCELObjetivo: Los profesores aplicarán las herramientas de Excel para la obtención de las medidasdescriptivas más significativas y para el agrupamiento de un conjunto de datos en tablas defrecuencias y gráficas.

Ponentes: Mtra. Irene Patricia Valdez y AlfaroIng. Marco Antonio Gómez Ramírez.

Fechas: Del 8 al 12 de junio de 2015Lugar: Centro de Docencia de la Facultad de Ingeniería.Duración: 10 horas, en una semana, dos horas diarias.Horario de 16:0 a 18:00 p. m.

Temario:Estadística, Clasificación: Descriptiva e inferencial. Población y muestra, tipos de muestreo.Funciones de Excel para el tratamiento de datos.Descripción de datos univariados: Medidas descriptivas: centrales, de dispersión y de forma. Tabla dedistribución de frecuencias. Tablas dinámicas. Gráficas: histograma, polígono de frecuencias, y ojiva.Cálculo de medidas descriptivas con datos agrupados.Descripción de datos bivariados: Diagrama de Dispersión. Recta de Regresión. Coeficientes decorrelación y de determinación y su interpretación.

Page 3: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

M. EN T.A.E. IRENE PATRICIA VALDEZ Y ALFARO

Es Ingeniera Mecánica Electricista, áreaIndustrial, por la Facultad de Ingeniería de laUNAM (1994). Es Máster en Tecnologías dela Información y la Comunicación Aplicadas ala Educación y Maestra en TecnologíasAvanzadas en EducaciónLa Mtra. Valdez tiene una carrera docente deveintitrés años en la Facultad de Ingeniería;ha impartido las asignaturas de GeometríaAnalítica, Computadoras y Programación,Métodos Numéricos, Probabilidad,Probabilidad y Estadística, Estadística,Inferencia Estadística, Ingeniería Industrial yEstadística Avanzada. Ha impartido diversoscursos y talleres para profesores delicenciatura y de bachillerato con el fin deproporcionar apoyos a profesores y alumnospara lograr una efectiva incorporación en ladocencia de las tecnologías de la Informaciónque favorezcan el aprendizaje de losalumnos. En el mismo sentido, ha sidoponente en varios congresos nacionales einternacionales.

ING. MARCO ANTONIO GÓMEZ RAMÍREZIng. Mecánico Electricista, área Sistemas Eléctricosy Electrónicos, Facultad de Ingeniería, UNAM.100% de créditos de la maestría en EducaciónMatemática.Diplomados: “Planeación y evaluación deInstituciones Educativas”, “La enseñanza a travésdel Cómputo” y “Docencia en Ingeniería”.Profesor de carrera Titular B, definitivo de tiempocompleto.Asignaturas impartidas: Introducción a la Ingeniería,Dibujo, Métodos Numéricos, Computadoras yProgramación, Física Experimental, GeometríaAnalítica y Probabilidad y Estadística.Ponente en treinta eventos académicos sobre laEnseñanza de las Matemáticas y de la Ingeniería.Ponente e instructor en ocho cursos para profesoressobre aspectos psicopedagógicos de la labordocente frente a grupo: la “Planeación académica” y“Desarrollo de habilidades docentes a través de laMicroenseñanza”.Ponente en seis cursos disciplinares para profesoressobre Probabilidad y Estadística con aplicaciones deExcel.Publicaciones: Coautor del fascículo “Fundamentosde la Teoría de la Probabilidad”, en proceso“Variable aleatoria y variables aleatorias conjuntas”.

Page 4: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

página wikipedia.

Page 5: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

La palabra Estadística se originó con el vocablo introducido por elalemán Gottfried Anchuwall en 1749, Statistik, que se refería alanálisis de datos del estado, como los censos.

Hasta el siglo XIX el inglés John Siclear (1754-1835) le da elsignificado de recolección de datos y la clasificación de los mismos.

Actualmente, Estadística: Es una parte de las Matemáticas que tratade la teoría y la aplicación de métodos para coleccionar datos,organizarlos, analizarlos e interpretarlos, para posteriormente hacerdeducciones a partir ellos y llegar a la toma de decisiones.

Los procedimientos de análisis que aplica la estadística caen en doscategorías generales: Descriptiva e Inferencial.

Page 6: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

La Estadística Descriptiva, nos proporciona los métodospara la recolección, organización, descripción,visualización y resumen de datos, así como ladeterminación de los valores característicos que nospermiten describir el comportamiento de un hecho enestudio.

La Estadística Inferencial, es la que nos proporciona losmétodos y técnicas para hacer generalizaciones yestimaciones que nos permitan predecir mediante modelosmatemáticos el comportamiento futuro de un hecho enestudio, con base en la información que proporciona laEstadística Descriptiva.

Page 7: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

DESCRIPTIVA INFERENCIAL

Un jugador de beisbol quiere conocersu promedio de bateo en los pasadosdiez juegos.

Un Político desea saber el porcentaje devotos que obtuvo en la última elección.

Pedro quiere describir la variación enlas cinco calificaciones de exámenesque comprenden la primera parte delcurso de cálculo que imparte.

Ana le interesa conocer el promediosemanal de sus gastos en comestiblesen los últimos tres meses.

Un jugador de beisbol quiere estimar laoportunidad que tiene de superar supromedio de bateo en la próximatemporada.

Con base a una encuesta de opinión unpolítico le gustaría determinar laoportunidad de reelegirse en las próximaselecciones.

Con el apoyo en la variación de lascalificaciones en la primera parte del cursode cálculo, Pedro desea predecir lo quetendrá en calificaciones en la segundaparte del curso que imparte.

Ana desea calcular el monto semanalpromedio que gastará en comestibles elpróximo año

Page 8: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

Población: Conjunto de información que nos interesa estudiar yanalizar para conocer sus características primordiales, eningeniería para cuantificarlas y tomar decisiones a partir deellas, los valores correspondientes a estas característicasreciben el nombre de parámetros (se denotan con letras griegasminúsculas, p. ej. µx, σx , etc.).

Si la población es finita y discreta, el tamaño de la población se denota con la letra Nmayúscula.

Muestra: es un subconjunto de la población y lo ideal es que setrate de una muestra aleatoria, es decir, que todos loselementos de la población tiene la misma posibilidad depertenecer a la muestra. Los valores correspondientes a lascaracterísticas de interés de la muestra, reciben el nombre deestadísticos (se denotan con letras latinas, p. ej. �X, Sx, etc.).

El tamaño de la muestra se denota con la letra n minúscula.

Page 9: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

Población

Muestra

Page 10: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

El muestreo puede ser de juicio o aleatorio, el primero se basaen la experiencia individual o grupal, por ejemplo, el consejo deadministración de una empresa, que fundamenta la toma dedecisiones en la expertez de los integrantes de consejo.El muestreo aleatorio se basa completamente en el azar, de talmanera que todos los elementos de la población pueden serparte de la muestra.

Simple Sistemático Estratificado Por conglomerados

Este último es el que nos interesa y se pueden distinguirbásicamente cuatro tipos:

Page 11: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

El procedimiento empleado es el siguiente:

1) se elige el tamaño de muestra n.

2) se asigna un número a cada individuo de la población y

3) a través de algún medio mecánico o digital (bolas dentro deuna urna, tablas de números aleatorios, etc.) se eligen tantossujetos como sea necesario para completar el tamaño demuestra requerido.

El muestreo aleatorio simple puede ser con reemplazo o sin reemplazo

Page 12: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

página Universo-fórmulas.

Page 13: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

Este procedimiento exige, como el anterior, numerar todos

los elementos de la población, pero en lugar de extraer n

números aleatorios sólo se extrae inicialmente uno. Se

parte de ese número aleatorio i, que es un número elegido

al azar, y los elementos que integran la muestra son los

que ocupa los lugares i, i+k, i+2k, i+3k,..., i+(n-1)k, es decir

se toman los individuos de k en k, siendo k el resultado de

dividir el tamaño de la población entre el tamaño de la

muestra: k= N/n.

Page 14: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

página Universo-fórmulas.

Page 15: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

Consiste en considerar categorías típicas diferentes entre sí (estratos)que poseen gran homogeneidad respecto a alguna característica (sepuede estratificar, por ejemplo, según la profesión, el municipio deresidencia, el sexo, el estado civil, el nivel de ingresos, etc.). Enocasiones las dificultades que plantea formar los estratos sondemasiado grandes, pues exige un conocimiento detallado de lapoblación. (Tamaño geográfico, sexos, edades, etc.).

La distribución de la muestra en función de los diferentes estratos sedenomina asignación, y puede ser de diferentes subtipos: Simple, acada estrato le corresponde igual número de elementos muéstrales.Proporcional, la distribución se hace de acuerdo con el peso(tamaño) de la población en cada estrato. Optima, Se tiene en cuentala previsible dispersión de los resultados, de modo que se considera laproporción y la desviación típica. Tiene poca aplicación ya que no sesuele conocer la desviación.

Page 16: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

página Universo-fórmulas.

Page 17: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

En este tipo de muestreo, la unidad muestral es un grupo deelementos de la población que forman un conglomerado. Lasunidades hospitalarias, los departamentos universitarios, unacaja de determinado producto, etc., son conglomeradosnaturales. En otras ocasiones se pueden utilizar conglomeradosno naturales como, por ejemplo, las urnas electorales.

Cuando los conglomerados son áreas geográficas suelehablarse de "muestreo por áreas". El muestreo porconglomerados consiste en seleccionar aleatoriamente un ciertonúmero de conglomerados (el necesario para alcanzar eltamaño muestral establecido) y después investigar lascaracterísticas de los elementos pertenecientes a losconglomerados elegidos.

Page 18: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

página Universo-fórmulas.

Page 19: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

Cuotas, se basa en seleccionar los elementos de la muestradespués de dividir la población en grupos o clases. Los sujetosdentro de cada grupo se eligen por métodos no probabilísticos.

Tipos de muestreo de juicio o subjetivos.

página Universo-fórmulas.

Page 20: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

Conveniencia, consiste en seleccionar a los individuos queinteresan al investigador para la muestra. Esta conveniencia seproduce porque al investigador le resulta más fácil examinar aestos sujetos, ya sea por proximidad geográfica, por ser susamigos, etc.

Tipos de muestreo de juicio o subjetivos.

página Universo-fórmulas.

Page 21: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

Bola de nieve o por referidos, se realiza sobre poblacionesdonde no se conoce a sus individuos o es muy difícil acceder aellos. Se llama muestreo de bola de nieve, porque cada sujetoestudiado propone a otros, produciendo un efecto acumulativoparecido a una bola de nieve.

Tipos de muestreo de juicio o subjetivos.

página Universo-fórmulas.

Page 22: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

Casual o accidental, los individuos son elegidos de maneracasual, sin ningún juicio previo. Las personas que realizan elestudio eligen un lugar o un medio, y desde ahí realizan elestudio a los individuos de la población que accidentalmente seencuentren a su disposición.

Tipos de muestreo de juicio o subjetivos.

página Universo-fórmulas.

Page 23: Irene Patricia Valdez y Alfaro Marco Antonio Gómez Ramírezdcb.fi-c.unam.mx/profesores/irene/Notas/IntroEstadistica.pdf · Descripción de datos bivariados: Diagrama de Dispersión

Marco Antonio Gómez Ramírez Facultad de Ingeniería – UNAM Junio 2015Irene Patricia Valdez y Alfaro

Discrecional o por juicio, los sujetos se seleccionan a basedel conocimiento y juicio del investigador.

Tipos de muestreo de juicio o subjetivos.

página Universo-fórmulas.