Upload
david-montaner
View
121
Download
2
Embed Size (px)
Citation preview
Seguimiento y Evaluación OnLine de Trabajos de
Prácticas en Asignaturas de Estadística
III Jornadas de Intercambio de Experiencias de Innovación Educativa en Estadística
Valencia, 16 y 17 de Julio de 2012
David Montaner
www.dmontaner.es
La escena del crimen...
120 alumnos matriculados
Dos clases de prácticas
60 alumnos en cada clase
2 alumnos por ordenador
Todos aparentemente inocentes...nunca antes habían dejado huellas en un teclado
Prácticas realizadas con Excel 4 meses de condena...
El reto
Evaluar las practicas de cada alumno De forma rápida De forma equitativa
Maximizar el aprendizaje (conceptos básicos) Estadística descriptiva Regresión / correlación Contraste de hipótesis
Minimizar las copias o...
La trampa
Una historia común Con iguales variables Las mismas preguntas Cálculos necesarios
iguales Abordajes iguales
Simular datos distintos Para cada alumno Respuestas distintas
Esperar a que los alumnos copien
Construcción de la historia
El fichero X.zip (en el aula virtual) contiene datos recolectados durante un estudio de parejas casadas en los diferentes distritos de la ciudad. En este estudio, para cada distrito se muestreó el 1% del total de parejas casadas censadas en el distrito.
En la práctica trabajaremos en equipo así que cada alumno criminólogo analizara los datos de un distrito.
Parte II
Las variables medidas para cada pareja son:
famID: Identificador de familia.
ingV: Ingresos anuales del varón (en euros).
ingM: Ingresos anuales de la mujer (en euros).
NhijosV: Número de hijos (varones).
NhijosM:Número de hijas (mujeres).
relig: Variable que indica si la familia es religiosa.
Simulación
#tamaño muestraldatos[,'N'] < sample (300:500, size = nrow (datos), replace = TRUE)
#salario medio Varones del distritodatos[,'media.ingV'] < runif (n = nrow (datos), min = 0.5 * sal.min, max = 4 * sal.min)
#desviación de salarios de Varones en cada distrito...#pendiente de la recta de regresióndatos[,'inter'] < rnorm (n = nrow (datos), mean = 0, sd = 1000)
Las pesquisas...
¿Cuál es el tamaño de la muestra recogida en tu distrito? ¿Cuantas parejas casadas hay censadas en el distrito?PISTA: recuerda que se ha muestreado un 1% del total de parejas casadas del distrito.
¿Cuál es el ingreso medio de una pareja? ¿Cuál es el ingreso medio de una pareja en la que no trabaja
la mujer? PISTA: usa una tabla dinámica y aprovecha la variable derivada mSINingresos.
¿Cuál es el ingreso máximo registrado en los individuos? (varones y mujeres)
¿En que pareja encuentras este ingreso máximo?(indica el identificador de la familia famID)
Cuestiones más complicadas
¿Como es la correlación entre los ingresos de los varones y los de las mujeres?
Positiva (significativamente) Negativa (significativamente) No están correlacionados (cor. no significativa)
Cuestiones recurrentes
Sabiendo ésto dirías que:
En general en el distrito, los ingresos de los dos cónyuges tienden a ser altos o bajos de la MISMA forma: cuando el varón tiene ingresos altos la mujer también y cuando la mujer tiene ingresos bajos el varón generalmente también los tiene bajos.
En general en el distrito, los ingresos de los dos cónyuges tienden a ser altos o bajos de forma OPUESTA: cuando el varón tiene ingresos altos la mujer los tiene bajos y viceversa.
En general no hay una relación entre los ingresos de varones y mujeres: si un varón tiene los ingresos altos la mujer puede tenerlos altos o bajos independientemente.
Máximo realismo
Si sabemos que al comparar la familia González con la familia Pérez el señor Pérez gana 100 euros más que el señor González ¿Cuanto crees que ganaría más (o menos) la Señora de Pérez que la de González? Indica la cifra con un valor negativo si crees que la señora de Pérez gana menos que la de la de González.PISTA: no busques la respuesta en los datos. Es poco probable que las familias González y Pérez hayan sido muestreadas. Usa el valor estimado para la pendiente de la recta de regresión para contestar la pregunta.
¿Dirías lo mismo si estas dos parejas (González y Pérez) no hubiesen estado casadas? Si porque el modelo que estoy aplicando es válido para todas las
parejas. No porque mi muestra solo es representativa de las parejas casadas.
La verdadera historia
for (alumno in alumnos) {
...
Analisis de los datos
asignados al alumno.
...
save (file = alumno.RData)
}
Trabajo constante
Todas las cuestiones planteadas desde el día 0 Cada estudiante recibía todas las semanas dos hojas
de XLS con: Respuestas entregadas por él mismo
(para comprobaciones) Evaluación de cada pregunta (correcto / incorrecto)
Preguntas en clase y vuelta a empezar...
Los puntos clave Automatización
Análisis: programación (R) Recogida de resultados (formulario web) Comparación de las respuestas con la verdad (R)
Mejor si se plantea un contexto realista. Se puede plantear todo el ejercicio a principio del
curso. Preguntas cerradas. Con pocas variables se pueden hacer muchas
preguntas.
Mucho más trabajo
Es bastante costoso generar los datos y respuestas, formularios...
Es muy reutilizable para las evaluaciones pero también para ejercicios autocorregidos (se puede insertar en ilibros).
Aprovecha las ganas de copiar de los alumnos... Deja mucho tiempo en la clase para centrarse en
como resolver los problemas y no en si están bien o no (solo se evalúa una vez por semana)