Didáctica de la estatistica

  • Upload
    titito1

  • View
    228

  • Download
    1

Embed Size (px)

Citation preview

  • 8/8/2019 Didctica de la estatistica

    1/219

    Didctica de la

    Estadstica

    Carmen Batanero

    Departamento de Didctica de la Matemtica

    Universidad de Granada

  • 8/8/2019 Didctica de la estatistica

    2/219

    Didctica de la

    Estadstica

    Carmen Batanero

    Departamento de Didctica de la Matemtica

    Universidad de Granada

  • 8/8/2019 Didctica de la estatistica

    3/219

    Carmen Batanero, 2001

    Todos los derechos reservados. Ninguna parte del libro puede ser reproducida,almacenada en forma que sea accesible o transmitida sin el permiso previo escrito de laautora.

    Depsito Legal: GR-150/ 2001

    ISBN: 84-699-4295-6

    Publica:Grupo de Investigacin en Educacin EstadsticaDepartamento de Didctica de la Matemtica

    Universidad de Granada

    Imprime:Servicio de Reprografa de la Facultad de CienciasUniversidad de GranadaAvda. Fuentenueva s/n 18071 Granada

    Financiacin:Proyecto BSO2000-1507, DGES, Ministerio de Educacin y Ciencia.

    Grupo de Investigacin FQM-126. Consejera de Educacin. Junta de Andaluca.

  • 8/8/2019 Didctica de la estatistica

    4/219

  • 8/8/2019 Didctica de la estatistica

    5/219

    Papel en los mtodos estadsticos2.6.2. Asociacion y causalidad

    Causalidad, desde un punto de vista estadstico Modelo determinista lineal Modelo aleatorio lineal Aislamiento

    2.7. Inferencia estadstica2.7.1. La justificacin del razonamiento inductivo2.7.2. Popper y la refutacin de hiptesis

    La bsqueda de una solucin probabilstica al problema de la induccin2.7.3. La lgica de los test estadsticos

    Los tests de significacin de Fisher El contraste de hiptesis como proceso de decisin (Neyman y Pearson) Inferencia bayesiana

    2.7.4. Los diferentes niveles de hiptesis en la investigacin

    2.7.5. Revisin de algunas crticas en contra de los test de hiptesis2.8. Analisis multivariante de datos

    2.8.1. Tcnicas de clasificacin2.8.2. Tcnicas de reduccin de la dimensin

    CAPTULO 3. INVESTIGACIONES SOBRE RAZONAMIENTO ESTADSTICO Y DIFICULTADESDE APRENDIZAJE

    3.1. Introduccion3.2. Investigaciones sobre desarrollo cognitivo de Piaget y Fischbein

    La intuicin del azar La estimacin de la frecuencia relativa Estimacin de posibilidades y nocin de probabilidad Distribucin y convergencia La distribucin normal

    3.3. Investigaciones psicolgicas: heursticas y sesgos3.4. Investigaciones didcticas: errores, obstculos y concepciones3.5. Significado y comprensin

    Elementos de significado Dimensiones institucional y personal del conocimiento

    Significado y comprensin3.6. Significado subjetivo de la aleatoriedad

    Generacin de resultados aleatorios Reconocimiento de resultados aleatorios El sesgo de equiprobabilidad Independencia Comprensin de la probabilidad desde un punto de vista frecuencial

    3.7. Comprensin de tablas y grficos estadstos3.8. Investigaciones sobre la comprensin de las medidas de posicin central

    Capacidad de clculo y comprensin de algoritmos Comprensin de propiedades Identificacin de campos de problemas

    303132323233

    353637383940424345

    47505152

    5556

    58606062636466677071

    737375767777787983

    848587

  • 8/8/2019 Didctica de la estatistica

    6/219

    Comprensin de representaciones y capacidad de argumentacin3.9. Otros resmenes estadsticos

    Caractersticas de dispersin Puntuaciones tipificadas Estadsticos de orden

    3.10. Asociacin estadstica

    Tablas de contingencia Campos de problemas en el estudio de la asociacin Algunas dificultades en el estudio de la asociacin Influencia de los entornos informticos en el aprendizaje Diseo experimental

    3.11. Introduccin a la inferencia Distribucin normal y teorema central del lmite Muestreo La heurstica de la representatividad

    Insensibilidad al tamao de la muestra Intuiciones errneas sobre la probabilidad de experimentos compuestos La heurstica de la disponibilidad

    3.12. Contraste de hiptesis Errores comunes en la interpretacin del nivel de significacin Factores psicolgicos que contribuyen a estos errores Enseanza y aprendizaje de conceptos de inferencia

    CAPTULO 4. EL CURRCULO DE ESTADSTICA

    4.1. Introduccin Razones y fines de la educacin estadstica4.2. Fenomenologa estocstica

    El mundo biolgico El mundo fsico El mundo social El mundo poltico

    4.3. La naturaleza de las matemticas Matemticas: construccin o descubrimiento? Tres caractersticas de las matemticas

    4.4. Algunas teoras educativas Constructivismo Resolucin de problemas El papel de las herramientas semiticas La teora de situaciones didcticas

    4.5. Factores que condicionan el currculo Diferentes sentidos del trmino currculo Dimensiones del currculo

    4.6. Estadstica en los curriculos oficiales de educacin secundaria

    4.7. La evaluacion del aprendizaje Significados del trmino Componentes de la evaluacin

    889090919193

    9395969899

    100100101102

    104104105106106111113

    117117118118118120120120120121

    122122122122122124124125126

    129129130

  • 8/8/2019 Didctica de la estatistica

    7/219

    Instrumentos de evaluacin4.8. Materiales y recursos didcticos

    Material manipulativo Simulacin Calculadoras grficas Juegos

    4.9. Ordenadores y enseanza de la estadstica Clculo y representacin grfica Trabajo con datos reales Ficheros de datos y proyectos Simulacin

    4.10. Recursos en Internet Cursos y materiales didcticos Revistas electrnicas Conjuntos de datos

    Grupos de discusin o trabajo Centros de recursos Software

    CAPTULO 5. EJEMPLOS DE PROYECTOS PARA LA CLASE DE ESTADSTICA5.1. Introduccin5.2. Estructura de los proyectos y anlisis de su contenido5.3. Proyecto 1. Comprueba tus intuiciones respecto al azar

    5.3.1. Objetivos

    5.3.2. Los datos5.3.3. Preguntas, actividades y gestin de la clase5.3.4. Actividades de ampliacin5.3.5. Algunas dificultades y errores previsibles5.3.6. Anlisis del contenido estadstico

    5.4. Proyecto 2. Cmo son los alumnos de la clase?5.4.1. Objetivos

    5.4.2. Los datos5.4.3. Preguntas, actividades y gestin de la clase5.4.4. Actividades de ampliacin

    5.4.5. Algunas dificultades y errores previsibles5.4.6. Anlisis del contenido estadstico

    5.5. Proyecto 3. Estadsticas de la pobreza y desigualdad5.5.1. Objetivos5.5.1. Los datos5.5.3. Preguntas, actividades y gestin de la clase5.5.4. Actividades de ampliacin5.5.5. Algunas dificultades y errores previsibles5.5.6. Anlisis del contenido estadstico

    5.6. Proyecto 4. Las matemticas de la catadora de te5.6.1. Objetivos5.6.2. Los datos

    132133134136136137

    139139140141142142142143144

    144144144

    147147153153

    154154158159160161161161161168

    169170171171171173179180181

    182182182

  • 8/8/2019 Didctica de la estatistica

    8/219

    5.6.3. Preguntas, actividades y gestin de la clase5.6.4. Actividades de ampliacin5.6.5. Algunas dificultades y errores previsibles5.6.6. Anlisis del contenido estadstico

    5.7. Proyecto 5. La estadstica como herramienta de clasificacin5.6.1. Objetivos

    5.6.2. Los datos5.6.3. Preguntas, actividades y gestin de la clase5.6.4. Actividades de ampliacin5.6.5. Algunas dificultades y errores previsibles5.6.6. Anlisis del contenido estadstico

    5.8. Ideas para nuevos proyectos5.8.1. Actitudes hacia la estadstica5.8.2. Discriminacin laboral hacia la nujer5.8.3. Espaa en la Comunidad Europea

    5.8.4. Intencin de voto en las elecciones al consejo escolar5.8.5. Tiene ventaja el equipo que juega en su propio campo?5.8.6. Entrenamiento deportivo, se mejora con la prctica?5.8.7. Cuntas lentejas tiene un kilo de lentejas?

    Referencias

    182187188189190190

    190191195196197197197198198

    198199199200

    201

  • 8/8/2019 Didctica de la estatistica

    9/219

  • 8/8/2019 Didctica de la estatistica

    10/219

  • 8/8/2019 Didctica de la estatistica

    11/219

    1

    INTRODUCCIN

    Este libro est pensado para mis alumnos del curso "Didctica de la Estadstica",

    que se ha venido ofreciendo como asignatura optativa dentro del Plan de Estudios de laLicenciatura en Ciencias y Tcnicas Estadsticas de la Universidad de Granada, desde elcomienzo de dicho plan de estudios. Incluye tambin parte del material que a lo largo dedoce aos he venido elaborando, como parte de mi trabajo en diversos grupos deinvestigacin en educacin estadstica. Finalmente, el libro trata de reflejar las diversasfacetas de la estadstica: como ciencia, como herramienta de investigacin en reasdiversas, como campo de investigacin didctica, tanto para la formacin de nios,como de profesionales, investigadores y profesores.

    Al tratar de reflexionar sobre la formacin didctica que sera necesario impartir

    a estadsticos o a matemticos, quienes tienen una formacin suficientemente slida yactualizadas en los mtodos y tcnicas de esta materia, surge la necesidad de concretarlo que, en el lenguaje didctico, conocemos como conocimiento del contenido didctico.Cul es este conocimiento, una vez que se dominan las tcnicas matemticas? Cmoresumirlo y hacerlo til e interesante para los futuros profesores? Qu tipo desituaciones didcticas podemos usar para la enseanza del contenido didctico, siqueremos ser consecuentes con los principios constructivistas del aprendizaje, con laimportancia de la interaccin social y del trabajo en grupo del alumno?

    El material que presenta este libro trata de dar respuesta a estas preguntas en unrea particular de las matemticas -la estadstica- en la que existen pocos - o ningn-

    precedente de textos dedicados a la formacin didctica de los profesores. Est dirigidoa los profesores de educacin secundaria, tanto estadsticos, como matemticos, quienessuponemos tienen ya una base slida de los conceptos estadsticos elementales. Podraser tambin til a los profesores de estadstica en los cursos introductorios en launiversidad en reas como humanidades, ciencias sociales, ciencias de la actividad fsicay deporte, educacin y psicologa, y otras especialidades en las que los alumnos nosiempre han cursado un Bachillerato cientfico.

    En primer lugar, presentamos una breve panormica del estado actual de laeducacin estadstica, que proviene de diversas reas de conocimiento y no slo de la

    educacin matemtica, y que en los ltimos aos, con la creacin de la IASE(SociedadInternacional de Educacin Estadstica) empieza a configurarse como una disciplina conentidad propia.

    El segundo captulo lo dedicamos a la reflexin epistemolgica. Mientras que losconceptos estadsticos son sencillos, desde un punto de vista matemtico, existennumerosas dificultades de tipo filosfico ligadas a la interpretacin de estos conceptos ysu aplicacin a situaciones prcticas. El profesor debe ser consciente de la pluralidad designificados atribuibles a conceptos como el de aleatoriedad o probabilidad y de lascontroversias existentes en torno a la inferencia estadstica, puesto que las dificultades

    epistemolgicas se reproducen con frecuencia en el aprendizaje de los alumnos.La investigacin sobre comprensin y aprendizaje de los conceptos estadsticoselementales est an poco sistematizada y proviene de diversas reas de conocimiento

  • 8/8/2019 Didctica de la estatistica

    12/219

    2

    que han usado diferentes paradigmas de investigacin y marcos terico. En el captulo 3hemos tratado de hacer una sntesis personal de los resultados ms estables y que sonaceptados con generalidad por los investigadores en educacin estadstica.

    En el captulo 4 presentamos diversos elementos a tener en cuenta en el diseocurricular, incluyendo las disposiciones curriculares, reflexin sobre los fines de laeducacin estadstica, sus campos de aplicacin, el papel y mtodos de evaluacin y los

    materiales didcticos, entre los cuales la tecnologa ocupa un papel importante.En estos cuatro captulos la informacin presentada se intercala con un conjunto

    de actividades que he venido utilizando en cursos de didctica de la estadstica: textos breves o puntos para discutir, anlisis de tems usados en la evaluacin delrazonamiento estocstico, problemas paradjicos o con solucin contraintuitiva,

    bsqueda, recogida o anlisis de datos, anlisis de tareas o procedimientos, juegos, etc.Estas actividades estn pensadas como medio para contextualizar y provocar la

    reflexin y discusn sobre los diferentes conocimientos presentados, -seanepistemolgicos, psicolgicos, o didcticos- en cursos destinados a la formacin

    didctica de los profesores. Muchas de estas actividades pueden ser tambin usadas enlas clases de estadstica de secundaria, o en la universidad para hacer reflexionar a losalumnos sobre sus intuiciones incorrectas, para plantearles problemas originales yaumentar su motivacin.

    Finalmente, en el ltimo captulo presentamos algunos ejemplos de proyectosdesarrollados para trabajar en la clase de estadstica, junto con sugerencias de temas paraotros proyectos. La finalidad es contextualizar la enseanza de la estadstica, dentro del

    proceso ms general de investigacin y presentar un desarrollo de un curso deestadstica para secundaria o primeros cursos de universidad apoyado en el trabajo con

    proyectos.

  • 8/8/2019 Didctica de la estatistica

    13/219

    3

    1

    SITUACIN ACTUAL Y PERSPECTIVAS FUTURAS DE LA

    DIDCTICA DE LA ESTADSTICA1.1. Introduccin

    Aunque hace unos aos pocos investigadores se interesaban por los problemasde la enseanza y aprendizaje de la estadstica, en la actualidad asistimos a un aumentonotable de las publicaciones, diseos curriculares e investigacin relacionados con estetema. El propsito de este primer captulo es hacer un breve resumen histrico delorigen de la educacin estadstica y reflexionar sobre la situacin actual y perspectivasfuturas.

    Recientemente la estadstica se ha incorporado, en forma generalizada alcurrculo de matemticas de la enseanza primaria y secundaria y de las diferentesespecialidades universitarias en la mayora de pases desarrollados.

    Ello ha impulsado la investigacin y el desarrollo curricular en el campoespecifico de la estadstica. Ejemplos de proyectos curriculares desarrollados de acuerdoa estas ideas son, por ejemplo, los del Schools Council Project on Statistical Educationen el Reino Unido (1957-1981) y el Quantitative Literacy Project (1985-98) y DataDriven Mathematics (1996-2000) en Estados Unidos. Los materiales didcticos, elsoftware educativo, investigaciones, revistas, reuniones y congresos sobre la enseanzade la estadstica han crecido espectacularmente en los ltimos aos.

    Este inters, sin embargo, no es exclusivo de la comunidad de educacinmatemtica. La preocupacin por las cuestiones didcticas y por la formacin de

    profesionales y usuarios de la estadstica ha sido una constante de los propiosestadsticos, y las investigaciones sobre el razonamiento estocstico han tenido un granauge en el campo de la psicologa. En lo que sigue analizamos los trabajos sobreeducacin estadstica llevados a cabo en estos tres campos.

    1.2. Didctica de la estadstica dentro de la estadsticaLa relacin entre el desarrollo de un pas y el grado en que su sistema estadstico

    produce estadsticas completas y fiables es clara, porque esta informacin es necesariapara la toma de decisiones acertadas de tipo econmico, social y poltico. La educacinestadstica, no slo de los tcnicos que producen estas estadsticas, sino de los

    profesionales y ciudadanos que deben interpretarlas y tomar a su vez decisiones basadasen esta informacin, as como de los que deben colaborar en la obtencin de los datosrequeridos es, por tanto, un motor del desarrollo.

    La educacin estadstica ha asido una preocupacin crucial del Instituto Internacional de Estadstica (ISI) desde su fundacin en 1885, y esta preocupacin seconcret oficialmente en 1948 en el establecimiento del Comit de Educacin,

    encargado de promover la formacin estadstica, colaborando, para este fin, con laUNESCO y otros organismos internacionales, en un momento histrico en que eraprioritario mejorar la informacin estadstica en los pases en vas de desarrollo, lo que

  • 8/8/2019 Didctica de la estatistica

    14/219

    4

    implicaba la necesidad de preparar suficiente numero de tcnicos estadsticos en estos pases. Las responsabilidades del Comit de Educacin incluyeron el desarrollo dediplomaturas y licenciaturas en estadstica en los que se formaran los profesores ytcnicos estadsticos. Una de las primeras actividades de este comit fue la creacin delos Centros de Internacionales de Educacin Estadstica (ISEC) en Calcuta y Beirut,

    para atender las necesidades formativas de los pases de su respectivo entorno

    geogrfico. Este ao se han cumplido 50 aos de funcionamiento ininterrumpido delISECde Calcuta que estuvo dirigido por estadsticos tan prestigiosos como Mahalanobisy Rao.

    Asimismo, el comit ha colaborado en la produccin y difusin de ayudas para laenseanza, por ejemplo, la preparacin de libros de texto universitarios, bibliografasespecficas y diccionarios de trminos estadsticos. Subcomits especiales se dedicaron aimpulsar la introduccin de la estadstica en las escuelas, el papel de la mujer en laestadstica, y la promocin de conferencias sobre la educacin estadstica, dando origen,en particular a los ICOTS ( International Conference on Statistical Education) que se

    iniciaron en 1982 en la Universidad de Sheffield y han continuado cada cuatro aos.Otro tipo de conferencias iniciadas por el comit de educacin, como satlitesdel ICME ( International Congress of Mathematics Education), son las Round TableConferences sobre temas especifico de educacin estadstica, que han sido lossiguientes: "Estadstica en la escuela" (Viena, 1973; Varsovia, 1975, Calcuta, 1977), "Laenseanza universitaria de la estadstica en los pases en vas de desarrollo (La Haya,1968), "Enseanza de la estadstica y ordenadores", (Oisterwijk, 1970; Camberra, 1984),y "Formacin de profesores" (Budapest, 1988).

    En 1991 el ISI decide crear una nueva seccin, a la que se transferiran lasresponsabilidades y objetivos que hasta entonces haba tenido el Comit de Educacin.

    Nace as IASE (International Association for Statistical Education), con igualdad dederechos y obligaciones que el resto de las secciones del Instituto, participando en laelaboracin de sus revistas y organizacin de sus Sesiones bianuales, contribuyendo a sufinanciacin y teniendo representacin en sus organismos directivos. El objetivo

    principal deIASE es el desarrollo y mejora de la educacin estadstica en el mbitointernacional. Sus miembros son personas interesadas en la enseanza de la estadsticaen cualquiera de los niveles educativos, el desarrollo de software estadstico, laenseanza de la estadstica en empresas o industria, preparacin de expertos estadsticos

    para las unidades estadsticas en el gobierno y el desarrollo curricular, libros de texto y

    materiales didctico.Entre las responsabilidades asumidas, se encuentran la organizacin del ICOTS a

    (ICOTS IV, Marrakesh 1994; ICOTS V, Singapur, 1998) y de las Round TableConference asociadas al ICME, habiendo organizado hasta la fechas las dedicadas a"Enseanza del anlisis de datos" (Quebec, 1992), "Impacto de las nuevas tecnologasen la investigacin" (Granada, 1996) y "Formacin de los investigadores en el uso de laestadstica" (Tokio, 2000).

    1.3. La perspectiva psicolgica: investigacin sobre el razonamiento estocstico

    La influencia que, en la psicologa, han tenido las investigaciones sobre elrazonamiento estocstico es tal que Prez Echeverra (1990) habla de "revolucinprobabilista" para referirse a este impacto, equiparndolo al que ha tenido la perspectiva

  • 8/8/2019 Didctica de la estatistica

    15/219

    5

    cognitiva. Esta importancia se debe al giro que estos estudios han implicado en lostrabajos sobre razonamiento humano, donde se ha pasado de un modelo de actuacinacorde a la lgica formal, a concebir un decisor que acta de acuerdo a un sistema

    probabilstico complejo, utilizando heursticas adquiridas en su relacin emprica con locotidiano. Trabajos como los recogidos en Kahneman y cols. (1982), que tocan entreotros puntos el razonamiento correlacional, la inferencia, la probabilidad condicional y

    regla de Bayes, han contribuido a este cambio de paradigma en los estudiospsicolgicos.

    Una heurstica es una estrategia inconsciente que reduce la complejidad de un problema probabilstico, suprimiendo parte de la informacin. Aunque las heursticasayudan en muchos casos a obtener una solucin aproximada al problema, en otros

    producen sesgos en las conclusiones obtenidas, con las consiguientes implicaciones enlas decisiones tomadas. Consideremos, por ejemplo, el siguiente tem adaptado deKahneman y cols. (1982).

    Ejemplo 1.1 En un hospital maternal se lleva un registro del sexo de los recin nacidos. Cul

    de los dos sucesos siguientes te parece que tiene ms probabilidad?

    A. Que entre los prximos 10 recin nacidos haya ms de un 70 % de nias.

    B. Que entre los prximos 100 recin nacidos haya ms de un 70 % de nias.

    C. Las dos cosas me parecen igual de probables.

    La respuesta correcta a este tem es la A, aunque la mayora de los sujetos suelenconsiderar correcta la respuesta C. Esto es debido a que slo tienen en cuenta que la

    proporcin de nias en las dos muestras es la misma, sin tener en cuenta el tamao delas muestras, ya que las muestras pequeas son ms variables que las grandes. Al

    suprimir un dato (el tamao de la muestra) se ha reducido la complejidad del problema, pero se ha producido una solucin incorrecta. Razonamientos como el mostrado en elejemplo (la heurstica de la representatividad) han sido estudiados por los psiclogos, endiversos contextos de aplicacin, tales como diagnstico mdico o juicios legales.

    Por otro lado, y a partir de los estudios de Piaget e Inhelder (1951), laadquisicin de las ideas de aleatoriedad y probabilidad, del razonamiento combinatorio,de la intuicin de la frecuencia relativa, distribucin y convergencia, as como de lacapacidad de cuantificacin de probabilidades ha sido analizada en los nios desde sus

    primeros aos a la adolescencia, deteminndose, en consecuencia diferentes etapas en el

    desarrollo del razonamiento probabilstico. Otros autores han estudiado tambin lainfluencia de creencias previas y concepciones animistas de los nios sobre su capacidadde percepcin de lo aleatorio. La importancia que estos trabajos tienen para los

    profesores es que permiten seleccionar de una forma racional el tipo de tareas probabilsticas que podemos proponer a nuestros alumnos en funcin de su edad. Losinstrumentos de evaluacin construidos en estas investigaciones son tambin tiles paravalorar los conocimientos y modos de razonamientos de nuestros alumnos.

    Mencin particular merecen los trabajos de Fischbein (1975) y posteriores, yaque constituyeron uno de los primeros puentes de unin entre la psicologa y la

    educacin matemtica. Interesado no solo por la formacin de los conceptos formales,sino por la aparicin de intuiciones parciales sobre los conceptos estocsticos, se preocup tambin del efecto de la instruccin. Sus investigaciones apoyan

  • 8/8/2019 Didctica de la estatistica

    16/219

    6

    decididamente la conveniencia de adelantar la educacin estocstica y tambin muestranque, sin instruccin, es difcil que se desarrolle un razonamiento estocstico adecuado,incluso una vez que se alcanza la etapa de las operaciones formales. Fischbein ha sidouno de los fundadores del grupo PME (Psychology of Mathematics Education) que en elao 2000 ha celebrado su 24 reunin anual y es, en la actualidad el principal foro deinvestigadores en educacin matemtica. En 1994 se crea un grupo de trabajo sobre

    estocstica dentro de PME.

    1.4. Especificidad de la estadstica dentro de la didctica de la matemticaEl inters por la enseanza de la estadstica, dentro de la educacin matemtica,

    viene ligado al rpido desarrollo de la estadstica como ciencia y como til en lainvestigacin, la tcnica y la vida profesional, impulsado por la difusin de losordenadores, el crecimiento de su potencia y rapidez de calculo y las posibilidades decomunicacin.

    Todo ello ha facilitado el uso de la estadstica a un numero creciente de

    personas, provocando una gran demanda de formacin bsica en esta materia, que hasido encomendada, en los niveles no universitarios, a los profesores de matemticas.Los nuevos currculos de educacin primaria y secundaria incluyen en formageneralizada recomendaciones sobre la enseanza de la estadstica. Sin embargo, en la

    prctica son todava pocos los profesores que incluyen este tema y en otros casos se tratamuy brevemente o en forma excesivamente formalizada. Analizaremos, a continuacin,la problemtica que, para muchos profesores supone la enseanza de la estadstica.

    Una primera dificultad proviene de los cambios progresivos que la estadsticaest experimentando en nuestros das, tanto desde el punto de vista de su contenido,como del punto de vista de las demandas de formacin. Estamos caminando hacia una

    sociedad cada vez mas informatizada y una comprensin de las tcnicas bsicas deanlisis de datos y su interpretacin adecuada son cada da mas importantes. Esto noslleva a tener que ensear estadstica a alumnos con capacidades y actitudes variables, eincluso a los que siguen un bachillerato no cientfico, que no disponen de la misma basede conocimientos de clculo que sus compaeros.

    Al mismo tiempo, la estadstica como ciencia, atraviesa un periodo de notableexpansin, siendo cada vez mas numerosos los procedimientos disponibles, alejndosecada vez mas de la matemtica pura y convirtindose en una "ciencia de los datos", loque implica la dificultad de ensear un tema en continuo cambio y crecimiento. Por

    ejemplo, todo profesor que ha tratado de incorporar las calculadoras grficas o elordenador en su clase de estadstica, conoce bien el trabajo aadido que supone lacontinua puesta el da en el manejo de estos recursos.

    Por otro lado, el numero de investigaciones sobre la didctica de la estadstica esaun muy escaso, en comparacin con las existentes en otras ramas de las matemticas.Por ello, no se conocen aun cuales son las principales dificultades de los alumnos enmuchos conceptos importantes. Sera tambin preciso experimentar y evaluar mtodosde enseanza adaptados a la naturaleza especifica de la estadstica, a la que no siemprese pueden transferir los principios generales de la enseanza de las matemticas. Las

    investigaciones existentes no son muy conocidas por los profesores, ya que falta todavamucha labor de difusin, especialmente de trabajos realizados fuera de nuestro pas.Precisamente este libro pretende contribuir a llenar este hueco.

  • 8/8/2019 Didctica de la estatistica

    17/219

    7

    La misma naturaleza de la estadstica es muy diferente de la cultura deterministatradicional en clase de matemticas. Un indicador de ello es que aun hoy da prosiguenlas controversias filosficas sobre la interpretacin y aplicacin de conceptos tan bsicoscomo los de probabilidad, aleatoriedad, independencia o contraste de hiptesis, mientrasque estas controversias no existen en lgebra o geometra. Las dimensiones polticas yticas del uso y posible abuso de la estadstica y la informacin estadstica contribuyen,

    asimismo, a la especificidad del campo.La formacin especfica de los profesores en este mbito especifico es

    prcticamente inexistente. En Espaa slo muy recientemente se ha iniciado unaasignatura especifica de didctica de la estadstica en la Licenciatura en Ciencias yTcnicas estadsticas de la Universidad de Granada y creemos que este tipo deasignatura es prcticamente inexistente en otras universidades o licenciaturas.

    Por otro lado, aunque existen libros de texto excelentes, la investigacindidctica est comenzando a mostrar como algunos errores conceptuales y pedagogainadecuada se transmiten con una frecuencia mayor de lo que seria deseable en los libros

    de texto (Snchez-Cobo, 1996; Ortiz, 1999).Un ultimo punto es la naturaleza interdisciplinar del tema, que hace que losconceptos estadsticos aparezcan en otras materias, como ciencias sociales, biologa,geografa, etc., donde los profesores, a veces se ven obligados a ensear estadstica, loque puede ocasionar conflictos cuando las definiciones o propiedades presentadas de losconceptos no coinciden con las impartidas en la clase de matemticas.

    Parece, en consecuencia, necesaria una mejor preparacin previa y formacinpermanente del profesorado y un apoyo de los departamentos universitarios y grupos deinvestigacin implicados para lograrlo. El papel de las sociedades profesionales, como

    IASEes tambin decisivo, especialmente a partir de la constitucin de grupos locales

    activos que sirvan de intermediarios entre los profesores, estadsticos profesionales einvestigadores en educacin estadstica en sus distintas vertientes.

    1.5. Hacia donde va la educacin estadstica?En los apartados anteriores hemos descrito el panorama actual de la educacin

    estadstica. Es indiscutible que el siglo XX ha sido el siglo de la estadstica, que ha pasado a considerarse una de las ciencias metodolgicas fundamentales y base delmtodo cientfico experimental. La enseanza de la estadstica, sin embargo, an seencuentra en sus comienzos, aunque como hemos descrito parece avanzar de una forma

    imparable. Ser el siglo XXI el siglo de la educacin estadstica? Analizaremos acontinuacin algunos indicadores que parecen dar una respuesta positiva a esta

    pregunta, as como los cambios previsibles en nuestros mtodos de enseanza de estamateria.

    Un primer indicador de la expansin futura de la educacin estadstica son lostrabajos previstos porIASE, como el congreso ICOTS VIen el 2002 y las sesiones deeducacin en la Conferencia ISIde Corea en 2001. Oras sociedades de estadstica o deeducacin estn tambin organizando de secciones especificas de educacin estadstica,como, por ejemplo, la ASA ( American Statistical Association) AERA (American

    Educational Research Association, Royal Statistical Society, en Inglaterra, Sociedadestadstica Japonesa, la Sociedad Espaola de Investigacin en Educacin Matemtica,etc..

  • 8/8/2019 Didctica de la estatistica

    18/219

    8

    Las revistas orientadas a los profesores de estadstica sugieren una problemticadocente y un inters de los profesores por mejorar su accin docente. El mejorexponente lo tenemos en Teaching Statistics, que ha cumplido ya 22 aos de existenciadurante los cuales se ha ido desarrollando y adquiriendo una identidad y calidadinternacional reconocida. Otras revistas similares son Induzioni yJournal of Statistical

    Education, que es una revista de educacin estadstica a nivel universitario con un

    servicio de informacin asociado.Algunas de las asociaciones que hemos nombrado preparan boletines de noticias

    que distribuyen por Internet con un sistema semejante al de las revistas electrnicas,como laNewsletter del Statistical Education Research Group. A nivel docente podemoscitar el boletn del Statistics Teacher Network, que es una asociacin de profesores deestadstica en los niveles de primaria y secundaria.

    A la vista de todas estas posibilidades, surge la pregunta de hacia donde va laeducacin estadstica y que tipo de enseanza tendr lugar en el futuro (Hawkins,1997). Es difcil dar una respuesta, aunque los libros de texto se empiezan a transformar

    a ediciones electrnicas e incluso en formato accesibles a la consulta, modificacin ysugerencias a travs de Internet. Es tambin sencillo obtener datos de todo tipo para quelos estudiantes puedan realizar investigaciones sobre casi cualquier tema, incluso con

    pocos recursos disponibles. El profesor puede cargar estos conjuntos de datos desdeInternet e introducirlos en los ordenadores o las calculadoras grficas de los alumnosque tienen una difusin mucho mayor. De este modo los alumnos pueden trabajar conlos datos en casa o exportarlos a otros ordenadores o calculadoras. tambin puedencombinar diferentes conjuntos de datos en un mismo proyecto o "enviar" a la red sus

    propias colecciones de datos para que sean usadas por nuevos estudiantes en cualquierrincn del planeta.

    Las listas de discusin entre profesores o entre alumnos, la "tutora" de alumnosa distancia, cuando el trabajo del alumno no permite la comunicacin directa con el

    profesor son ya hechos cada vez mas cercanos y ya estn siendo implementados enforma experimental en algunas escuelas y universidades, como, por ejemplo, laexperiencia australiana de formacin a distancia de profesores (Watson y Baxter, 1998).La rapidez del cambio tecnolgico hace previsible la extensin de estas nuevas formasde enseanza y aprendizaje en un plazo de tiempo no muy lejano.

  • 8/8/2019 Didctica de la estatistica

    19/219

    9

    2

    FUNDAMENTOS EPISTEMOLGICOS

    2.1. IntroduccinUna vez situada la educacin estadstica, seguiremos con un estudio

    epistemolgico, que es bastante importante para la didctica. La estadstica, a pesar decontar con una axiomtica satisfactoria, es quizs la nica rama de las matemticasdonde prosiguen hoy da las discusiones sobre la interpretacin de conceptos bsicos.Esta controversia no es de tipo tcnico, ya que desde el punto de vista matemtico,cualquier concepto estadstico queda determinado por su definicin. Por ejemplo, la

    probabilidad sera cualquier funcin medible normada de un algebra de sucesos en el

    intervalo [0, 1]. Los problemas filosficos que la axiomatizacin no ha resuelto serefieren a las posibilidades de aplicacin de los conceptos estadsticos y la interpretacinde los mismos en diferentes circunstancias.

    Si el profesor no es consciente de esta problemtica, difcilmente podrcomprender algunas dificultades de sus estudiantes, quienes necesitan materializar enejemplos concretos los conceptos y modelos matemticos. En el ejemplo dado, ladefinicin no resuelve el problema de asignar probabilidad a sucesos como maanallover o habr 3 ganadores mximos en la prxima quiniela.

    En lo que sigue discutiremos algunos conceptos bsicos, comenzando por lamisma nocin de estadstica, a partir de las reflexiones realizadas por estadsticos,

    filsofos, psiclogos e investigadores en Didctica de la Matemtica preocupados poreste problema.

    2.2. EstadsticaSon muchas las definiciones posibles de estadstica, y entre ellas hemos elegido la

    siguiente que refleja bien nuestra conceppcin del tema:"La estadstica estudia el comportamiento de los fenmenos llamados de colectivo. Est

    caracterizada por una informacin acerca de un colectivo o universo, lo que constituye

    su objeto material; un modo propio de razonamiento, el mtodo estadstico, lo que

    constituye su objeto formal y unas previsiones de cara al futuro, lo que implica unambiente de incertidumbre, que constituyen su objeto o causa final." (Cabri, 1994).

    Los orgenes de la estadstica son muy antiguos, ya que se han encontrado pruebasde recogida de datos sobre poblacin, bienes y produccin en las civilizaciones china(aproximadamente 1000 aos a. c.), sumeria y egipcia. Incluso en la Biblia, en el librode Nmeros aparecen referencias al recuento de los israelitas en edad de servicio militar.

    No olvidemos que precisamente fu un censo lo que motiv del viaje de Jos y Mara aBeln, segn el Evangelio. Los censos propiamente dichos eran ya una institucin el

    siglo IV a.C. en el imperio romano.Sin embargo slo muy recientemente la estadstica ha adquirido la categora deciencia. En el siglo XVII surge la aritmtica poltica, desde la escuela alemana de

  • 8/8/2019 Didctica de la estatistica

    20/219

    10

    Conring, quien imparte un curso son este ttulo en la universidad de Helmsted.Posteriormente su discpulo Achenwall orienta su trabajo a la recogida y anlisis dedatos numricos, con fines especficos y en base a los cuales se hacen estimaciones yconjeturas, es decir se observa ya los elementos bsicos del mtodo estadstico. Para losaritmticos polticos de los siglos XVII y XVIII la estadstica era el arte de gobernar; sufuncin era la de servir de ojos y odos al gobierno.

    La proliferacin de tablas numricas permiti observar la frecuencia de distintossucesos y el descubrimiento de leyes estadsticas. Son ejemplos notables los estudios deGraunt sobre tablas de mortalidad y esperanza de vida a partir de los registrosestadsticos de Londres desde 1592 a 1603 o los de Halley entre 1687 y 1691, pararesolver el problema de las rentas vitalicias en las compaas de seguros. En el sigloXIX aparecen las leyes de los grandes nmeros con Bernouilli y Poisson.

    Otro problema que recibe gran inters por parte de los matemticos de su tiempo,como Euler, Simpson, Lagrange, Laplace, Legendre y Gauss es el del ajuste de curvas alos datos. La estadstica logra con estos descubrimientos una relevancia cientfica

    creciente, siendo reconocida por la British Association for the Advancement of Science,como una seccin en 1834, naciendo as la Royal Statistical Society. En el momento desu fundacin se defini la estadstica como "conjunto de hechos, en relacin con elhombre, susceptibles de ser expresados en nmeros, y lo suficiente numerosos para ser

    representados por leyes".

    Se crearon poco a poco sociedades estadsticas y oficinas estadsticas paraorganizar la recogida de datos estadsticos; la primera de ellas en Francia en 1800.Como consecuencia, fue posible comparar las estadsticas de cada pas en relacin conlos dems, para determinar los factores determinantes del crecimiento econmico ycomenzaron los congresos internacionales, con el fin de homogeneizar los mtodos

    usados. El primero de ellos fue organizado por Quetelet en Bruselas en 1853.Posteriormente, se decidi crear una sociedad estadstica internacional, naciendo en1885 el Instituto Internacional de Estadstica (ISI) que, desde entonces celebrareuniones bianuales. Su finalidad especifica es conseguir uniformidad en los mtodos derecopilacin y abstraccin de resultados e invitar a los gobiernos al uso correcto de laestadstica en la solucin de los problemas polticos y sociales. En la actualidad el ISIcuenta con 5 secciones, una de las cuales, la IASE, fundada en 1991, se dedica a la

    promocin de la Educacin Estadstica.

    Panorama actualAunque es difcil dividir la estadstica en partes separadas, una divisin clsica

    hasta hace unos 30 aos ha sido entre estadstica descriptiva y estadstica inferencial.La estadstica descriptiva tiene como fin presentar resmenes de un conjunto de

    datos y poner de manifiesto sus caractersticas, mediante representaciones grficas. Losdatos se usan para fines comparativos, y no se usan principios de probabilidad. Elinters se centra en describir el conjunto dado de datos y no se plantea el extender lasconclusiones a otros datos diferentes o a una poblacin.

    La inferencia estadstica, por el contrario, estudia los resmenes de datos con

    referencia a un modelo de distribucin probabilistico o una familia de modelos,determinando mrgenes de incertidumbre en las estimacin de los parmetrosdesconocidos del mismo. Se supone que el conjunto de datos analizados es una muestra

  • 8/8/2019 Didctica de la estatistica

    21/219

  • 8/8/2019 Didctica de la estatistica

    22/219

    12

    +++cccccc+ccc+c+cc+ccccc+ccc++ccc+c+ccccccccc++c+

    ccccccc+++++cccc++c+c+cc+cc+cc++++++c+cc++ccc++ccc

    Hicieron trampas Daniel o Diana? Por qu?.

    Cual es la solucin correcta al problema? Cmo lo resolveras? Podras dar una lista de

    variables que podras cambiar en el tem 1 para hacer variar su dificultad (variables del campo

    de problemas de donde surge la idea de aleatoriedad)? Qu otros colectivos de personas se

    interesaran por estos problemas? Qu haran para resolverlo?

    2.2.1. Aleatoriedad y causalidad

    Una primera acepcin de lo aleatorio se recoge en el diccionario de M. Moliner(1983):

    "Incierto. Se dice de aquello que depende de la suerte o del azar", siendo el azar

    "la supuesta causa de los sucesos no debidos a una necesidad natural ni a una

    intervencin humana ni divina".

    En esta definicin aleatorio es aquello cuyas causas son desconocidas y el "azar"estara personificado como la causa de los fenmenos aleatorios. Esta interpretacincorresponde a la primera fase histrica en el desarrollo de la idea de aleatoriedad quefinaliza al comienzo de la Edad Media. En esta etapa los dados o huesos de astrlago seusaron para echar a suertes, tomar decisiones y en ceremonias religiosas. puesto que elazar suprima influencia de la voluntad, inteligencia o conocimiento del hombre. SegnPoincar (1936), los filsofos clsicos diferenciaban los fenmenos que parecanobedecer a leyes conocidas y los aleatorios, que no podan preverse porque se rebelabanante toda ley. La aleatoriedad tena, adems, un sentido preciso, objetivo. Lo que era

    aleatorio lo era para cualquier persona.Otra interpretacin es suponer que todo fenmeno tiene una causa y que el azar es

    debido a nuestra ignorancia: "Nada sucede por azar sino que todo ocurre por una razn y por una necesidad" (Leucippus, siglo V a.c.). Esta es una interpretacin subjetiva porque lo que es aleatorio para una persona puede no serlo para otra con msconocimientos:

    "El azar no es ms que la medida de nuestra ignorancia. Los fenmenos fortuitos son,

    por definicin aquellos cuyas leyes ignoramos". (Poincar, 1936, pg. 69 de la

    reproduccin en el libro de Newmann).

    Que esta interpretacin no es adecuada se deduce de la existencia de fenmenosdeterministas cuyas leyes no conocemos, como la muerte y de otros fenmenosaleatorios, como la transmisin de caracteres genticos que tienen causas conocidas. Ennuestra moderna concepcin, los fenmenos aleatorios son aquellos a los que podemosaplicar el clculo de probabilidades, que seguir siendo vlido el da que encontremossus reglas. As, el jefe de ventas de una empresa ignora cuando o cuanto comprar cadauno de sus clientes. Sin embargo, sus beneficios seguirn siendo los mismos, inclusocuando lo conociese, porque la distribucin del consumo en la poblacin sera la misma,

    independientemente de este conocimiento.Cuando una causa pequea produce un efecto considerable, decimos que elresultado es aleatorio, porque la prediccin resulta imposible, como en los juegos de

  • 8/8/2019 Didctica de la estatistica

    23/219

    13

    azar, terremotos u otros desastres naturales. Es precisamente la complejidad o multitudde las causas lo que muchas veces determina un resultado aleatorio.

    Actividad 2.3. Elaborar una lista de sinnimos del trmino aleatoriedad. Son totalmente

    equivalentes? Buscar en diversos diccionarios (Diccionario de la Lengua, de uso del espaol,

    sinnimos, etc.) y encontrar matices diferenciadores. Elaborar una lista de trminos relacionados.

    Actividad 2.4. Como est presente el azar en los juegos, narrativas y actividades infantiles?

    Actividad 2.5. Estudiar algunas creencias culturales infundadas sobre la posibilidad de control de

    lo aleatorio? Como se ponen de manifiesto? Podras aportar datos al respecto?

    2.2.2. Aleatoriedad y probabilidadCuando comienza el clculo de probabilidades, por ejemplo en el Liber de Ludo

    Aleae de Cardano, se relaciona la aleatoriedad con la equiprobabilidad de los diferentes

    resultados, es decir, un fenmeno sera aleatorio si todos sus resultados sonequiprobables. Esta interpretacin se acept con facilidad, debido a que los primerosdesarrollos del clculo de probabilidades estuvieron muy ligados a los juegos de azar, enlos que el nmero de posibilidades es finito y el principio de indiferencia de lasdiferentes posibilidades puede considerarse razonable.

    Hacia el final del siglo XVIII y principios del XIX se ampla el nmero desituaciones consideradas aleatorias, incluyendo no slo los juegos de azar, sino muchosfenmenos naturales. Paralelamente, se produce un cambio en el concepto dealeatoriedad, que se hace progresivamente ms formalizado, introduciendo la idea de"independencia", que se considera imprescindible para asegurar la aleatoriedad de un

    suceso en experimentos repetidos.

    Concepcin clsicaLa nocin de aleatoriedad ha estado ligada a las diferentes concepciones sobre la

    probabilidad (Vase Godino, Batanero y Caizares, 1987). En una concepcin clsica,la probabilidad de un suceso es el "cociente entre el nmero de casos favorables al

    suceso y el nmero de casos posibles, siempre que todos sean equiprobables.

    En esta acepcin de la probabilidad, consideramos que un objeto (o un suceso) esun miembro aleatorio de una cierta clase de objetos (poblacin), si la probabilidad de

    obtener este objeto (en un sorteo u otro experimento) es igual que la de cualquier otromiembro de su clase. En la lotera nacional o el sorteo de excedentes de cupo en elservicio militar, cada nmero ( o cada mozo) sera un miembro aleatorio del conjunto demiembros en el sorteo.

    Esta definicin de aleatoriedad fue considerada suficiente en una primera etapa,donde el clculo de probabilidades se limitaba a los juegos de azar basados en dados,monedas, cartas, extraccin de bolas en urnas, etc, Sin embargo, pronto se le aplicaronalgunas crticas, as como a la concepcin de probabilidad en que se apoya.

    Hay en esta definicin una circularidad difcil de evitar, lo que hara tambin

    difcil usarla para discriminar un miembro aleatorio o no aleatorio en una clase dada.Por ejemplo, como sabemos que una ruleta dada o un dado, no estn ligeramentesesgados? O qu el sorteo de excedentes de cupo es realmente equitativo? Adems slo

  • 8/8/2019 Didctica de la estatistica

    24/219

    14

    podramos decir que un objeto es un miembro aleatorio de una clase, si la clase es finita.Si fuese infinita, la probabilidad de cada miembro de la clase siempre sera nula (portanto idntica), aunque el mtodo de seleccin fuese sesgado.

    Que ocurrira, finalmente, en el caso de sucesos elementales no equiprobables?Si aplicamos esta definicin, no podramos considerar que el color del pelo o el gruposanguneo sea una caracterstica aleatoria, ya que hay mayor proporcin de personas

    morenas que rubias en la poblacin y hay menos personas con Rh negativo. A pesar deestos problemas, la idea de equiprobabilidad se usa todava para definir la aleatoriedaden situaciones como definir una muestras aleatoria -todos los elementos tienen la misma

    probabilidad de ser elegidos- o la asignacin aleatoria de sujetos a los experimentos -cada sujeto tiene la misma probabilidad de ser asignado al grupo experimental o alcontrol.

    Concepcin frecuencialCuando queremos aplicar la idea de probabilidad a situaciones del mundo fsico o

    natural, como la meteorologa, el resultado de elecciones, accidentes, etc. nosencontramos con que no podemos aplicar el principio de equiprobabilidad Usando laconcepcin frecuencial de la probabilidad, podramos considerar que un objeto es unmiembro aleatorio de una clase si pudiramos elegirlo mediante un mtodo que

    proporcionase a cada miembro de la clase una cierta frecuencia relativa "a priori" a lalarga.

    Esta definicin es muy til cuando disponemos de datos estadsticos sobre un grannmero de casos, como en los ejemplos citados, aunque tenemos el problema terico dedecidir cuntos experimentos se necesitan para considerar que, a partir de este nmero,habramos probado suficientemente el carcter aleatorio del objeto. Esta definicin de la

    probabilidad no proporciona, adems, un valor exacto de la probabilidad, sino slo unaestimacin del mismo.

    Concepcin subjetivaEn los dos casos anteriores la aleatoriedad y la probabilidad son propiedades

    "objetiva" que se asigna al suceso o elemento de una clase, como podra asignrsele unaprofesin, estado civil o nacionalidad, si se trata de una persona. Kyburg (1974) criticaesta visin e indica que la idea de aleatoriedad est compuesta de cuatro trminos:

    el objeto que se supone es miembro aleatorio de una clase; el conjunto del cual el objeto es un miembro aleatorio (poblacin o colectivo); la propiedad con respecto a la cual el objeto es un miembro aleatorio de la clase dada; el conocimiento de la persona que decide si el objeto es aleatorio o que asigna una

    probabilidad.

    La decisin sobre si consideramos que un objeto es o no un miembro aleatorio deuna clase, depende de nuestro conocimiento sobre el mismo. Lo que puede ser aleatorio

    para una persona puede no serlo para otra. y la aleatoriedad no es una propiedad fsica

    "objetiva", sino que tiene un carcter subjetivo. Utilizamos ahora la concepcinsubjetiva de la probabilidad, por la que todas las probabilidades seran condicionales yes ms conveniente en las situaciones en que poseemos cierta informacin que puede

  • 8/8/2019 Didctica de la estatistica

    25/219

    15

    cambiar nuestro juicio sobre la aleatoriedad o la probabilidad de un suceso.Hay algunas situaciones que todo el mundo considerara aleatorias y donde el uso

    de la idea de equiprobabilidad para definir un suceso aleatorio parece claro y nocontrovertido. Por ejemplo, en el caso de un dado equilibrado, cualquier lanzamiento essimplemente un ejemplo de cualquier otro posible lanzamiento. No hay nada nuevo que

    podamos conocer acerca del dado que nos permita predecir otra probabilidad diferente

    de 1/6 para un resultado particular del dado.En otros casos la situacin no es tan clara. Consideremos, por ejemplo, la

    probabilidad de que un chico apruebe el examen de conducir. Si tenemos que dar unvalor para esta probabilidad, nuestras estimaciones sern muy diferentes en caso delexaminador o de su profesor de la autoescuela, que ha estado observando como conducea lo largo de los ltimos dos meses.

    Actividad 2.6. En los siguientes sucesos indica cuales consideras aleatorios y qu concepcin de

    aleatoriedad puede aplicrsele

    1. Germinacin de una semilla plantada con cuidado

    2. El resultado obtenido en un dado que yo he lanzado y puedo ver, pero tu no

    3. El nmero ganador de la lotera el prximo mes

    4. El color del prximo jersey que te compres

    5. Si llovi en Melbourne el 3 de Agosto pasado

    6. Si llover en Melbourne el 3 de Agosto prximo

    7. Que cojas la gripe este ao

    8. Que ests expuesto a coger la gripe este ao

    9. El resultado de lanzar una moneda, si la he lanzado 10 veces y he obtenido 10 caras

    2.2.3. Procesos y secuencias aleatoriasSegn Zabell (1992) la idea de aleatoriedad contiene dos aspectos distintos que, a

    veces, pueden no coincidir, que son: el proceso de generacin, que es lo que, matemticamente se conoce como

    experimento aleatorio; el patrn de la secuencia aleatoria producida como consecuencia del experimento.

    Muchas personas piensan que estos dos aspectos estn ligados entre s y esperanque slo un proceso aleatorio proporcione un patrn de resultados aleatorios. Sin

    embargo, puede haber secuencias que, aparentemente, parezcan aleatorias, siendo producidas por un proceso completamente determinista, como cualquier trozo de lasecuencia de nmeros decimales del nmero Pi u otro nmero irracional.

    Por otro lado, incluso una secuencia aparentemente regular y determinista, comoC+C+ puede obtenerse como resultado de lanzar cuatro veces una moneda y estasecuencia particular, en contra de la creencia popular es tan probable como CCC+ o++C+.

    A final del siglo XIX Edgeworth, Galton, Pearson, Fisher y sus colaboradoresinician el estudio de mtodos de inferencia, basados en la eleccin de muestras

    aleatorias de datos. Hasta esa fecha los estudios estadsticos eran puramentedescriptivos, analizando grandes masas de datos empricos. En los casos en que seutilizaban muestras, estas no se elegan al azar, porque no se era consciente de la

  • 8/8/2019 Didctica de la estatistica

    26/219

    16

    importancia de elegir muestras aleatorias para poder realizar inferencias vlidas yprecisas sobre la poblacin. Cuando los nuevos estudios muestran la importancia de lasmuestras aleatorias, empieza el inters por encontrar modelos de procesos que asegurenla consecucin de largas secuencias de dgitos aleatorios, a partir de los cuales setomaran las muestras.

    Se puede generar resultados aleatorios con dispositivos fsicos, como extraccin

    de bolas, dados o ruletas. Es el mtodo que usamos en juegos y sorteos, como la lotera.Sin embargo, es muy difcil conseguir construir dispositivos que aseguren laaleatoriedad fsica perfecta y es un procedimiento lento. Las tablas de nmerosaleatorios, iniciadas por Lord Kelvin, Fisher, Yates y Kendall surgen para sustituir estosdispositivos fsicos. Este tipo de tablas puede tambin ser usado en clase con losalumnos de educacin secundaria.

    Para generar nmeros aleatorios podemos tambin usar una frmula (los llamados"nmeros pseudo-aleatorios"). Con ayuda de un algoritmo un ordenador o calculadora

    produce una secuencia numrica que puede ser empleada como aleatoria para los

    propsitos prcticos. Asimismo, podemos obtener sucesiones aleatorias extradas dedistintos tipos de distribucin terica, como la distribucin normal con una cierta mediay varianza.

    Actividad 2.7. Investigar algunos algoritmos de generacin de nmeros aleatorios Cmo podras

    asegurar la calidad de un algoritmo o una tabla de nmeros aleatorios? Recuerdas algunos

    test de aleatoriedad clsicos?

    2.2.4. Formalizacin de la Idea de AleatoriedadLos autores de las primeras tablas de nmeros aleatorios se preocuparon por

    asegurar su "calidad". Puesto que era posible obtener nmeros pseudo-aleatorios conayuda de algoritmos deterministas, deba examinarse la sucesin producida,independientemente del proceso que la genera.

    En el siglo XX varios estadsticos estudian este problema, finalizando con laformalizacin del concepto de aleatoriedad. Una idea intuitiva es que con una sucesinaleatoria es imposible inventar un mtodo que nos permita ganar en un juego de azarcuyos resultados fuesen los de la sucesin; Otra idea intuitiva es que la sucesinaleatoria como altamente irregular o compleja.

    Enfoque de los algoritmos de seleccinVon Mises comenz su estudio definiendo la poblacin o colectivo, como

    fenmeno de masas, suceso repetitivo o larga serie de observaciones, para las cuales hayrazones suficientes para creer que la frecuencia relativa de un suceso tiende a un lmitefijo.

    A partir de esta idea, considera que una secuencia de observaciones es aleatoria sila frecuencia relativa de cada posible suceso en la sucesin no vara en ninguna parte dela misma. Dicho de otra forma, en una secuencia aleatoria no puedo encontrar unalgoritmo por el cual seleccionar una subsecuencia en la cual la frecuencia relativa de

    uno de los resultados se vea afectada.Supongamos, por ejemplo, que al elegir todos los elementos pares, o cada diezelementos, o todos los elementos primos en una sucesin de caras y cruces obtenidas al

  • 8/8/2019 Didctica de la estatistica

    27/219

    17

    lanzar una moneda obtuviese una secuencia en la que la probabilidad de cara fuese 3/5.Considerara, entonces, que la secuencia dada no era realmente aleatoria, ya que podraobtener ventaja en un juego de azar apostando a favor de la cara cada dos, diez jugadas oen las jugadas nmero primo.

    Esta definicin de aleatoriedad se us para inventar contrastes de aleatoriedad quese aplicaban a las tablas de nmeros aleatorios, antes de ponerlas en uso en la

    comunidad cientfica. Estos contrastes tratan de detectar las posibles regularidades de lasucesin. Sin embargo, puesto que todo contraste de hiptesis siempre lleva asociadouna posible probabilidad de error, nunca podramos tener total seguridad de que unasucesin dada, a pesar de haber pasado todas las pruebas, tuviese algn tipo de patrnque nos hubiera pasado desapercibido y, por tanto, no fuese totalmente aleatoria.Adems, en toda sucesin finita podramos tomar una subsucesin que alterase lafrecuencia de uno de los resultados, por lo que esta definicin slo vale para sucesionesinfinitas.

    Enfoque de la complejidad absolutaOtro intento de definir la aleatoriedad de una sucesin, debido a Kolmogorov, sebasa en su complejidad. La complejidad de una sucesin es la dificultad de describirla (oalmacenarla en un ordenador) mediante un cdigo que nos permita reconstruirla mstarde. El mnimo nmero de signos necesarios para codificar esta sucesin proporcionauna escala para medir la dificultad de almacenarla, o, lo que es lo mismo, sucomplejidad. Por ejemplo, si comparamos las secuencias:

    CC++C+CC++C+C+C+C+C+

    vemos que puedo codificar mas abreviadamente la primera como CC+2+CC++,

    mientras que la segunda la podramos codificar como 4C+. Por lo tanto la primerasucesin es ms compleja que la segunda, ya que precisa ms signos para codificarse.

    Bajo este enfoque, una secuencia sera aleatoria si no se puede codificar en formams abreviada, por lo que la ausencia de patrones peridicos sera su caractersticaesencial. Es decir, una secuencia sera aleatoria si slo podemos describirla listando unotras otros todos sus componentes. Esta definicin establece una jerarqua en los gradosde aleatoriedad de diferentes sucesiones y la aleatoriedad perfecta sera un conceptoterico o lmite.

    Como resumen, podemos decir que el concepto de aleatoriedad se puede

    interpretar desde un punto de vista formal o informal. Desde el punto de vista informal,hablamos del azar, como patrn que explica aquellos efectos para los que no conocemosla causa o que no son predecibles. Esta interpretacin refleja muchos aspectosfilosficos epistemolgicos sociales y personales y es una importante fuente deconfrontacin entre las probabilidades subjetivas y objetivas. Desde el punto de vistaformal la idea central es la sucesin de resultados de un mismo experimento realizadorepetida e independientemente, que lleva, en su caso ms sencillo a la sucesin deensayos de Bernoulli.

    Actividad 2.8. Estudiar la complejidad de las secuencias propuestas en el tem 1 y decidir cual sera ms aleatoria en este enfoque. Generar 10 secuencias de dgitos aleatorios con la

    calculadora y ordenarlas segn su complejidad de codificacin.

  • 8/8/2019 Didctica de la estatistica

    28/219

    18

    Actividad 2.9. El modelo ms simple de secuencia de resultados aleatorios es la secuencia de

    ensayos de Bernoulli. Dar una lista de modelos aleatorios que se deducen de este tipo de

    secuencia. Analizar las secuencias presentadas en el tem 1, desde el punto de vista de este

    modelo. Tendramos ahora argumentos para afirmar que una de las nias hace trampas?

    Actividad 2.10. Pablo juega a un juego con 16 fichas numeradas 1, 2, 3, 4,...16. Pablo pone las

    fichas en una caja y la mueve con fuerza. Toma una ficha al azar y es el 7. Pone una cruz en lacasilla 7.

    1 2 3 4

    5 5 7 x 8

    9 10 11 12

    13 14 15 16

    Otros nios jugaron al mismo juego, aunque algunos hicieron trampas.

    X xX

    XXx X

    x x XX

    x X X X xXX x X x x x x X

    x x X X x x

    Luis

    Jaime

    x x X X x xx

    x X X X X x XX X

    X X X X x x X

    x x x x x XxxX

    Jesus

    Maria

    Qu modelo aleatorio podemos aplicar a estas situaciones? Como podras justificar cuales de

    los nios hacen trampas? Elabora una lista de situaciones de la vida real en que el modelo que

    has encontrado sea til y en donde algunas personas se interesen por resolver un problema

    similar al dado.

    2. 4. Ideas estocsticas fundamentales

    Adems de la ideas bsicas de aleatoriedad hay una serie de conceptos sobre loscules se apoya todo el clculo de probabilidades y la estadstica. Es importanteidentificar estos conceptos, que son los que debemos ensear en los niveles nouniversitarios. Para elaborar una lista de ideas estocsticas fundamentales, analizaremosel artculo de Heitele (1975), quien se basa en el libro de Bruner "El proceso deeducacin" , publicado en 1960, que sostiene las tesis siguientes:1. El principio decisivo de instruccin en un tema es la transmisin de las ideas

    fundamentales.2. Cualquier tema puede ser enseado efectivamente en alguna forma correcta a

    cualquier nio en cualquier estado de desarrollo, lo que implica que las ideasfundamentales son una gua necesaria desde la escuela primaria a la universidad paragarantizar una cierta continuidad.

  • 8/8/2019 Didctica de la estatistica

    29/219

    19

    3. La ideas fundamentales son aquellas ideas y conceptos que se usarn en diferentesniveles cognitivos y lingsticos en una "espiral curricular".

    4. La transicin a un nivel cognitivo superior se facilita si el tema subyacente ha sidopreparado en una representacin conveniente en etapas cognitivas anteriores.

    Las ideas fundamentales proporcionan al nio modelos explicativos eficientes en

    cada etapa de su desarrollo, que difieren en los distintos niveles cognitivos, no de unaforma estructural, sino slo de una forma lingstica y en su nivel de profundizacin.Por ejemplo, si un nio, al lanzar dos dados concede ms probabilidad al 7, porque hayms sumas con ste valor, tiene un modelo apropiado, que puede evolucionar al mscomplejo de aplicacin de la regla de Laplace, e incluso al de variable aleatoria y modade su distribucin de probabilidad. Por el contrario, si un nio al lanzar dos monedasexplica la mayor proporcin de casos "mixtos" argumentando que tras "cara" es ms

    probable "cruz", usa un modelo de explicacin que le satisface, pero no permitecontinuacin a un estadio ms elaborado. Se trata de una "intuicin errnea".

    En el campo de la probabilidad la intuicin juega un papel muy importante. Losmodelos intuitivos explicatorios tienen dos funciones: En una edad temprana ayudan al nio a entender su entorno por sus propios medios,

    mucho antes de que sea capaz de comprender la complejidad del modelo matemticosubyacente.

    Preparan el conocimiento analtico posterior.

    El gran nmero de paradojas estocsticas puede confundir incluso a los expertos.Por ello, es ms importante construir intuiciones correctas en este campo que en ningnotro. Como seala Feller, la intuicin estadstica puede ser entrenada incluso en los

    adultos, aunque si un nio adquiere "intuiciones errneas" cuando es muy pequeo, estole puede impedir mas tarde la adquisicin de un conocimiento adecuado. Por ello parecenecesario ofrecer a los nios actividades estocsticas, en forma de juegos yexperimentos en edad temprana. Sin embargo, las actividades a desarrollar no debenescogerse al azar. Es preciso un principio de organizacin, en la forma de la espiralcurricular, escalonada por las ideas fundamentales. A continuacin analizamos los 10grupos de ideas fundamentales en estocstica que propone Heitele.

    La probabilidad como normalizacin de nuestras creencias.

    La primera idea fundamental es asignar nmeros a los sucesos aleatorios, deforma que estos nmeros reflejen nuestro grado de creencia en su verificacin. En ellenguaje ordinario se usan expresiones del tipo de "casi cierto", "ms probable que",etc., para comparar los sucesos aleatorios, pero estas expresiones son poco precisas,

    porque diferentes personas les conceden diferente valor.Se normalizan estas expresiones asignndoles un valor en la escala de la

    probabilidad. De este modo ponemos en correspondencia la multidimensionalidad delcomplejo mundo a nuestro alrededor con el intervalo [0,1], y se hace accesible a losdispositivos matemticos. Podemos comparar sucesos muy dispares, en base a su mayor

    o menor probabilidad. En la idea de probabilidad, tan sencilla, pero tan potente,encontramos un ejemplo de cmo el hombre idea modelos matemticos paracomprender y predecir la realidad.

  • 8/8/2019 Didctica de la estatistica

    30/219

    20

    Si en la idea de probabilidad (asignar nmeros a los sucesos aleatorios de modoque sean comparables) incluimos todos los procesos de clculo que llevan a asignarestos nmeros (probabilidad a priori, a posteriori, subjetivas, etc.), habremos incluidotoda la teora de la probabilidad en esta primera idea. No obstante, en el estudio quehemos hecho con anterioridad, vemos que, a pesar de su aparente simplicidad, esta ideano est libre de controversias.

    Actividad 2.11. Se toman 3 fichas de la misma forma y tamao, de las cuales una es roja por

    ambas caras; otra es azul por una cara y roja por la otra, y la tercera es azul por las dos caras.

    El profesor coloca las tres fichas en una caja, que agita convenientemente, antes de seleccionar

    una de las tres fichas, al azar. Muestra, a continuacin, una de las caras de la ficha elegida,

    manteniendo la otra tapada, pidiendo a sus alumnos que adivinen el color de la cara oculta. Una

    vez hechas las apuestas, el profesor muestra la cara oculta. Cada alumno que haya acertado en la

    prediccin efectuada, consigue un punto. Se trata de buscar la mejor estrategia en este juego.

    Qu tipo de razonamiento has dado (o daras) para validar que tu estrategia es la ptima? Es

    igualmente vlido el argumento que se basa en la experimentacin que el basado en

    consideraciones lgicas y combinatorias? Podras probar que tu estrategia es la mejor, slo con

    la experimentacin?

    Actividad 2.12. A partir de las noticias en la prensa del ltimo Domingo, elaborar una lista de

    sucesos que podran ocurrir (o no) durante el mes en curso. Asignar un valor de probabilidad a

    cada uno de estos sucesos. Revisar las probabilidades iniciales, al cabo de una semana, indicando

    las posibles informaciones que han influido en los cambios de asignacin de probabilidades.

    El espacio muestral como conjunto de todas las posibilidades

    No menos fundamental es la idea debida a Kolmogorov de asignar un espaciomuestral de sucesos observables a cada experimento aleatorio y representar los sucesosobservables como subjconjuntos del espacio muestral, dando una interpretacin

    probabilstica a las operaciones con sucesos. Es decir, inventariar todos los posiblesucesos elementales asignados a un experimento, considerarlo como un conjunto dereferencia o universal y aplicar toda la potencia del lgebra de conjuntos para poderdefinir los dems sucesos, a partir de los sucesos elementales

    Esta idea permiti axiomatizar la probabilidad, como medida normada aditiva,sobre el lgebra de conjuntos, puesto que las operaciones en este lgebra de conjuntos

    permitan definir operaciones sobre la misma probabilidad. Puesto que todo sucesoelemental forma parte del conjunto de referencia, se dota de sentido al muestreo, ya queal observar repetidamente una serie de repeticiones del experimento, siempreobservaremos elementos del espacio muestral.

    Por otro lado, si un subconjunto est incluido en un conjunto mayor, laprobabilidad del primero es menor que la del segundo. Esta propiedad permite, desde laescuela elemental realizar actividades de probabilidad comparativa, incluso sincuantificacin.

    El inventariar todos los posibles resultados del experimento tiene, sin embargo, a

    veces dificultades para los nios que no han alcanzado un nivel de razonamientocombinatorio suficiente. La dificultad est en que hay que considerar no slo el sucesoque ha ocurrido realmente o incluso el suceso de inters sino todos los sucesos que

  • 8/8/2019 Didctica de la estatistica

    31/219

  • 8/8/2019 Didctica de la estatistica

    32/219

    22

    un anlisis independiente. Por un lado, mientras que la definicin de independencia desucesos de un mismo experimento se entiende con facilidad cuando se usa la regla de

    producto, es ms complejo de explicar cuando se trata de independencia de sucesos dedistintos experimentos, porque en este caso, tenemos que identificar con claridad queentendemos por la interseccin de los sucesos intervinientes en la frmula del producto.

    Por otro lado, la idea de que un experimento aleatorio se puede repetir en las

    mismas condiciones y que los resultados de cada experimento son independientes es unbuen ejemplo de la diferencia que hay entre entender un modelo terico y saber aplicarloen una situacin concreta. Por un lado, el modelo matemtico de la independencia,expresado por la regla del producto es fcil de entender. Por otro, ocurre que en la vidacotidiana mucha gente, incluso cientficos, no son capaces de aplicar esta ideaconsecuentemente en las situaciones prcticas.

    Actividad 2.14. Monedas dependientes. Una bolsa contiene 7 monedas de 100p, 50p, 50p, 50p,

    10p, 10p, 10p. Sacamos dos monedas al azar. Cul es el valor esperado de su suma? Depende

    este valor esperado de si la primera moneda es o no reemplazada? Por qu?

    Actividad 2.15. Paradoja de Blythe. Tenemos tres ruletas: La primera siempre da como resultado

    el nmero 3. La segunda da como resultado 2 con probabilidad 0.51, 4 con probabilidad 0.29 y 6

    con probabilidad 0.20. La tercera da como resultados 1 con probabilidad 0.52 y 5 con

    probabilidad 0.48. Si cada uno de dos jugadores tiene que elegir una ruleta, y gana el que

    obtenga el nmero mayor, cual es la mejor eleccin para el primer jugador? Cambie esta

    eleccin si son tres los jugadores?

    Equidistribucin y simetra

    Las cuatro primeras ideas fundamentales no dan reglas prcticas de cmo calcularlas probabilidades. Es una idea estratgica descubrir y usar las simetras fsicas o de otrotipo en las situaciones problemticas, para decidir que ninguno de los resultados

    posibles tiene mayor ventaja que el resto y que, por lo tanto, podemos asignarles lamisma probabilidad. Una vez que se acepta esta conclusin, a partir de los axiomas sellega con facilidad al clculo de las probabilidades de los sucesos elementales en losespacios muestrales finitos.

    Por ejemplo, al lanzar un dado, la simetra supone que ninguna cara se distinguede las dems. Esto es tomado como argumento para aceptar la igualdad de probabilidad

    de cada resultados y llegar a la regla de Laplace, que nos permite asignar una probabilidad de 1/6 a cada uno de los resultados posibles. Una vez calculadas estas probabilidades elementales, podremos calcular la probabilidad de sucesos mscomplejos como obtener un nmero par o obtener una suma par al lanzar 2 o 3 dados.

    Hay que recalcar que la equidistribucin (igualdad de probabilidad) de los sucesoselementales de un experimento no puede ser separada de la simetra estadstica, es decir,la simetra confirmada por los registros estadsticos de resultados del experimento. Elque un dado u otro dispositivo generador de resultados aleatorios cumpla lascondiciones de simetra no es un hecho que pueda deducirse de la teora matemtica,

    sino de la experiencia. De hecho, se han establecido algunos principios, como que lasimetra fsica implica la simetra estadstica, aunque este principio es insuficiente,puesto que, aunque el dado est bien construido, podra haber un sesgo en el jugador que

  • 8/8/2019 Didctica de la estatistica

    33/219

    23

    lo lanza. En muchas situaciones, es la hiptesis ms adecuada, pero slo puede sercontrastada a posteriori, por medio de la adecuacin del modelo.

    Parece ser que la idea de simetra es difcil de ensear a los nios, por ste motivoy porque los nios tienen creencias sobre que algunos resultados son ms fciles queotros, a pesar de la simetra fsica. Slo con el trabajo repetido de ejemplos de diversosmateriales simtricos y no simtricos se ir desarrollando esta idea.

    CombinatoriaEl utilizar tcnicas de recuento para calcular el nmero de elementos favorables y

    desfavorables a un suceso y usar estos nmeros para calcular las probabilidades es otraidea fundamental, sobre todo en el clculo de probabilidades complejas. Sin embargo, esdemasiado simple considerar la combinatoria tan slo como auxiliar de la probabilidad,como puede parecer a la vista de su estructura matemtica. La extraccin al azar de unaurna de tres objetos entre cuatro posibles es un experimento aleatorio en tres fases, que

    puede ser interpretado significativamente en el espacio muestral de las variaciones V4,3.

    Adems las operaciones combinatorias pueden definirse, mediante experimentosaleatorios (extraccin con o sin reemplazamiento, ordenada o no ordenada). Estaconexin entre los experimentos compuestos y la combinatoria se clarifica con el uso dediagramas en rbol.

    El diagrama en rbol es una representacin icnica fundamental, porque visualizala estructura multi-paso del experimento compuesto. Por ello, las operacionescombinatorias, ms que ser algoritmos de clculo de probabilidades en espacios

    probabilsticos complejos, proporcionan una interpretacin clara de la estructura interiorde los experimentos y el encadenamiento de sucesivos experimentos en un complejomayor.

    Este punto de vista es soportado por los resultados de psicologa del desarrollo, enparticular por los trabajos de Piaget, quien sostiene que el camino de la comprensin delos fenmenos de azar pasa por el de las operaciones combinatorias bsicas. Adems lasoperaciones combinatorias son un componente fundamental de pensamiento formal queopera mediante combinaciones de las posibilidades que descubre. Finalmente sealamosla presencia de las operaciones combinatorias en las definiciones de las distribucionesde probabilidad discreta, as como en el estudio de los procesos estocsticos discretos.

    Actividad 2.16. Las operaciones combinatorias se pueden definir mediante un modelo de muestreo

    o seleccin. Analizar los tipos diferentes de problemas que podemos tener segn la seleccin sea o

    no ordenada y si se permite el reemplazamiento. Proponer un problema combinatorio de cada

    uno de estos tipos.

    Actividad 2.17. Otros problemas combinatorios se refieren a la colocacin de una serie de n

    objetos en m celdas, como en el tem siguiente:

    Disponemos de tres cartas iguales. Deseamos colocarlas en cuatro sobres de diferentes colores:

    amarillo, blanco, crema y dorado. Si cada sobre slo puede contener, a lo sumo, una carta. De

    cuntas formas podemos colocar las tres cartas en los cuatro sobres diferentes? Ejemplo:

    podemos colocar una carta en el sobre amarillo, otra en el blanco y otra en el crema. Analizar los diferentes tipos de problema que podemos generar en el modelo de colocacin,

    proponiendo ejemplo de enunciados. Es cada problema de colocacin directamente traducible a

  • 8/8/2019 Didctica de la estatistica

    34/219

    24

    un problema de seleccin?

    Actividad 2. 18. Otro tipo de problema combinatorio es el de particin de un conjunto en partes.

    Por ejemplo, De cuantas formas diferentes puede descomponerse el nmero 5 en sumandos?

    Analizar los diferentes tipos de problemas de particin y estudiar su posible equivalente con los

    problemas de seleccin y colocacin.

    Modelos de urnas y simulacinLa palabra clave "simulacin" en estadstica significa algo parecido al

    isomorfismo en otras ramas de las matemticas. Consiste en poner en correspondenciados experimentos aleatorios diferentes. La condicin es que a cada suceso elemental del

    primer experimento le corresponda un suceso elemental del segundo y slo uno, deforma que los sucesos puestos en correspondencia en ambos experimentos seanequiprobables. Un ejemplo sera simular el experimento aleatorio consistente enobservar el sexo de un recin nacido por el experimento aleatorio consistente en lanzar

    una moneda al aire.Lo importante de la simulacin es que podemos operar y observar resultados delsegundo experimento y utilizarlos para obtener informacin del primero. Por ejemplo, siqueremos saber cual es la probabilidad que entre 100 recin nacidos hay ms de un 60%de varones, podemos lanzar, por ejemplo 1000 veces 100 monedas al aire, estudiar encada uno de los 1000 experimentos si hubo o no ms de un 60% de nacimientos yobtener una estimacin para la probabilidad pedida. La ventaja de la simulacin esobvia, incluso en este ejemplo tan sencillo, pues permite condensar el experimento enun tiempo y espacio concreto.

    Otro hecho importante es que, en principio es posible asignar un modelo de urnas

    (el experimento consistente en extraer al azar una bola de una urna con una ciertacomposicin de bolas de colores) a la mayor parte de experimentos aleatorios, al menosa aquellos con espacio muestral numerable. Adems, no slo el experimento original

    pueden componerse para formar nuevos experimentos, sino tambin los modelos deurnas asociados. Esto permite, como ha mostrado Polya, simular procesos aleatorioscomplejos mediante una secuencia de extracciones de bolas en urnas.

    Por otro lado, la idea de la urna es fundamental, ya que en estocstica hay unos pocos conceptos firmemente enraizados que desafan toda definicin rigurosa, como"muestreo al azar", que slo pueden ser descritos concretizndolos en un modelo de

    urnas.

    La variable aleatoriaLa idea de variable aleatoria ha sido responsable de las mltiples aplicaciones

    actuales del clculo de probabilidades, puesto que el clculo de probabilidades pas deocuparse del estudio de la probabilidad de sucesos aislados al estudio de lasdistribuciones de probabilidad (y posteriormente al de los procesos estocsticos). Lavariable aleatoria y su distribucin, as como el estudio de las familias de distribucionesy sus propiedades son una herramienta muy potente, porque permite trabajar con el

    aparato del anlisis matemtico. Hay seria razones que justifican por qu losmatemticos pasados, que no conocan esta idea, tuvieron serios problemas con diversas paradojas matemticas y, por ejemplo, Bernouilli necesitara 20 aos para descubrir y

  • 8/8/2019 Didctica de la estatistica

    35/219

    25

    probar su ley dbil de los grandes nmeros, temas que hoy se explica en unas pocaslneas.

    Desde el punto de vista elemental, manejamos intuitivamente la idea de variablealeatoria cuando nos encontramos con juegos y experimentos en los que usamos dados,monedas, etc. As mismo tenemos experiencias cotidianas con variables aleatoriascontinuas, como el tiempo de espera del autobs, o el necesario para llegar de nuestra

    casa al trabajo. Por el refuerzo de las mltiples, a veces inconscientes, experiencias convariables aleatorias en la vida cotidiana, la intuicin de la magnitud aleatoria y de valoresperado, a veces aparece antes que la de probabilidad.

    Por ejemplo, algunos psiclogos sostienen que la habilidad para estimar laesperanza matemtica de las variables aleatorias es puramente biolgica; mediante laexperiencia llegamos a estimar el tiempo medio que tardaremos en preparar la comida oarreglarnos, lo que gastaremos en promedio al hacer la compra. En un plano formal, laesperanza matemtica se interpreta como la media aritmtica de los valores de unavariable aleatoria, si el experimento se repitiese suficientemente en idntica condiciones.

    En el modelo de variable aleatoria hay tres conceptos bsicos: su distribucin,media y varianza. Mientras que la idea de media (esperanza matemtica) es muyintuitiva, lo es menos la idea de distribucin, especialmente cuando unos valores sonms probables que otros. Para los nios pequeos, todas las variables aleatorias, tienenen principio distribucin uniforme. Esto plantea el dilema de si debera restringirse laenseanza o no a este tipo de variable.

    Sea cual sea la respuesta, no debe negarse el hecho de que la distribucin normaltenga una parte fundamental para explicar el mundo que nos rodea, ya que laencontramos en muchos fenmenos fsicos, psicolgicos o de otro tipo. Un modelomatemtico convincente para explicar la presencia de la distribucin normal en tantos

    fenmenos es el teorema central del lmite que, por otra parte, no es accesible en suforma deductiva en ningn nivel por debajo de la universidad. Esto no excluye que seainteresante con los alumnos de secundaria considerar alguna aproximacin intuitiva yexperimental-inductiva, por ejemplo, usando el aparato de Galton u otro dispositivo desimulacin.

    Las leyes de los grandes nmerosLa convergencia estocstica hace posible el estudio de los fenmenos aleatorios en

    su conjunto, ya que individualmente son impredecibles. Para analizar la dificultad de

    comprensin de la convergencia, hay que distinguir entre las leyes empricas de losgrandes nmeros (la que se observa al recoger datos estadsticos sobre un ciertofenmeno) y las correspondientes leyes matemtica deducidas en forma de teoremas pordiferentes probabilistas y que pueden ser demostradas formalmente.

    La convergencia emprica es observable en la realidad, por ejemplo, al observarlas gotas de lluvia sobre un pavimento, o la proporcin de recin nacidos varones en unhospital a lo largo del ao. Es filosficamente interesante que una regularidad globalsurja de la variabilidad local, que parece inherente al curso de la naturaleza "libertad

    individual bajo restricciones colectivas". Esta convergencia emprica hace que lascorrespondientes leyes matemticas de los grandes nmeros se justifiquen como un buenmodelo para los fenmenos aleatorios, aunque no contesta la pregunta de si es posible

  • 8/8/2019 Didctica de la estatistica

    36/219

    26

    que los alumnos sean capaces de diferenciar entre el modelo y realidad, ya que de hechovemos que con frecuencia se espera una convergencia emprica demasiado rpida odemasiado exacta.

    Las oportunidades didcticas de experiencias empricas sobre la convergenciaseran deseables desde la escuela, para preparar la comprensin posterior de losteoremas matemticos.

    Sin embargo, estas oportunidades son ms restringidas de lo que nos dicen lostextos escolares. Las sucesiones aleatorias obtenidas en clase convergen lentamente y aveces fallan, cuando se precisan para una demostracin, lo que puede sercontraproducente.

    MuestreoLa ltima idea fundamental es la de muestra que nos introduce en la inferencia y

    establece otro nuevo puente entre estadstica y probabilidad. Esta idea es muyimportante porque todo nuestro conocimiento y juicios sobre el mundo o las personas

    estn basado en el muestreo. El conocimiento cientfico se adquiere a partir de lasexperiencias empricas y estas son siempre limitadas, por lo que las conclusiones debenser ms amplia de los datos que obtenemos en las observaciones. La idea de muestratiene en si dos caractersticas contradictorias: representatividad y variabilidad. Larepresentatividad nos indica que la muestra se parece, en cierto modo a la poblacin ydebe ser una caracterstica importante, ya que un prejuicio es slo juicio basado en unamuestra no representativa.

    Por otro lado, la variabilidad indica que una muestra puede ser diferente de otra, por lo que al enjuiciar, pensar e inferir slo es posible a base de muestras, la gentedebera ser cauta y crtica al argumentar. Al igual que un estadstico profesional, todo el

    mundo debiera considerar el muestreo como modelo para explicar la realidad y entenderla naturaleza estadstica de sus conclusiones en cada caso particular, y las consecuenciasde una decisin equivocada.

    2.5. Anlisis exploratorio de datosHasta los comienzos del siglo XX la estadstica se restringa a la estadstica

    descriptiva, que, a pesar de sus limitaciones, hizo grandes aportaciones al desarrollo delas ciencias experimentales. A partir de esa poca, comenzara la inferencia estadsticaclsica, con los trabajos de Fisher, Pearson y sus colaboradores y progresivamente se

    incorporara la aportacin de la escuela bayesiana.Cabri (1994) seala que los avances del clculo de probabilidades llevaron a la

    creacin de la estadstica terica, que en cierto modo, se alej de las ideas estadsticasprimitivas centradas en el anlisis y recogida de datos. De este modo, en los aos 60, lamayor parte de los libros de texto se ocupaban especialmente de los modelosinferenciales clsicos o bayesianos con respecto a conjunto simple de datos y hubo unatendencia a la matematizacin, junto con un descuido en la enseanza de los aspectos

    prcticos del anlisis de datos.Con el desarrollo espectacular de la informtica en la segunda mitad del siglo XX

    y la posibilidad de manejar rpidamente grandes masas de datos, se produjo, por unlado, una reaccin ante tanta matematizacin, y por otro, disminuy la importancia delos estudios muestrales.

  • 8/8/2019 Didctica de la estatistica

    37/219

    27

    Puesto que era fcil analizar grandes muestras ya no haba por qu limitarse a losmtodos estadsticos basados en distribuciones conocidas, cuya principal aplicacin eranlas pequeas muestras. Tampoco haba por qu restringirse a analizar una o unas pocasvariables, porque el tiempo de clculo se haba eliminado y era preferible aprovechartoda la informacin disponible.

    Como consecuencia, durante las ltimas dcadas se han desarrollado una serie de

    tipos de anlisis de datos que se sitan entre la estadstica descriptiva y la inferencia oestadstica terica. Entre estos tipos se encuentran el anlisis exploratorio de datosdesarrollado por Tukey entre 1960 y 1980 y el anlisis multivariante.

    Anlisis exploratorio de datosLas capacidades de clculo y representacin grfica de los ordenadores actuales,

    permiten la obtencin de una amplia variedad de grficos y estadsticos diferentes deuna forma sencilla y han hecho posible la aparicin de una nueva filosofa en losestudios estadsticos: el anlisis exploratorio de datos, introducido por Tukey, quien

    compara la labor del estadstico con la de un detective.Anteriormente a este enfoque, el anlisis de datos se basaba fundamentalmente enel clculo de estadsticos (medias, varianza, coeficientes de correlacin), conduciendo ados consecuencias. En primer lugar se disminua la importancia visual de larepresentacin de los datos, dndosela exclusivamente a los clculos y en segundo se

    pensaba que para obtener conclusiones de los datos era preciso recurrir a la inferencia(modelo confirmatorio).

    En inferencia, el conjunto de valores observados se supone que se ajusta a unmodelo preestablecido; por ejemplo, se supone que los datos se han obtenido de una

    poblacin normal con media y desviacin tpica desconocidas. Debido a que las en

    muchas aplicaciones de la inferencia los datos son difciles de recoger, se trabaja conpequeas muestras y los mtodos estadsticos correspondientes requieren la normalidad.

    Partiendo de esta hiptesis, que es previa a la recogida de datos, se calculan losestadsticos (media y cuasivarianza de la muestra) para aceptar o no la hiptesis. Enrealidad los datos se recogen con el nico propsito de poner tal hiptesis a prueba. Alcontemplar solamente dos alternativas, (confirmacin o no de la hiptesis), los datos nose exploraban para extraer cualquier otra informacin que pueda deducirse de losmismos. Por ejemplo, no tratamos de ver si la distribucin es uniforme o en forma de U.

    Para entender los principios por los que se gua el anlisis exploratorio, se ha de

    tener en cuenta que los datos estn constituidos por dos partes: la regularidad otendencia y las desviaciones o variabilidad. Por regularidad entendemos la estructurasimplificada de un conjunto de observaciones (en una nube de puntos, por ejemplo, es larecta a la cual se ajusta). Las diferencias de los datos con respecto a esta estructura(diferencia en nuestro caso respecto a la recta), representan las desviaciones o residuosde los datos, que usualmente no tienen por qu presentar una estructura determinada.

    Tradicionalmente el estudio se ha concentrado en la bsqueda de un modelo queexprese la regularidad de las observaciones. Por el contrario, el anlisis exploratorio dedatos es bsicamente el desglose de los mismos en las dos partes que hemos citado. En

    lugar de imponer, en hiptesis, un modelo a las observaciones, se genera dicho modelodesde las mismas.

  • 8/8/2019 Didctica de la estatistica

    38/219

    28

    Ejemplo 2.1. Cuando se estudian las relaciones entre dos variables, el investigador no solamente

    necesita ajustar los puntos a una lnea recta, sino que estudia los estadsticos, compara la lnea

    con los residuos, estudia la significacin estadstica del coeficiente de correlacin u otros

    parmetros para descubrir si la relacin entre las variables se debe o no al azar.

    En la Figura 2.1. relacionamos la

    renta per cpita con la esperanzade vida en 97 pases.

    Aunque los estadsticos

    calculados presenten un valor

    estadsticamente significativo (en

    el ejemplo, el coeficiente de

    correlacin sea

    significativamente distinto de

    cero), la relacin entre las

    variables puede no ajustarse bien

    a una lnea recta. En este caso, si no se representasen grficamente los datos al investigador le

    faltara descubrir algo im