86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

Embed Size (px)

Citation preview

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    1/163

    1

    XLStatisticsANLISIS ESTADSTICO CON EXCEL

    La informacin independientemente de lo costosa que haya sido crearla, puede ser replicada ycompartida a un costo mnimo o nulo. -- Thomas Jefferson

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    2/163

    i

    Contenido

    Qu es estadstica? ...................................................................................................................... 1Exactitud y precisin ....................................................................................................................... 1Variables: medicin y clasificacin .................................................................................................. 2

    Variables cualitativas ................................................................................................................ 2Variables cuantitativas ............................................................................................................. 3

    El proceso de investigacin ............................................................................................................. 4Terminologa ................................................................................................................................... 5Prueba de hiptesis: Error tipo I y II ............................................................................................... 12Sugerencias para el anlisis de datos ........................................................................................... 13Estadstica: Software gratuito ........................................................................................................ 13Qu es XLSTatistics? .................................................................................................................. 16Instalacin ..................................................................................................................................... 17Desinstalacin ............................................................................................................................... 17XLStatistics: interfaz grafica y funciones ....................................................................................... 17Otros complementos gratuitos para anlisis estadstico en Excel .................................................. 23Complementos comerciales para Excel ......................................................................................... 23Programas gratuitos y en lnea para anlisis estadstico ............................................................... 24Sitios de inters ............................................................................................................................. 25

    Anlisis de una variable numrica (variable cuantitativa discreta continua) ................................ 28Data and Description: Datos y su descripcin ........................................................................ 29Summaries: Sntesis de datos (Tabla de frecuencia y grficos).............................................. 30

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    3/163

    ii

    Summaries: Tabla de frecuencia y grficos ............................................................................ 39Tests: Intervalo de confianza y prueba de hiptesis para proporciones (N grande) ................ 39

    Anlisis de poder y determinacin de tamao de muestra ...................................................... 40

    Anlisis de error marginal para IC de proporciones ................................................................ 40Intervalo de confianza y prueba de hiptesis para proporciones (muestras pequeas) .......... 40 Prueba de Bondad de ajuste (ji-cuadrado) ............................................................................. 41Prueba de corridas o de WaldWolfowitz ............................................................................... 41

    Anlisis de dos variables numricas (continuas discretas): Correlacin y regresin simple ........ 43Conceptos bsicos sobre regresin lineal simple ................................................................... 44Data and Description: Datos y su descripcin ........................................................................ 45

    Anlisis de correlacin y regresin lineal ................................................................................ 45Prueba de hiptesis (intercepto, pendiente) ........................................................................... 45

    Anlisis de varianza: significancia del modelo ........................................................................ 46Anlisis de residuos: Evaluacin de los supuestos del modelo............................................... 46Intervalo de prediccin y banda de prediccin ........................................................................ 50Herramientas adicionales ....................................................................................................... 50

    Ajuste de funciones ................................................................................................................ 51Transformaciones lineales ...................................................................................................... 51Ecuacin polinomial ............................................................................................................... 51Regresin no lineal ................................................................................................................. 51Cambio de pendiente (tendencia) en el set de datos .............................................................. 52Media mvil ............................................................................................................................ 52Media con barras bandas de error ....................................................................................... 53Regresin lineal localmente ponderada 53

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    4/163

    iii

    Supuestos del ANOVA ........................................................................................................... 69Prueba sobre intercepto en modelo ........................................................................................ 71

    Anlisis de residuos ............................................................................................................... 71

    Anlisis de varianza no paramtrico de 1 va (Kruskal-Wallis) ................................................ 72Prueba de Hartley (comparacin de varianzas) ...................................................................... 72

    Anlisis de varianza de una va en lnea con StatGraphics .................................................... 73Comparacin de dos grupos (2 muestras independientes) ..................................................... 79Prueba F de igualdad de varianzas (Nio Vs Nia) ................................................................ 79

    Anlisis de residuos ............................................................................................................... 80Anlisis de poder de la prueba t ............................................................................................. 81Anlisis de poder marginal de la prueba t ............................................................................... 81Prueba de Mann-Witney (diferencia entre medianas de 2 muestras independientes) ............. 81 Prueba de hiptesis entre dos medias utilizando el mtodo de aleatorizacin........................ 82Prueba de hiptesis entre dos medianas utilizando el mtodo de aleatorizacin .................... 82Ejercicio ................................................................................................................................. 84

    Anlisis de dos variables nominales (variables cualitativas) .......................................................... 85Datos y estadsticos descriptivos ............................................................................................ 85Tabla y grafico de frecuencia ................................................................................................. 86Prueba de Ji-cuadrado (de Pearson): Prueba de independencia............................................ 86Chi Square for R by C Table .................................................................................................. 87Prueba de diferencia entre dos proporciones (muestras grandes) .......................................... 87

    Anlisis de poder de la prueba (diferencia entre dos proporciones) ....................................... 88Anlisis de poder marginal de la prueba (diferencia entre dos proporciones) ......................... 88Diferencia entre dos proporciones (muestras pequeas) 88

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    5/163

    iv

    Anlisis de residuos ............................................................................................................. 102Estadsticos descriptivos por variable ................................................................................... 103Grfico de medias ................................................................................................................ 104

    Ajuste de funciones .............................................................................................................. 104Suavizado ............................................................................................................................ 104Grfico de media para grupos .............................................................................................. 105Regresin localmente ponderada ......................................................................................... 105

    Anlisis de tres o ms variables numricas ................................................................................. 106Datos .................................................................................................................................... 1071: Estadsticos y grafica por variable .................................................................................... 107Estadsticos descriptivos por variable ................................................................................... 107Resumen grafico por variable ............................................................................................... 1072: Anlisis de correlacin y regresin lineal .......................................................................... 108Matriz de correlacin grfica ................................................................................................ 108Matriz de correlacin lineal (Coef. Pearson) ......................................................................... 109Diagrama de dispersin multivariable ................................................................................... 109Regresin lineal multiple ...................................................................................................... 109

    Anlisis de residuos ............................................................................................................. 110Correccin por correlacin serial (resago 1) ......................................................................... 111

    Anlisis de varianza (significancia de modelo de regresin) ................................................. 112Comparacin de modelos ..................................................................................................... 113Prediccin o estimacin........................................................................................................ 113Mediciones repetidas ........................................................................................................... 114Regresin no lineal 115

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    6/163

    v

    Anexo 3: Prueba de hiptesis: una muestra, dos muestras, tres o ms muestras ....................... 129Anexo 4: Eleccin de una prueba estadstica .............................................................................. 138Anexo 5: Comparacin de paquetes estadsticos ........................................................................ 144

    Anexo 6: Software gratuito .......................................................................................................... 156

    Visite http://smestorage.com/users/jfallas56 para descargar otros documentos sobreGeotecnologas, ambiente y recursos naturales.

    http://smestorage.com/users/jfallas56http://smestorage.com/users/jfallas56
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    7/163

    1

    Qu es estadstica?La estadstica es el arte-ciencia de tomar decisiones ante situaciones concretas y a la luz de

    informacin o datos parciales. En otras palabras, es tomar decisiones bajo condiciones deincertidumbre. La estadstica naci en las sociedades antiguas para resolver un problema muyconcreto: colectar datos y crear informacin sobre aspectos tales como produccin, poblacin, eimpuestos; elementos esenciales para gobernar una nacin o un imperio. Este primer aspecto de laestadstica todava persiste y es lo que se conoce como estadstica descriptiva.

    Desde el punto de vista de su aplicacin a trabajos cientfico-matemticos, la estadstica se originalrededor de 1925 con la publicacin de Fisher "Mtodos estadsticos para investigadores". Estapublicacin marc el inicio de la estadstica inferencial. Gracias a esta publicacin y a posteriorestrabajos de otros cientficos la estadstica juega un papel esencial en las ciencias naturales y socialesdonde las leyes de causa y efecto no pueden deducirse a partir de observaciones individuales.

    Formalmente, la estadstica puede definirse como una ciencia con un componente terico y otroaplicado que consiste en crear, desarrollar, y aplicar tcnicas o instrumentos que nos permitan evaluarel grado de incertidumbre o error de nuestras generalizaciones. Por ejemplo, si deseamos conocer eldimetro medio a la altura del pecho (dap) de una plantacin de roble de 10 hectreas, ubicada en SanJos de la Montaa, debemos decidir acerca del tamao de la muestra y el mtodo de seleccin; y una

    vez colectados los datos hay que seleccionar los estadsticos y tablas a utilizar para generalizar losresultados a la plantacin (inferencia). Finalmente, debemos indicar el grado de confiabilidad denuestros resultados o en otras palabras que tan seguros estamos de nuestra estimacin.

    No existe ninguna medida perfecta y por tanto, todas las mediciones contienen algn grado deerror; de donde se desprende que para extraer la informacin de las mediciones es necesario analizarlos errores. Los errores se agrupan en dos grandes categoras: el sesgo o error sistemtico que puedemodelarse utilizando una ecuacin que describe las mediciones, lo que permite eliminar o reducirsignificativamente su efecto; y el ruido o error aleatorio, el cual no se puede modelar, pero cuyaspropiedades estadsticas se pueden utilizar para optimizar los resultados del anlisis.

    Exactitud y precisinComo se mencion previamente toda medicin tiene un error; sin embargo con frecuencia se

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    8/163

    2

    Figura 1: Conceptos de exactitud y precisin. Observe que una medicin puede tener una altaprecisin y un bajo sesgo o error; sin embargo tambin puede tener una alta precisin y un alto sesgoo error. Lo deseable es una alta precisin y un error mnimo.

    Variables: medicin y clasificacinPara utilizar la estadstica (descriptiva e inferencial) el investigador(a) debe medir la variable que

    desea analizar. La medicin es el procedimiento utilizado para asignar valores a la variable de talforma que satisfaga las condiciones necesarias para su posterior anlisis. La Real Academia Espaola(http://www.rae.es/rae.html ) define el verbo medir como comparar una cantidad con su respectivaunidad, con el fin de averiguar cuntas veces la segunda est contenida en la primera . La escala demedicin es el contexto o marco de referencia bajo el cual se realizan las mediciones; todo medicin

    pertenece a una de las siguientes cuatro escalas: nomina l , ordinal , in tervalo y razn. Para decidircul prueba estadstica puede aplicarse a un set de datos es necesario conocer su escala de medicin(Error! No se encuentra el origen de la referencia.). A su vez, las variables pueden agruparsen cualitativas y cuantitativas.

    http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.html
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    9/163

    3

    Sin embargo, el valor numrico no indica la precedencia de un tipo de vegetacin sobre el siguiente;por ejemplo, el bosque hmedo no es mayor que el bosque seco.

    Escala ordinalEn el nivel de medicin ordinal las variables se miden de acuerdo a su tamao, valor relativo u

    orden natural. Esta escala de medicin no permite determinar la magnitud de la desigualdad entrecategoras contiguas. Por ejemplo, las especies forestales de Costa Rica pueden clasificarse deacuerdo a la densidad de su madera en muy pesadas, pesadas, livianas y muy livianas; sin embargoesta clasificacin no indica cunto ms densa es la madera de la primera clase comparada con lasegunda o la ltima. Las variables numricas o cuantitativas puedes expresarse como variableordinales utilizando cuantiles, percentiles u otro criterio definido por el usuario(a). Por ejemplo, losdatos de la variable densidad de la madera pueden dividirse en 5 catego ras utilizando quintiles y deesta manera saber cunto ms densa o menos densa es una madera de una categora con respecto acualquier otra.

    La escala de actitud de Likert es un caso especial de una escala de medicin ordinal que confrecuencia es analizada como una variable cuantitativa. La escala, formada por cinco clases ocategoras, fue diseada con el fin de que las valoraciones sigan una progresin aritmtica como semuestra a continuacin:

    Cuadro 1: Escala de actitud de Likert.

    Valores de la escala Valores de la escala Valores de la escala-2 Totalmente en desacuerdo 5 Totalmente en desacuerdo A Totalmente en desacuerdo-1 En desacuerdo 4 En desacuerdo B En desacuerdo0 Indiferente, indeciso oneutro

    3 Indiferente, indeciso oneutro

    C Indiferente, indeciso oneutro

    1 De acuerdo 2 De acuerdo D De acuerdo2 Totalmente de acuerdo 1 Totalmente de acuerdo E Totalmente de acuerdo

    Observe que a diferencia de las variables numricas o cuantitativas, en la cual los nmeros tienenun orden natural en la escala de Likert los nmeros o letras asignados a cada categora son solo

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    10/163

    4

    El cociente de una razn para observaciones a un nivel de medicin de intervalo no tienen sentido oexplicacin lgica. Por ejemplo, una temperatura de 30oC no es dos veces ms caliente que una de

    15

    o

    C, en tanto que un rbol de 30 metros s es dos veces ms alto que uno de 15 metros. En amboscasos, el cociente es 2 (30/15=2); sin embargo el cero (0) en la escala de grados centgrados es ficticioo sea un punto arbitrario en tanto que en la escala lineal es verdadero. Cualquier operacinmatemtica puede utilizarse e interpretarse en observaciones a un nivel de medicin de razn. Paraobservaciones a un nivel de intervalo slo tienen sentido la suma, la resta y la multiplicacin (cuadro2).

    Cuadro 2: Escalas de medicin y operaciones matemticas que las caracterizan.

    Escala de medicin Operaciones matemticas permitidasRazn 1. Equivalencia (=)

    2. Desigualdad ()3. Razn de dos intervalos tiene sentido. (a_b/c_d= e)4. Razn de dos valores tiene sentido ( a/b= c)

    Intervalo 1. Equivalencia (=)2. Desigualdad ()3. Razn de dos intervalos tiene sentido. (a_b/c_d =e)

    Ordinal 1. Equivalencia (=)2. Desigualdad ()Nominal 1. Equivalencia (=)

    Variables circularesLas variables circulares son un tipo especial de variables cuantitativas que representan ciclos. En

    estas variables, el valor ms grande y el ms pequeo se encuentra uno al lado del otro y el puntocero es arbitrario. Algunos ejemplos de variables circulares son: hora del da (0-24), meses del ao(enero a diciembre) y la direccin de la brjula (0o-360o). Si se utiliza solo parte del ciclo, una variablecircular se convierte en una variable lineal. Por ejemplo, cuando usted utiliza la variable tiempo y lamide como el nmero das entre dos eventos.

    Si su variable es realmente circular (e g distancia y direccin de vuelo de las aves) existen pruebas

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    11/163

    5

    someter a prueba sus hiptesis. En el proceso de investigacin se pueden reconocer los siguienteselementos (ver figura 2):

    A. Mundo real: La real que se estudia.B. Preguntas. Lo que deseamos responder mediante el proceso de investigacin. Involucra la

    revisin de estudios previos (revisin del estado del conocimiento). Formulacin de preguntas ehiptesis de trabajo.

    C. Poblaciones/muestras/variables : Transformacin del mundo real en elementos estadsticos quepuedan ser medidos.

    D. Medicin: Proceso e instrumentos utilizados para recabar datos del objeto de inters.E. Anlisis de datos: Mtodos y procedimientos utilizados para transformar los datos en

    informacin. Someter a prueba hiptesis (diseo experimental/Observacional).A. Decisin: Posicin del investigador(ara) frente a los resultados de su estudio y reformulacin de

    hiptesis.B. Aplicacin: Accin sobre el mundo real

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    12/163

    6

    Variables externas responden a la pregunta "Cules variables no consideradas en el anlisispueden mediar en el efecto de la variable independiente en la variable dependiente? "

    Dado que la mayora de las variables presentan algn grado de correlacin es preferible utilizar lostrminos variable respuestay variable explicativa.

    Mediciones repetidas: Las mediciones repetidas se obtienen en un grupo de sujetos o muestras que semiden antes y despus de aplicar un tratamiento (e.g. se mide variable respuesta en el sujeto antesde un tratamiento y luego despus de aplicar el tratamiento). Por lo tanto, cada sujeto o muestra actacomo su propio control y por esta razn las dos mediciones no son independientes.

    Los grupos son establecidos por el emparejamiento de sujetos o muestras utilizando comoreferencia algn tipo de relacin natural entre los sujetos o muestras de cada par. Por ejemplo, lascompetencias de cada trabajador en el rea social podran compararse con las de su padre/madre.Cada persona podra ser emparejada con su padre/madre en este diseo y debido a esta relacinnatural, las mediciones no son independientes.

    Un diseo emparejado de participantes se emplea cuando los participantes se emparejan basadosen resultados similares en una prueba previa. Una persona de cada pareja es asignada al grupo

    experimental (por ejemplo, el grupo que recibi algn tratamiento) y el otro es asignado al grupocontrol (que no recibe el tratamiento). El objetivo del diseo es controlar por diferencias en losindividuaos. Por ejemplo, podramos querer controlar la variable inteligencia en la evaluacin de losefectos de una droga sobre la memoria. En primer lugar, se podra medir el IQ de los participantes yluego compararlas en base a su ndice de inteligencia antes de asignar aleatoriamente a uno a ladroga y el otro a la condicin sin la droga.

    Poblacin: Es el total o universo al cual se desea aplicar la inferencia o conclusin del estudio.

    Muestra: Es una parte o porcin de la realidad bajo estudio.

    Deduccin: A partir del todo (poblacin) se deriva una afirmacin que aplica a una condicin particular(muestra).

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    13/163

    7

    Variable respuesta: Es aquella propiedad o cualidad de la unidad experimental que se mide. Para

    mayor detalle sobre el tema ver pg.6.Repeticin: Rplica estadsticamente independiente de un tratamiento. Cuando el tratamiento esaplicado a varias unidades experimentales independientes; cada aplicacin brinda una estimacinindependiente de la respuesta del sujeto experimental al tratamiento. Cuantas ms rplicas se tengamejor ser la estimacin del error experimental. En la mayora de los casos se recomienda un mnimode tres observaciones independientes por tratamiento. La seudo replicacin es el resultado demuestrear dos o ms veces la misma condicin (muestras no independientes). Por ejemplo, al evaluarla densidad de peces en dos ros; uno contaminado y otro no, si se muestrean 5 sitios al azar en cada

    uno de ellos, dichas muestras no representan rplicas ya que se est muestreando el mismo ro. En elsentido estadstico para que se consideren rplicas debera de elegirse al azar dos o ms ros porcondicin (contaminado-no contaminado) y luego obtener muestras independientes de cada uno deellos. Esto permitira estimar la variabilidad natural de cada uno de los sistemas acuticos en loscuales viven los peces que se muestrean. Aun cuando el anlisis de los datos presupone la existenciade rplicas independientes, en la mayora de los estudios en el rea de recursos naturales no esposible cumplir con este supuesto.

    Cuasi o seudo experimento: Estudio en el cual se utilizan los principios propuestos por Fisher para eldiseo de experimentos; sin embargo, por diversas razones prcticas, no es posible asignar lostratamientos en forma aleatoria. Este tipo de estudios es comn en el rea de ecologa y en general enestudios de tipo observacional.

    Significancia estadstica: Esta es una regla que permite afirmar que la diferencia observada entre doso ms tratamientos es el resultado del efecto del tratamiento y no del azar. Con frecuencia se declarancomo significativas aquellas diferencias que tienen una probabilidad inferior a 0.05 (o sea 5%) deocurrir en forma aleatoria. En algunos textos de estadstica se recomienda utilizar un asterisco (*) para

    designar las diferencias significativas a un 5% (P

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    14/163

    8

    La accin y el efecto de separar un todo en los elementos que lo componen con el objeto de estudiarsu naturaleza, funcin o significado (http://es.wiktionary.org/wiki/ ).

    La accin y el efecto de identificar, distinguir y clasificar diferentes aspectos integrantes de un campode estudio, examinando qu relaciones guardan entre ellos y como quedara modificado el conjunto sise eliminara o se aadiera algn aspecto a los previamente identificados (http://es.wiktionary.org/wiki/ ).

    Documento que revisa, separa o hace un resumen de los elementos o principios de un tema o de unaobra (http://es.wiktionary.org/wiki/ ).

    Distincin y separacin de las partes de un todo hasta llegar a conocer sus principios o elementos

    (http://www.rae.es/rae.html ).

    CienciaConocimiento estructurado y sistemtico de las cosas por sus principios y causas; Conjunto deconocimientos que constituyen una rama del saber humano (http://es.wiktionary.org/wiki/ ).

    Conjunto de conocimientos obtenidos mediante la observacin y el razonamiento, sistemticamenteestructurados y de los que se deducen principios y leyes generales (http://www.rae.es/rae.html ).

    ConocerSaber de la existencia de una cosa (http://es.wiktionary.org/wiki/ ).

    Averiguar por el ejercicio de las facultades intelectuales la naturaleza, cualidades y relaciones de lascosas (http://www.rae.es/rae.html ).

    ConocimientoResultado de la accin de conocer. Comprensin, entendimiento, inteligencia, razn

    (http://es.wiktionary.org/wiki/ )

    Accin y efecto de conocer; entendimiento, inteligencia, razn natural ello (http://www.rae.es/rae.html ).

    http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    15/163

    9

    Una conviccin es una creencia de la que un cierto individuo opina que dispone de suficiente evidenciapara considerarla cierta. La diferencia entre una simple creencia y una conviccin, es que en el primer

    caso el individuo puede no tener evidencia suficiente para justificar su veracidad, mientras que en elsegundo el individuo si la considera probada, con independencia de que exista evidencia cientfica ointersubjetiva incontrovertible de que dicha conviccin es verdadera (http://es.wikipedia.org/wiki/Saber).

    Idea religiosa, tica o poltica a la que se est fuertemente adherido.(http://www.rae.es/rae.html ).

    CreenciaAlgo en lo que se cree, confianza en que algo existe o que es cierto.

    (http://es.wiktionary.org/wiki/ ).

    Una creencia es una proposicin o conjunto de ellas, que un cierto individuo considera ciertas, peropara la que en general no existe evidencia intersubjetiva suficiente para considerarla conocimientopropiamente dicho. Una creencia puede ser acertada o equivocada. Sin embargo, aunque en el usocontidiano al oponer "creencia" y "conocimiento", el primero se usa frecuentemente con el sentido deproposiciones que alguien considera ciertas, pero de la que existe evidencia de estar equivocadas oser indemostrables(http://es.wikipedia.org/wiki/Saber).

    Firme asentimiento y conformidad con algo; completo crdito que se presta a un hecho o noticia comoseguros o ciertos; religin, doctrina (http://www.rae.es/rae.html ).

    CriterioNorma para conocer la verdad (http://www.rae.es/rae.html ).Juicio o discernimiento (http://www.rae.es/rae.html ).

    Evaluar

    Sealar el valor de algo (http://www.rae.es/rae.html ).Estimar, apreciar, calcular el valor de algo (http://www.rae.es/rae.html ).Estimar los conocimientos, aptitudes y rendimiento de los alumno (http://www.rae.es/rae.html ).

    http://es.wikipedia.org/wiki/Saberhttp://es.wikipedia.org/wiki/Saberhttp://es.wikipedia.org/wiki/Saberhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wikipedia.org/wiki/Saberhttp://es.wikipedia.org/wiki/Saberhttp://es.wikipedia.org/wiki/Saberhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wikipedia.org/wiki/Saberhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wikipedia.org/wiki/Saber
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    16/163

    10

    InformacinComunicacin o adquisicin de conocimientos que permiten ampliar o precisar los que se poseen

    sobre una materia determinada (http://www.rae.es/rae.html).Conocimientos as comunicados o adquiridos (http://www.rae.es/rae.html ).

    La informacin es un fenmeno que proporciona significado o sentido a las cosas. En sentido general,la informacin es un conjunto organizado de datos procesados, que constituyen un mensaje sobre undeterminado ente o fenmeno. Los datos se perciben, se integran y generan la informacin necesariapara producir el conocimiento que es el que finalmente permite tomar decisiones para realizar lasacciones cotidianas que aseguran la existencia. La sabidura consiste en determinar correctamente

    cundo, cmo, dnde y con qu objetivo emplear el conocimiento adquirido(http://es.wikipedia.org/wiki/Informaci%C3%B3n ).

    HerramientaObjeto o aparato, normalmente artificial, que se emplea para facilitar o posibilitar un trabajo, ampliandolas capacidades naturales del cuerpo humano. Sinnimos: instrumento, utensilio

    Principales caractersticas de la informacinSignificado (semntica)Importancia (relativa al receptor)Vigencia (en la dimensin espacio-tiempo)Validez (relativa al emisor)Valor (activo intangible voltil)Polimorfismo

    http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wikipedia.org/wiki/Informaci%C3%B3nhttp://es.wikipedia.org/wiki/Informaci%C3%B3nhttp://es.wikipedia.org/wiki/Informaci%C3%B3nhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wikipedia.org/wiki/Informaci%C3%B3nhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.html
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    17/163

    11

    PercepcinLa percepcin es la funcin psquica que permite al organismo, a travs de los sentidos, recibir,

    elaborar e interpretar la informacin proveniente de su entorno(http://es.wikipedia.org/wiki/Percepci%C3%B3n ).

    Accin y efecto de percibir (http://www.rae.es/rae.html).Sensacin interior que resulta de una impresin material hecha en nuestros sentidos.(http://www.rae.es/rae.html ).

    Conocimiento, idea (http://www.rae.es/rae.html ).

    ProcedimientoEl o un procedimiento es el modo de ejecutar determinadas acciones que suelen realizarse de lamisma forma, con una serie comn de pasos claramente definidos, que permiten realizar unaocupacin o trabajo correctamente. (http://es.wiktionary.org/wiki/ )

    Mtodo de ejecutar algunas cosas (http://www.rae.es/rae.html ).

    Saber

    Conjunto de conocimientos, adquiridos mediante el estudio o la experiencia, sobre alguna materia,ciencia o arte. Sinnimo: sabidura, erudicin (http://es.wiktionary.org/wiki/ ).

    Conocer algo, o tener noticia o conocimiento de ello (http://www.rae.es/rae.html )

    SabiduraConocimiento de las ciencias y artes (http://es.wiktionary.org/wiki/ ).

    Prudencia en la forma de actuar (http://es.wiktionary.org/wiki/ ).

    Grado ms alto del conocimiento; conducta prudente en la vida o en los negocios; conocimientoprofundo en ciencias, letras o artes (http://www.rae.es/rae.html ).

    http://es.wikipedia.org/wiki/Percepci%C3%B3nhttp://es.wikipedia.org/wiki/Percepci%C3%B3nhttp://es.wikipedia.org/wiki/Percepci%C3%B3nhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://es.wiktionary.org/wiki/http://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://www.rae.es/rae.htmlhttp://es.wikipedia.org/wiki/Percepci%C3%B3n
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    18/163

    12

    condiciones. Las teoras adems permiten ser ampliadas a partir de sus propias predicciones, eincluso ser corregidas, mediante ciertas reglas o razonamientos, siendo capaces de explicar otros

    posibles hechos diferentes de los hechos de partida de la teora.(http://es.wikipedia.org/wiki/Teor%C3%ADa )

    En ciencia, se llama teora tambin a un modelo para el entendimiento de un conjunto de hechosempricos. Enfsica,el trmino teora generalmente significa una infraestructura matemtica derivadade un pequeo conjunto de principios bsicos capaz de producir predicciones experimentales para unacategora dada de sistemas fsicos. Un ejemplo sera la "teora electromagntica", que eshabitualmente tomada como sinnimo del electromagnetismo clsico, cuyos resultados especficospueden derivarse de lasecuaciones de Maxwell.

    Prueba de hiptesis: Error tipo I y IIEl nivel de significancia se designa con la letra griega e indica cuan rara (muy grande o muy

    pequea) deber ser la diferencia entre la media maestral y la media poblacional para rechazar lahiptesis nula dado que sta sea correcta. En trabajos estadsticos es usual rechazar la hiptesisnula si dicha diferencia tiene una probabilidad de ocurrencia por factores aleatorios inferior o igual al5% ( < 0.05). El valor de es un indicador del riesgo que el investigador(a) est dispuesto a asumircuando evala Ho. Por ejemplo, para un de 0.05 y aun cuando Ho sea verdadera, se espera que la

    misma sea rechazada en un 5% de las veces que se ejecute el experimento. O sea, que en 5 de cada100 experimentos Ho ser rechazada an cuando sea verdadera. A este tipo de error se le denominaerror tipo I. Por otro lado, el no rechazar Ho cuando en realidad debe rechazarse se denomina errortipo II. Es comn observar en reportes cientficos valores de entre 0.1 y 0.001; al primero se ledenomina diferencia significativa y al ltimo diferencia altamente significativa.

    Cuando se rechaza Ho se utiliza el trmino "significante" o estadsticamente significativo" y el resultadopuede interpretarse en el sentido de "haber aprendido algo nuevo sobre la poblacin". Por otro lado, eltrmino "no significativo" expresa el sentir de no haber aportado nuevo conocimiento de la poblacin

    en estudio. Al realizar una prueba de hiptesis recuerde que muestras muy grandes tienden a rechazarHo aunque las diferencias entre grupos sean muy pequeas. De igual manera, pruebas estadsticascon un gran poder tienden a generar mayor nmero de resultados significativos (pueden detectardiferencias muy pequeas como estadsticamente significativas)

    http://es.wikipedia.org/wiki/Teor%C3%ADahttp://es.wikipedia.org/wiki/Teor%C3%ADahttp://es.wikipedia.org/wiki/Teor%C3%ADahttp://es.wikipedia.org/wiki/Cienciahttp://es.wikipedia.org/wiki/Cienciahttp://es.wikipedia.org/w/index.php?title=Modelo_%28abstracto%29&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Modelo_%28abstracto%29&action=edit&redlink=1http://es.wikipedia.org/wiki/F%C3%ADsicahttp://es.wikipedia.org/wiki/F%C3%ADsicahttp://es.wikipedia.org/wiki/F%C3%ADsicahttp://es.wikipedia.org/wiki/Electromagnetismohttp://es.wikipedia.org/wiki/Electromagnetismohttp://es.wikipedia.org/w/index.php?title=Teor%C3%ADa_cl%C3%A1sica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Teor%C3%ADa_cl%C3%A1sica&action=edit&redlink=1http://es.wikipedia.org/wiki/Ecuaciones_de_Maxwellhttp://es.wikipedia.org/wiki/Ecuaciones_de_Maxwellhttp://es.wikipedia.org/wiki/Ecuaciones_de_Maxwellhttp://es.wikipedia.org/wiki/Ecuaciones_de_Maxwellhttp://es.wikipedia.org/w/index.php?title=Teor%C3%ADa_cl%C3%A1sica&action=edit&redlink=1http://es.wikipedia.org/wiki/Electromagnetismohttp://es.wikipedia.org/wiki/F%C3%ADsicahttp://es.wikipedia.org/w/index.php?title=Modelo_%28abstracto%29&action=edit&redlink=1http://es.wikipedia.org/wiki/Cienciahttp://es.wikipedia.org/wiki/Teor%C3%ADa
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    19/163

    13

    Steiger, J.H., & Fouladi, R.T. 1997. Noncentrality interval estimation and the evaluation of statistical

    models. Pp. 221-257. In Harlow, L. L., Mulaik, S. A., & Steiger, J. H. (Eds.) What if there were nosignificance tests? Mahwah, NJ: Lawrence Erlbaum Associates. Disponible en:http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF

    Sugerencias para el anlisis de datos

    1. Listar variable(s) a analizar y su respectivo nivel de medicin (nominal, ordinal, intervalo,razn).

    2. Cul es el historial y contexto de los datos (origen, mtodos de colecta, instrumentos

    utilizados, temporalidad, limitaciones)?3. Para qu realiza usted el anlisis del set de datos? Qu se desea resaltar del set de datos?4. Describa el producto esperado o solicitado (e.g. descripcin del set de datos, prueba de una

    hiptesis, comparacin de datos, ajustar un modelo).5. Seleccione el software a utilizar (e.g. Instat, XLSTatistics, PASS, otro) y realice un anlisis

    exploratorio de datos.a. Anlisis grficob. Elaboracin de tablas

    c. Estadsticos descriptivos6. Busque valores atpicos o extremos que podran indicar errores en la digitacin de los datos ydistribuciones asimtricas o inusuales. Concuerda la distribucin de los datos con lo que ustedesperaba?.

    7. Estadstica inferencial. Selecciones las pruebas estadsticas a realizar, defina el valor designificancia a utilizar en las pruebas estadsticas.

    8. Conclusiones9. Retroalimentacin

    Estadstica: Software gratuitoSi usted desea explorar otros programas estadsticos gratuitos, le recomiendo visitar los siguientes

    sitios.

    http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDFhttp://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDFhttp://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    20/163

    14

    tamao de la muestra y clculos de potencia, nmeros aleatorios, sensibilidad, especificidad y otrasestadsticas de evaluacin, tablas FxC, chi-cuadrados para dosis-respuesta, y enlaces a otros sitios de

    inters. Este software est orientado al anlisis de datos epidemiolgicos.OpenSTat Anlisis estadstico para Windows. Estadstica descriptiva e inferencial paramtrica y noparamtrica.http://statpages.org/miller/openstat/

    PASTAnlisis estadstico univariado, multivariado, ndices de diversidad. Estadstica descriptiva einferencial paramtrica y no paramtrica.

    PSPP. Este es un programa para el anlisis estadstico, su funcionalidad es similar al programa

    comercial SPSShttp://www.jdmp.org/misc/related-software/

    RemuestreoSofware para anlisis estimacin y pruebas de hiptesis utilizando remuestreo.

    The R Project for Statistical Computing. Gran variedad de anlisis, muy poderoso pero requiere deusuarios experimentados. Opera en base a comandos.

    WinIDAMS.Este es paquete de software para la validacin, tratamiento y anlisis estadstico de datos

    desarrollado por la Secretara de la UNESCO en cooperacin con expertos de varios pases.http://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.html

    Referencias

    Bryan F.J. Manly. Randomization, Bootstrap and Monte Carlo Methods in Biology, Third Edition.Chapman and Hall/CRC. 388p. 2006.

    Bryan F.J. Manly. Statistics for Environmental Science and Management, Second Edition.Chapman &

    Hall/CRC. 292p. 2008.

    Cox Nicholas J. Stata Users Meeting London June 2004. Circular statistics in Stata, revisited.Department of Geography, University of Durham, Durham City, DH1 3LE, UK

    http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/http://folk.uio.no/ohammer/past/http://folk.uio.no/ohammer/past/http://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://www.uvm.edu/~dhowell/StatPages/Resampling/Resampling.htmlhttp://www.uvm.edu/~dhowell/StatPages/Resampling/Resampling.htmlhttp://www.r-project.org/http://www.r-project.org/http://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://portal.unesco.org/ci/en/ev.php-URL_ID=2070&URL_DO=DO_TOPIC&URL_SECTION=201.htmlhttp://www.r-project.org/http://www.uvm.edu/~dhowell/StatPages/Resampling/Resampling.htmlhttp://www.jdmp.org/misc/related-software/http://www.jdmp.org/misc/related-software/http://folk.uio.no/ohammer/past/http://statpages.org/miller/openstat/http://statpages.org/miller/openstat/
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    21/163

    15

    Stata Users Meeting London June 2004. Circular statistics in Stata, revisited. Nicholas J. CoxDepartment of Geography, University of Durham, Durham City, DH1 3LE, UK. 4p.

    Wonnacott, Thomas H. y Ronald J. Wonnacott.. Introductory statistics. Third Edition. New York, JohnWilley & Sons. 650p. 1977.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    22/163

    16

    Qu es XLSTatistics?XLSTatistics es un conjunto de 82 libros de Excel creados por el profesor Rodney Carr de la

    Universidad Deakin, Australia (http://www.deakin.edu.au/~rodneyc/XLStatistics ). XLSTatistics opera enMicrosoft Excel 97, 2000, 2002, 2003(XP) y 2007.

    Citar XLSTatistics de la siguiente manera:

    Carr, R., 2009, XLStatistics 09.09.24, XLent Works, Australia. Disponible en:http://www.deakin.edu.au/~rodneyc/XLStatistics [email protected]

    La pestaa de options le permite configurar las principales opciones de XLSTatistics.

    mailto:[email protected]://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticsmailto:[email protected]:[email protected]:[email protected]:[email protected]://www.deakin.edu.au/~rodneyc/XLStatisticshttp://www.deakin.edu.au/~rodneyc/XLStatisticsmailto:[email protected]
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    23/163

    17

    InstalacinDescargue el archivoXLS5.zip(5 Megas).http://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.zip

    Cree un directorio denominado Xlstats y descomprima el contenido del archivo XLS5.zip.Para cargar XLStatistics abra el fichero XLStatistics.xlam (Excel 2007) o XLStats.xls

    (Excel 5-2003). Le sugiero crear un acceso directo en su escritorio para dicho archivo.

    Guardar sus resultados. No guardar directamente el libro de trabajo de XLStatistics! Si desea copiarlos resultados de su anlisis a otra hoja de Excel, Word, o Powerpoint simplemente seleccione el reao grafico deseado cpielo y pguelo en el archivo receptor. Si lo desea tambin puede guardar el librode trabajo con otro nombre y con la opcin de macros habilitada.

    DesinstalacinXLStatistics no modifica la configuracin del sistema ni la de Excel y por tanto no requiere de

    desinstalacin. Para desactivar XLStatistics haga un clic sobre .

    XLStatistics: interfaz grafica y funciones

    En Excel 2007 los libros de trabajo se organizan mediante una cinta utilizando como criterio elnmero y tipo de variable que usted analizar:

    1Num: Anlisis de una variable numrica (variable cuantitativa discreta continua).1Cat: Anlisis de una variable nominal (variable cualitativa).

    2N A li i d d i bl i ( ti di t ) C l i i i l

    http://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.ziphttp://www.deakin.edu.au/~rodneyc/XLStatistics/XLS5.zip
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    24/163

    18

    A continuacin se lista, para cada libro de trabajo, el anlisis estadstico que usted puede realizar.

    Variable Anlisis estadstico

    Una variable numrica(datos de una muestrasimple) 1Num

    La variable puede sercuantitativa continuo

    discreta.

    Sntesis numrica y grfica Estadstica descriptiva (tendencia central, variabilidad y forma). Histograma, polgono de frecuencia simple y acumulada,

    diagrama de cajas o de Box-Whisker, grfico de mediaaritmtica y desviacin estndar, error estndar o intervalo deconfianza.

    Pruebas estadsticas Prueba t para (media) Intervalo de confianza para (media) Prueba de signos e intervalo de confianza para la mediana Prueba de Chi2para la varianza Grfico de residuos Anlisis de poder y tamao de muestra Prueba de normalidad

    Una variable Cualitativa1Cat

    Sntesis numrica y grfica Tabla de frecuencia y proporciones, diagramas de barras,

    grfico de pastel o circular., Histograma con barras de errorpara proporciones.

    Pruebas estadsticas Pruebas de proporciones para muestras grandes y pequeas Intervalo de confianza para proporciones Anlisis de poder y tamao de muestra Prueba de bondad de ajuste/Prueba de corridas

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    25/163

    19

    Dos variablesnumricas

    2Num

    Estadsticos descriptivos por variable, grfico de dispersin

    Anlisis de correlacin y regresin lineal, con o sin trmino constante Estimacin de parmetros del modelo (a y b) Intervalos de confianza para a y b, prueba de hiptesis

    sobre la significancia de los a los parmetros Grfico de dispersin con lnea de regresin Anlisis de varianza Anlisis de residuos Prediccin y prediccin inversa Bandas de prediccin y de estimacin

    Ajuste de una funcin definida por el usuario(a) Funciones linealizables (mtodo mnimos cuadrados) Ecuaciones polinomiales Regresin no lineal (mtodo mnimos cuadrados) Regresin lineal por mnimos cuadrados para detectar un punto

    de inflexin en la tendencia de la serie

    Ajuste de una curva de suavizado a los datos

    Media mvil (media o mediana) Medias para datos agrupados con barras / bandas de error Regresin lineal localmente ponderada - LOWESS

    Anlisis de correlacin entre variables ordinales rho de Spearman tau-b de Kendall

    Aadir etiquetas a los puntos en un grfico de dispersinAnlisis de series de tiempo

    Media mvil Ajuste ecuacin exponencial

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    26/163

    20

    Una variable numrica,una variable cualitativa

    1Num1Cat

    Sntesis numrica y grfica Estadsticos descriptivos (tendencia central, variabilidad, forma)

    Grfico de de frecuencia (absoluta, relativa, proporciones),histogramas, lneas, barras Grfico de de frecuencia por categora Grficos de caja (Box-y-Whisker) Grficos de medias con barras de error

    Pruebas estadsticas Anlisis de la varianza simple o de una va (efectos aleatorios y

    fijos) Prueba de intercepto del modelo Prueba de Kruskal-Wallis Anlisis de residuos Prueba de Hartley (comparacin de varianzas) Prueba t para dos muestras e intervalo de confianza para la

    diferencia entre medias Prueba de Mann-Whitney Prueba F de igualdad de varianzas Anlisis de la poder y tamao de muestra Prueba de aleatorizacin para la media de dos grupos

    Dos variablescualitativas2Cat

    Cuadros sinpticos Frecuencia (absoluta, relativa), proporciones, % por fila o

    columna, total Grficos de proporciones y porciento con barras de error (error

    estndar, Intervalo de Confianza)

    Pruebas estadsticas Prueba de Chi2(independencia entre grupos) Prueba sobre diferencia entre dos proporciones para muestras

    pequeas

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    27/163

    21

    Dos variablesnumricas, una variable

    cualitativa2Num1Cat

    Grficos de dispersin multiseries con ejes y/o direccin permutable.

    Grficos multilnea / multieje

    Regresin lineal (anlisis de covarianza) Varias opciones de anlisis (con o sin trmino constante) Diagrama de dispersin con lneas de regresin Grficos de pendientes e interceptos con barras de error Pruebas de hiptesis

    Ajuste de una funcin definida por el usuario(a) (grupo por grupo) Funciones linealizables con regresin lineal por mnimos

    cuadrados Ecuaciones polinomiales Regresin no lineal por mnimos cuadrados Regresin lineal por mnimos cuadrados para detectar un punto

    de inflexin en la tendencia de la serie

    Ajuste de curva de suavizado a los datos (grupo por grupo) Media mvil (media o mediana) Medias de grupo de datos con barras / bandas de error Regresin localmente ponderadaLOWESS

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    28/163

    22

    n Variables numricas(regresin mltiple)

    nNum

    Sntesis numrico y grfico por variable Histogramas y diagramas combinados por frecuencia

    Grficos mltiples de cajas (Boxplots) Grficos de medias Estadstica descriptiva

    Correlacin y regresin simple (2 variables) Diagrama de dispersin y matriz de correlacin Regresin lineal de dos variables, estadsticos y pruebas de

    hiptesis Grficos multilneas y multiejes

    Regresin mltiple Ecuacin de regresin, estadsticos y pruebas de hiptesis Prediccin Anlisis de residuos

    Grficos de residuos Prueba de Jarque-Bera para normalidad Prueba de Ramsey para evaluar omisin de trmino en el

    modelo Prueba de Durbin-Watson para correlacin de residuos

    Correcciones para la correlacin serial de orden uno(Cochran-Orcutt)

    Prueba de Glejser para heterocedasticidad (varianzasdiferentes)

    Anlisis de varianza y comparacin de modelos

    Anlisis de mediciones repetidas

    Grfico de caso-por-caso Grficos de medias Grficos mltiples (boxplots) Anlisis de varianza

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    29/163

    23

    La interfaz grafica de cada libro de Excel es prcticamente estndar, lo cual facilita su uso. Alinterior de cada libro usted puede utilizar las funciones y herramientas de Excel (e.g. fuentes: tamao,color, itlico, negrita; colores en grficos; copiar y pegar tablas y grficos a otros programas de Office;guardar libros de Excel con macros habilitados.

    El (Ia) usuario(a) solo tiene que digitar, copiar y/o pegar los datos en las columnas de Data de unlibro de trabajo y el resto se hace automticamente: Sntesis numrica y grfica; anlisis estadstico(e.g. pruebas de hiptesis, intervalos de confianza, pruebas de poder, determinacin de tamao demuestra, ajustar modelos de regresin, etc.). Su tarea fundamental es decidir qu prueba deborealizar? o cmo expreso grficamente los datos?.

    Nota: Usted SOLO debe modificar el contenido de las celdas con nmeros o textos en color azul.

    Otros complementos gratuitos para anlisis estadstico en Excel

    Regresin y diseo de experimentos: otro complemento gratuito para ExcelEssential Regression and Experimental Design for Chemists and Engineerses un complemento

    gratuito para Excel que permite ajustar modelos de regresin simple, mltiple (seleccin hacia adelantey hacia atrs) y polinomiales, as como disear plantillas para experimentos.

    (http://www.jowerner.homepage.t-online.de/ERPref.html ).

    Regresin localmente ponderada (LOESS) http://peltiertech.com/WordPress/loess-utility-for-excel/ http://peltiertech.com/WordPress/loess-utility-awesome-update/

    Complementos comerciales para Excel

    Analizar-se

    Este es un complemento para Excel que permite realizar anlisis exploratorio de datos, calculo deestadsticos descriptivos, ajustar modelos de regresin (simples y mltiples, polinomiales) y realizarpruebas de hiptesis paramtricas y no paramtricas (http://www.analyse-it.com).

    http://www.jowerner.homepage.t-online.de/ERPref.htmlhttp://www.jowerner.homepage.t-online.de/ERPref.htmlhttp://www.jowerner.homepage.t-online.de/ERPref.htmlhttp://peltiertech.com/WordPress/loess-utility-for-excel/http://peltiertech.com/WordPress/loess-utility-for-excel/http://peltiertech.com/WordPress/loess-utility-awesome-update/http://peltiertech.com/WordPress/loess-utility-awesome-update/http://www.analyse-it.com/http://www.analyse-it.com/http://www.analyse-it.com/http://www.analyse-it.com/http://peltiertech.com/WordPress/loess-utility-awesome-update/http://peltiertech.com/WordPress/loess-utility-for-excel/http://www.jowerner.homepage.t-online.de/ERPref.html
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    30/163

    24

    XLMinerXLMiner es un conjunto de herramientas para minera de datos conformado tanto por mtodos

    estadsticos como de aprendizaje automatizado (disciplina cientfica que disea y desarrolla algoritmosque le permiten a las computadoras discernir comportamientos basados en datos empricos). Elprograma parte de la premisa que un mismo set de datos debe analizarse utilizando diferentesenfoques para luego elegir el modelo que mejor se adapte a los datos. Entre las funciones delprograma estn: particin del set de datos, diversos mtodos de clasificacin y prediccin, anlisis deafinidad, anlisis de series de tiempo y exploracin y reduccin del set de datos. Para mayores detallessobre la funcionalidad del programa visitar:http://www.resample.com/xlminer/capabilities.html

    Programas gratuitos y en lnea para anlisis estadstico

    Anlisis de regresin simple y mltiple, logstica, particin recursiva (clasificacin y arboles dedecisin)

    Distribuciones estadsticas Pruebas de hiptesis (medias, error tipo II y tamao de muestra) Anlisis de series de tiempo

    STATGRAPHICS Onlinehttp://www.statgraphicsonline.com/index.html Usted puede digitar los datos, leer datos de varios tipos de archivos (incluyendo Excel), copiar y

    pegar los conjuntos de datos de otras aplicaciones, o analizar los set de datos de StatPoint. El accesoen lnea es gratuito para sets de datos de hasta 100 filas (observaciones) por 10 columnas (variables).Para utilizar el programa debe registrarse (es gratuito).

    VassarStats: Website for Statistical Computationhttp://faculty.vassar.edu/lowry/VassarStats.html

    Clinical Research Calculators(Calculators 1-3. For prevalence, sensitivity, specificity, predictivevalues, likelihood ratios, etc.,Kaplan-Meier Survival Probability Estimates,Kappa as a Measure ofConcordance in Categorical Sorting,Chi-Square, Cramer's V, and Lambda for a Rows by ColumnsContingency Table McNemar's Test for Correlated Proportions in the Marginals of a 2x2 Contingency

    http://www.resample.com/xlminer/capabilities.htmlhttp://www.resample.com/xlminer/capabilities.htmlhttp://www.statgraphicsonline.com/index.htmlhttp://www.statgraphicsonline.com/index.htmlhttp://www.statgraphicsonline.com/index.htmlhttp://faculty.vassar.edu/lowry/VassarStats.htmlhttp://faculty.vassar.edu/lowry/VassarStats.htmlhttp://faculty.vassar.edu/lowry/VassarStats.htmlhttp://faculty.vassar.edu/lowry/VassarStats.htmlhttp://www.statgraphicsonline.com/index.htmlhttp://www.resample.com/xlminer/capabilities.html
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    31/163

    25

    McNemar's Test for Correlated Proportions in the Marginals of a 2x2 Contingency Table, Fisher ExactProbability Test for Tables Larger than 2x2, Chi-Square, Cramer's V, and Lambda for a Rows byColumns Contingency Table, Log-Linear Analysis for a 3-Way Contingency Table, Kappa as aMeasure of Concordance in Categorical Sorting

    Proportions (The Confidence Interval of a Proportion, The Confidence Interval for the DifferenceBetween Two Independent Proportions, Significance of the Difference Between Two IndependentProportions, McNemar's Test for Correlated Proportions in the Marginals of a 2x2 Contingency Table)

    Ordinal Data (Rank-Order Correlation, Mann-Whitney Test,Wilcoxon Signed-Ranks Test, Kruskal-Wallis Test, Friedman Test)

    Correlation & Regression (Basic Linear Correlation & Regression, Matrix of Intercorrelations,Multiple Regression,0.95 and 0.99 Confidence Intervals for r, Estimating the Population Value of rho onthe Basis of Several Observed Sample Values of r, Test for the Heterogeneity of Several Values ofr,The Significance of an Observed Value of r, Significance of the Difference Between Two IndependentValues of r, Significance of the Difference Between an Observed Value of r and a Hypothetical Value ofrho, First- and Second-Order Partial Correlations, Phi Coefficient of Association, Point BiserialCoefficient, Correlation for Unordered Pairs: Eta2, Intraclass Correlation, & Resampling of r, SimpleLogistic Regression)

    t-Tests & Procedures (t-Tests for the Significance of the Difference Between the Means of TwoSamples (independent or correlated), Single Sample t-Test,0.95 Confidence Interval for the EstimatedMean of a Population)

    ANOVA (One-Way ANOVA for Independent or Correlated Samples, Two-Way Factorial ANOVA forIndependent Samples, Two-Factor ANOVA with Repeated Measures on One Factor, Two-Factor

    ANOVA with Repeated Measures on Both Factors,2x2x2 ANOVA for Independent Samples,

    Orthogonal Latin Square Designs for n=j2

    )

    ANCOVA (One-Way ANCOVA for Independent Samples, Two-Way Factorial ANCOVA forIndependent Samples)

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    32/163

    26

    Citar como:(Versin electrnica): StatSoft, Inc. (2010). Libro de texto electrnico de Estadstica. Tulsa, OK:StatSoft. WEB: http://www.statsoft.com/textbook/.

    (Versin impresa): Hill, T. & Lewicki, P. (2007). ESTADSTICAS Mtodos y Aplicaciones. StatSoft,Tulsa, OK

    En este sitio usted puede encontrar otros programas en lnea para el anlisis de datoshttp://www.psychnet-uk.com/experimental_design/online_calculators.htm

    Descripcin y anlisis grafico de datos

    http://www.statsoft.com/textbook/http://www.psychnet-uk.com/experimental_design/online_calculators.htmhttp://www.psychnet-uk.com/experimental_design/online_calculators.htmhttp://www.psychnet-uk.com/experimental_design/online_calculators.htmhttp://www.statsoft.com/textbook/
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    33/163

    27

    Temas tratados en el libro digital.http://www.statsoft.com/textbook/

    http://www.statsoft.com/textbook/http://www.statsoft.com/textbook/
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    34/163

    28

    Anlisis de una variable numrica (variable cuantitativa discreta continua)En la presente seccin se ilustra el uso de XLSTatistics para el anlisis de una variable numrica.

    Algunos ejemplos de variables cuantitativas son: peso, volumen, precipitacin, temperatura, biomasa,conteos (e.g. numero de arboles en una parcela, numero de animales por aparto). En el men graficode XLStatisitics corresponde a 1Num.

    Para iniciar la sesin haga un doble clic sobre el archivo XLStatistics.xlam si usted utiliza Excel2007 o sobre XLStats.xls si usted utiliza Excel 2000 y habilite los MACROS.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    35/163

    29

    4) Tests: Pruebas estadsticas5) Extra Tools: Herramientas adicionales

    Nota: Usted SOLO debe modificar el contenido de las celdas con nmeros o textos en color azul.

    Data and Description: Datos y su descripcin

    Data (Datos): Variable que se analiza,en este caso precipitacin anual (mm)

    Description (Describir):Estadsticos descriptivos (nmero deobservaciones, media, desviacinestndar, Coef. Variacin, asimetra,mnimo, primer cuartil, mediana, tercercuartil, mximo).

    Grafico de frecuencia (barras histograma). Usted puede elegir

    nmero de clases, lmite inferior ysuperior de la serie estadstica.

    Grafico de datos individuales.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    36/163

    30

    Nota: si desea observar los valores graficados por el programa, seleccione con el puntero del ratn lagrfica y observe a la derecha de la hoja de clculo las celdas seleccionadas. Ahora seleccione dichas

    celdas y asgneles un color al texto (color de la fuente) .

    Summaries : Sntesis de datos (Tabla de frecuencia y grficos)

    Grfico de frecuencia(barras, histograma lnea). Usted puede elegir lmite inferiory superior de la serie estadstica,decimales, nmero de clases, ttulo deleje X (punto final de clase, punto mediode clase, intervalo). Tambin puede crearuna OJIVA (Grfico de frecuenciaacumulada).

    Grfico de media aritmtica: Si lo deseapuede modificar el ttulo del eje vertical.Puede adicionar al grfico de barra el

    rango, desviacin estndar, errorestndar e intervalo de confianza.Recuerde que usted puede elegir el nivelde confianza.

    Grfico de cajas (Box-Whisker). Ustedpuede elegir el grfico vertical o

    horizontal. Si lo desea puede adicionar unttulo al eje X de la grfica.

    Haga un clic sobre la flecha azul para

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    37/163

    31

    lluvia y en un ao determinado se presenta un huracn, la lluvia de dicho ao debe considerarse comoun evento de otra poblacin estadstica.

    Tests: Pruebas estadsticasPrueba t para una muestra(requisitos muestra independiente y normalidad)

    Anlisis de Residuos

    Pruebas estadsticas sobre la media deuna poblacin (Prueba t de Estudiante).Puede realizar pruebas de una y doscolas (superior e inferior). Recuerde queusted debe fijar el nivel de alfa antes de

    realizar la prueba.

    El ejemplo ilustra la siguiente prueba dehiptesis:Ho: = 3000mHa: 3000mPara un alfa de 0.05, Ho deberechazarse y por tanto la media esdiferente de 3000 mm.

    Calculo de Intervalo de Confianza parala media para un nivel de confianza de95%. Observe que el valor 3000 mm seencuentra fuera del IC.

    Anlisis de residuosEl anlisis de residuos permite probar por el

    supuesto de normalidad del set de datos.

    Para datos normales, los residuos debenajustarse a una recta y el histograma debe

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    38/163

    32

    Nota: si desea observar los valores graficados por el programa, seleccione con el puntero del ratn lagrfica y observe a la derecha de la hoja de clculo las celdas seleccionadas. Ahora seleccione dichas

    celdas y asgneles un color al texto (color de la fuente) . A continuacin se muestran los datospara la grfica de probabilidad normal para los residuos y para el histograma de residuos.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    39/163

    33

    Prueba de Normalidad

    Recuerde que usted debe fijar el nivel de alfa antes de realizar cualquier prueba estadstica.

    Anlisis de poder y determinacin de tamao de muestra

    Al realizar cualquier prueba de hiptesis, su decisin est sujeta a dos errores estadsticos:el error tipo I y el error tipo II. A continuacin se describe cada uno de ellos.

    Tabla de decisin estadstica para una prueba de hiptesis sobre dos grupos.

    Hiptesis Verdad o estado de la realidadHo (no existe diferenciaentre los dos grupos)

    HI (existe diferencia entre los dosgrupos)

    No se rechaza Ho

    (Decisin correcta)

    No se rechaza Ho (Decisin

    incorrecta) y por tanto no sedetectan diferencias verdaderas. Aeste error se le denomina error tipoII y se representa con la letra

    Esta prueba se utiliza para determinar si

    los datos de la muestra provienen de unadistribucin normal.

    La hiptesis nula es la que la muestraproviene de una poblacin normal, lahiptesis alternativa es que la muestraproviene de una poblacin no normal.

    El valor de p (nivel de significancia o alfa)permite evaluar Ho. En este caso y paraun alfa de 0.05, no se rechaza Ho porqueP= 0.903.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    40/163

    34

    significativos (pueden detectar diferencias muy pequeas como estadsticamente significativas).Recuerde que una diferencia estadsticamente significativa no necesariamente es una diferenciaimportante para la toma de decisiones.

    Steiger, J.H., & Fouladi, R.T. 1997. Noncentrality interval estimation and the evaluation of statisticalmodels. Pp. 221-257. In Harlow, L. L., Mulaik, S. A., & Steiger, J. H. (Eds.). What if there were nosignificance tests? Mahwah, NJ: Lawrence Erlbaum Associates. Disponible en:http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF

    Cul es el error tipo II de la prueba?

    Es el poder de la prueba alto o bajo?Cul es la implicacin prctica del anlisis de poder?

    Esta hoja de trabajo lepermite realizar unanlisis de poder de laprueba t para unamedia obtenida de unamuestra independiente.

    Recuerde que ustedpuede modificar los

    nmeros en color azul.

    http://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDFhttp://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDFhttp://www.statpower.net/Steiger%20Biblio/Steiger&Fouladi97.PDF
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    41/163

    35

    Pruebas no paramtricas

    Mediana(Prueba de signos, prueba del signo)

    Prueba de Wilcoxon para muestras pareadasPrueba de Chi-2 para la varianza

    Prueba de signos (prueba de mediana)

    Prueba de Chi-2 para la varianza

    Prueba sobre la Mediana (prueba designos). Esta prueba no paramtrica

    utiliza la distribucin binomial paradeterminar si el nmero de datos sobre ybajo la mediana es el mismo.

    Describa la prueba de hiptesis.

    Cul es el poder de la prueba?

    Prueba de varianza (Ji-cuadrado). Usted puede comparar la varianzab d l d t i d ( U t d d l

    La prueba de Wilcoxon de los rangos con signo permite compararnuestros datos con una mediana terica (por ejemplo un valor publicado en un artculo).Tambin se utiliza en muestras pareadas para mediciones repetidas en el mismo sujeto omuestra. Esta prueba es el anlogo no paramtrico de la tde Estudiante y no requiere quela diferencia entre los pares de observaciones sigan una distribucin normal.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    42/163

    36

    Intervalos de tolerancia y de prediccin

    Herramientas adicionales

    Datos agrupados1NumGD.xls

    Este libro de clculo (1NumGD.xls) le permite analizar datos agrupados (calcularestadsticos descriptivos, graficar datos y realizar una prueba t de Estudiante sobre la media).

    Datos

    Intervalo de tolerancia para una confianza de 95% y unacobertura de 99%.

    Intervalo de prediccin para una confianza de 95%.

    Recuerde que usted puede modificar los nmeros en color azul.

    Si desea utilizar este libropuede digitar los siguientes

    datos en su libro de Excel.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    43/163

    37

    Grfico de probabilidad normal

    Bajo el supuesto de distribucinnormal la tendencia de los datosdebe ajustarse a una recta.

    Si los datos provienen de unadistribucin lognormal la tendenciade los logaritmos de los datos ( logPt anual) debe ajustarse a unarecta.

    Usted puede elegir entre graficardesviaciones estandarizadas(valores de Z) una frecuenciaacumulada.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    44/163

    38

    Anlisis de una variable cualitativa (nominal-ordinal)

    En la presente seccin se ilustra el uso de XLSTatistics para el anlisis de una variable cualitativa(nominal ordinal). Algunos ejemplos de variables cualitativas son: uso-cobertura de la tierra (e.g.bosque, pasto, urbano), sexo (masculino, femenino), color (e.g. azul, rojo, blanco) y cultivos (eg. maz,arroz, frijol, yuca), escala de Likert (. En el men grafico de XLStatisitics corresponde a 1Cat.

    1. Abra el archivo xlstats_tutorial.xlsx y seleccione de la hoja de clculo 1Catla variable ENOS.

    2. Haga un clic sobre XLStatistics y luego otro clic sobre . Observe que el programa abre ellibro de trabajo 1Cat.xlsy copia los datos seleccionados a dicho libro.

    En la seccin inferior de la hoja de clculo 1Cat.xlsusted observar cuatro hojas de clculo:

    1) Information: Informacin. Esta hoja contiene informacin general sobre la organizacin de estelibro de trabajo.

    2) Data and Description: Datos y estadsticos descriptivos3) Summaries: Sntesis de datos (Tabla de frecuencia y grficos)4) Tests: Pruebas estadsticas

    Nota: Esta seccin del tutorial asume que usted ya activ el complemento de XLStatisticis(XLStatistics.xlam XLStats.xls); de no ser as, ver pgina 23.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    45/163

    39

    Summaries : Tabla de frecuencia y grficos

    Tests: Intervalo de confianza y prueba de hiptesis para proporciones (N grande)

    Grfico de frecuencia (barras). Ustedpuede elegir nmero de decimales, tipode frecuencia (absoluta, porciento,proporcin). Puede adicionar al grficode barra 1 Error estndar, 2 Erroresestndares, o un intervalo de confianza.Recuerde que usted puede elegir elnivel de confianza.

    Grfico de pastel: Si lo desea puedemodificar el ttulo del eje vertical.Para series estadsticas con tres o mscategoras ordenar las frecuencias demayor a menor.

    Inferencia sobre proporciones (muestrasgrandes-al menos 5 observaciones por celda),valor de p basado en aproximacin a ladistribucin normal).

    1. Prueba de hiptesis2. Intervalo de confianza3. Anlisis de poder y determinacin de tamao

    de muestra

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    46/163

    40

    Anlisis de poder y determinacin de tamao de muestra

    Anlisis de error marginal para IC de proporciones

    I t l d fi b d hi t i i ( t )

    Esta hoja de trabajo le permiterealizar un anlisis de poder de laprueba Z para proporciones.

    Recuerde que usted puede modificarlos nmeros en color azul.

    Esta hoja de trabajo le permiterealizar un anlisis de error marginalpara el intervalo de confianza parauna proporcin.

    Recuerde que usted puede modificarlos nmeros en color azul.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    47/163

    41

    Prueba de Bondad de ajuste (ji-cuadrado)

    Prueba de corridas o de WaldWolfowitz

    (http://www.quantitativeskills.com/sisa/statistics/ordhlp.htm )

    Esta prueba es aplicada a un set de datos conformado por una secuencia de dos valores(e.g. "+++++++++++++") y se utiliza para probar por la aleatoriedad en la secuenciadel set de datos (la hiptesis nula es que los elementos de la secuencia son independientes entre s) .

    A continuacin se ilustra el resultado para el anlisis de la frecuencia de aos lluviosos (mayorque la media) Vs aos secos (menores que la media) para la precipitacin anual de laestacin Moravia de Chirrip.

    El programa estima la proporcinobservada para las variables y usteddebe digitar la proporcin esperada oterica. En este caso se desea probarque la proporcin entre aos Nio(0.333), Nia (0.333) y Neutro (0.333)es la misma.

    Para un alfa de 0.05, cul es el

    resultado de la prueba de hiptesis?

    Los resultados indican que existen 22 secuencias de

    seco-lluvioso (o lluvioso-seco) y que para un set dedatos aleatorio dado el tamao de muestra (41 aos) seesperaran 24.95 secuencias.

    http://www.quantitativeskills.com/sisa/statistics/ordhlp.htmhttp://www.quantitativeskills.com/sisa/statistics/ordhlp.htmhttp://www.quantitativeskills.com/sisa/statistics/ordhlp.htmhttp://www.quantitativeskills.com/sisa/statistics/ordhlp.htm
  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    48/163

    42

    A. B.

    A. Secuencia de aos clasificados como secos (1) y lluviosos (2)B. Pt anual expresado como un valor estandarizado (anomala estandarizada basado

    en el periodo 1960-2007).

    Observe que a partir de 1996 existe una mayor frecuencia de aos lluviosos; sin embargoa partir de 2006 parece que se inicia otro ciclo de menor precipitacin.

    A. Anomalas estandarizadas basado en el periodo 1960-1990.

    B. Anomalas estandarizadas basado en el periodo 1960-1980.

    La anomala estandarizada es: (Pt ao-Pt media)/desviacin estndar

    Observe que a partir de 1996 existe una mayor frecuencia de aos lluviosos; sinembargo a partir de 2006 parece que se inicia otro ciclo de menor precipitacin.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    49/163

    43

    Anlisis de dos variables numricas (continuas discretas): Correlacin yregresin simple

    En la presente seccin se ilustra el uso de XLSTatistics para el anlisis de dos variablescuantitativas. En el men grafico de XLStatisitics corresponde a 2Num.

    A continuacin analizaremos los datos de las variables ao y precipitacin anual. A esta serie se leconoce como una serie temporal porque involucra a la variable tiempo (aos).

    1. Abra el archivo xlstats_tutorial.xlsx y seleccione de la hoja de clculo 2Numlas variables Ao

    (variable predictora) y Moravia Pt. anual (mm) (variable dependiente).2. Haga un clic sobre XLStatistics y luego otro clic sobre . Observe que el programa abre el

    libro de trabajo 2Num.xlsy copia los datos seleccionados a dicho libro.

    Nota: Esta seccin del tutorial asume que usted ya activ el complemento de XLStatisticis(XLStatistics.xlam XLStats.xls); de no ser as, ver pgina 23.

    Nota: Dado que las dos variables son cuantitativas, XLStatistics ofrece herramientas pararealizar un anlisis de correlacin y regresin simple. En Excel la primera columnacorresponde al eje Y y la segunda al Eje X.

    En este caso deseamos analizar el comportamiento de la lluvia anual en el tiempo y por tantola variable Y es PT anual y la variable X el tiempo.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    50/163

    44

    Conceptos bsicos sobre regresin lineal simple

    La ecuacin de regresin de Y en X muestra el valor medio esperado de Y dado un valor deX. La variable Y se denomina dependientey la variable Xpredictora. Una distribucin condicionales la distribucin de una variable (Y) dado un valor particular de otra variable (X). Por ejemplo, dado unbosque, la distribucin condicional de la variable altura (h) dada un valor particular de la variabledimetro (d) mostrara todos los posibles valores de altura para cada uno de los valores de dimetro.Dicha relacin se simboliza como h|d. Dado que no es posible conocer todas las posiblesdistribuciones condiciones de h dada cada uno de los posibles valores de d; se asume que elmuestreo independiente realizado de las variables h y d representa dicha relacin. Bajo estasuposicin y asumiendo que la distribucin de hes normal para cada valor de d, la mejor estimacinde hdado dsera la media de la distribucin como se muestra en la figura 1.

    Figura 1: Distribucin hipottica de la variable altura (h) en metros para un valor de dimetro de 40cm. La distribucin de valores de altura es normal con una media de 22.78 m y un error deestimacin es 4.25 m.

    Ahora supongamos que existen otros valores de altura y dimetro como se muestra en la figura 2.La ecuacin de regresin ajusta una recta a travs de las cimas de cada una de las distribucioes de

    h|d. Sin embargo, observe que el ajuste no es perfecto, o sea existe un error de estimacin; dicho errorse utiliza para calcular los intervalos de confianza y realizar las pruebas de hiptesis sobre la validezestadstica del modelo. Cuanto ms pequeo sea dicho error mayor capacidad predictiva y descriptivatendr el modelo

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    51/163

    45

    Data and Description: Datos y su descripcin

    Anlisis de correlacin y regresin lineal

    Data: Listado de datosTwo-variable: Anlisis de correlacin(r) y coeficiente de determinacin (R2).

    Single variable: Estadsticosdescriptivos para las variables Y y X.

    Scatterplot: Grfico de dispersin

    Anlisis de correlacin1. Coeficiente de correlacin lineal

    2. Prueba de hiptesis sobre rho.Para un alfa 0.05 se rechaza Ho?____

    Regresin lineal simple

    1. Estimadores (intercepto y pendiente),error estndar e intervalos de confianza.2. Coef. determinacin (R2).3. Error estndar de estimacin (Syx) =CME.4. Diagrama de dispersin.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    52/163

    46

    Anlisis de varianza: significancia del modelo

    La hiptesis nula es que no existe regresin de Y en X; o sea no existecovariacin entre Y y X.

    A un nivel de significancia de 0.05, la regresin de precipitacin en tiempo es estadsticamentesignificativa (p=0.044).

    Anlisis de residuos: Evaluacin de los supuestos del modelo

    Los supuestos del anlisis de regresin son las siguientes:

    1- Modeloa. El modelo es completo. La ecuacin posee todos las variables requeridas para describir la

    relacin entre Y y X. Ejemplo: Y=a+bX+e.No existe ninguna prueba estadstica que le indiquedirectamente si el modelo posee todas las variables requeridas para describir la relacin entreY y X. Le sugiero utilizar sus conocimientos tericos (e.g. publicaciones previas, consulta conexpertos, colegas, etc.) para evaluar este criterio.

    b. Lineal. La relacin entre las variables X y Y es lineal. Principio de linealidad de la regresin.

    c. Aditivo. La relacin entre las variables es aditiva. Este supuesto es especialmente crtico enregresiones mltiples (dos o ms variables predictoras); ya que el efecto de una variablepuede estar afectado por otra variable. Por ejemplo, el efecto de la fertilizacin en elcrecimiento de un bosque segundario puede depender del uso previo del sitio de la

    Tabla de anlisis de varianza

    DF: Grados de libertadSS: Suma de cuadradosMS: Cuadrado medioF: valor de F

    p-value: valor de p corresponde al valor de F enla distribucin F.

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    53/163

    47

    3- Error del modeloa. Distribucin normal. Las pruebas estadsticas dependen de este supuesto; sin embargo la

    inferencia estadstica puede se robusta aun cuando se viole este supuesto. Graficar residuos

    y evaluar su distribucin, realizar prueba de hiptesis para normalidad.b. Su valor esperado es 0. Graficar residuos y evaluar su distribucin alrededor de cero.c. Los errores son independientes entre s. La inferencia estadstica asume que cada caso u

    observacin es independiente de la otra. Por ejemplo, la medicin de lluvia diaria en el mes deoctubre no es independiente, ya que es probable que los das lluviosos no ocurran al azar.

    d. Homocedasticidad de los errores (varianzas son constantes) con respecto a la variablepredictora. La no homogeneidad de la varianza sesga la estimacin del error estndar y por

    ende la significancia estadstica. Si sus datos no cumplen con este supuesto puede utilizaruna matriz ponderada. (e.g. 1/X). La ecuacin original Y=a+bX+e se convierte enY/X=a/X+b+e/X. En este nuevo modelo el error para los valores grandes de X ser mspequeo (e/X). Para ajusta esta nueva regresin, usted debe crear la variable Y/X (su nuevavariable dependiente) y 1/X (su nueva variable predictora). Para este nuevo modelo, el valordel intercepto (a) ser ahora la pendiente y el valor de la pendiente (b) ser la interseccin dela nueva ecuacin.

    La no independencia entre las observaciones sesga la estimacin del error estndar, yaque la frmula asume que las observaciones son independiente (n muestras

    independientes). Si las observaciones estn correlacionadas, el valor de n utilizado esms grande que el real y por tanto el error estndar estimado ser ms pequeo y laspruebas estadsticas tendrn una mejor significancia (se tender a rechazar Ho). Estotambin puede sesgar las estimaciones de la intercepcin y la pendiente del modelo. Lano linealidad es un caso especial de los errores correlacionados.

    Observe que la dispersin de los puntoses mayor conforme aumenta el valor de

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    54/163

    48

    B. Eficientes: Estima el parmetro de inters con el menor error posible. Ejemplo: el errorestndar de estimacin ser un mnimo.

    C. Consistentes: Conforme el tamao de muestra aumenta el error del estimador tiende a cero.

    Si alguno de estos supuestos es violado, entonces las estimaciones de los parmetros del modelo,las predicciones, las pruebas de hiptesis, los intervalos de confianza y la relacin entre las variablesindicada por el modelo de regresin puede ser, en el mejor de los casos, ineficiente o peor aun, estargravemente sesgadas o ser engaosas. Normalmente los residuos se utilizan para probar por lossiguientes supuestos del modelo:

    Supuesto PruebaLa relacin entre lasvariables X y Y eslineal

    Diagrama de dispersin, grfico de valores observados Vs valoresestimados, grfico de residuos Vs valores estimados ((. ).En caso de violar este supuesto debe utilizar un modelo linealizable nolineal, transformar las variables utilizar variables de clasificacin (dividir delset de datos en segmentos lineales).

    Los errores sonindependientes

    Para series temporales graficar errores vs tiempo. Para otros datos utilizar elgrfico de autocorrelacin de residuos de resago 1. Es deseable que lamayora de las autocorrelaciones residuales estn dentro de las bandas deconfianza del 95% en torno a cero, las cuales se encuentranaproximadamente a 2/(n)0.5, donde nes el tamao de la muestra. As, siel tamao de la muestra es de 48, las autocorrelaciones debe estar entre +/-0,29. Ponga especial atencin a las autocorrelaciones significativas deresago uno y dos. El estadstico Durbin-Watson (d) es utilizado para probarpor autocorrelacin de resago-1 entre residuos: d es aproximadamenteigual a 2*(1-r) donde res la autocorrelacin residual: un valor de 2,0 indicaausencia de autocorrelacin. Como regla general, cualquier valor de d

    inferior a 1 indica autocorrelacin grave entre los residuos. El valor de dsiempre se encuentra entre 0 y 4. Si el estadstico de Durbin-Watson essustancialmente menor que 2, existe evidencia de correlacin serial positiva.Un estadstico robusto y ms poderoso que DW es la prueba LM de

  • 7/22/2019 86539303 Xlstat Ana Lisis Estada Stico Con Excel 2010

    55/163

    49

    Homocedasticidad delos errores (varianzasson constantes) con

    respecto a la variablepredictora.

    Grfico de residuos versus variable predictora (en este caso ao).

    Los errores tienen unadistribucin normal.

    Grfico de probabilidad normal e histograma de residuos. Prueba denormalidad.

    El valor esperado delos residuos es cero

    Graficar residuos y evaluar su distribucin alrededor de cero.

    El libro 2NRP.xls de XlStatistics le ofrece las siguientes pruebas para evaluar los supuestos delmodelo.

    Residuos versus observacin. Los valoresson grficos segn su orden (1 a n). Estagrfica permite determinar si existe algnpatrn en el orden en que se midieron los

    datos (e.g. error sistemtico). Observe quelos residuos se encuentran dentro de unabanda de 1000 mm.

    Grafico de probabilidad normal. Para cumplircon el supuesto de normalidad, los residuosdeben ajustarse a una