Metodos de Estadistica No Parametrica

Embed Size (px)

Citation preview

  • 8/19/2019 Metodos de Estadistica No Parametrica

    1/26

      1

    Estadística no paramétrica

    1. El uso de pruebas estadísticas en la investigación

    En las ciencias se lleva a cabo investigaciones con el propósito de probar hipótesis que sederivan de las teorías, una vez establecida una hipótesis que parece pertinente, se recaba lainformación que nos permita decidir acerca de la hipótesis, la decisión puede conducirnos asostener, revisar o rechazar las hipótesis y la teoría de la cual se origino.

    Para lograr una decisión objetiva de si la hipótesis particular es confirmada por un conjunto dedatos, se debe tener un procedimiento objetivo para rechazar o bien para no rechazar talhipótesis. Se destaca un aspecto importante del método científico es que debe llegar aconclusiones por medio de métodos que sean del dominio publico y que puedan ser repetidospor otros investigadores competentes.

    En el procedimiento, generalmente se incluyen varios pasos:

    1. Establecer una hipótesis nula (H0) y la alternativa (o experimental) (H1). Decidir quedatos se van a recabar y en que condiciones. Seleccionar una prueba (con su modeloestadístico asociado) para probar H0.

    2. De entre varias pruebas que pueden usarse con un diseño de investigacióndeterminado, elegir el modelo de prueba que se aproxime lo mas cercanamente a lascondiciones de la investigación en términos de las suposiciones en las cuales estabasada la prueba.

    3. Especificar un nivel de significancia (α) y un tamaño de muestra (N).4. Encontrar la distribución muestral de la prueba estadística bajo la suposición de que H0 

    es verdadera.5. Con base en los puntos 1, 2, 3 y 4, definir la región de rechazo para la prueba

    estadística.6. Recabar los datos. Usando los datos obtenidos de la(s) muestra(s), computar el valor

    de la prueba estadística. Si ese valor esta en la región de rechazo, la decisión esrechazar H

    0, si ese valor esta fuera de esta región de rechazo, la decisión es que H

    0 no

    puede ser rechazada en el nivel de significación elegido.

    1.1 La hipótesis nula

    El primer paso en el procedimiento de toma de decisiones es establecer la hipótesis nula (H0).La hipótesis nula es la una hipótesis de -no efecto- y por lo general se formula con el propósitoexpreso de ser rechazada, es la negación del punto del punto que se esta tratando de probar.Si es rechazada, se apoya la hipótesis alterna (H1). La hipótesis alterna es la declaración de lahipótesis de investigación del experimentador. La hipótesis de investigación es la predicciónderivada de la teoría sometida a prueba.

    Cuando queremos tomar decisiones acerca de diferencias, probamos H0  contra H1. H1 

    constituye la aseveración o hipótesis que se acepta si se rechaza H 0. La naturaleza de lahipótesis de investigación determina como debe establecerse H1, si la hipótesis deinvestigación establece dos grupos diferirán respecto a sus medias, entonces H1 es que

    µ1≠ µ2

    Pero si la teoría predice la dirección de la diferencia, es decir, que un grupo especificado tendráuna media mayor que el otro, entonces H1 pudiera ser que

    µ1≤µ2 o bien µ2≤µ1

    esto es la media del grupo 1 es menor o igual que o bien la media del grupo 2 es menor o igualque respectiva.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    2/26

      2

    1.2 El nivel de significancia

    Cuando se han establecido la hipótesis nula y la hipótesis alterna, y cuando se ha seleccionadola prueba estadística adecuada, el siguiente paso consiste en especificar un nivel de

    significancia (α) y seleccionar un tamaño de muestra (N).

    El procedimiento es rechazar H0 a favor de H1, si una prueba estadística proporciona un valorcuya probabilidad de ocurrencia asociada de acuerdo con H0  sea igual o menor que algunaprobabilidad pequeña, generalmente denotada por α. A esta probabilidad se le conoce como elnivel de significación. Los valores comunes de α son 0.05 y 0.01. Se reitera que si laprobabilidad asociada con la ocurrencia de acuerdo a H0 (esto es cuando la hipótesis nula escierta) de un valor particular proporcionado por una prueba estadística es igual o menor que α,rechazamos H0 a favor de H1.

    Entonces, α proporciona la probabilidad de rechazar equivocada o falsamente a H0, el error derechazar H0 equivocadamente se conoce como error de tipo I. Existen dos tipos de errores quese pueden cometer al tomar una decisión acerca de H0, el primero se llama el error de tipo I  –

    se refiere al rechazar H0 cuando de hecho es verdadera-, el segundo se llama error de tipo II  – se refiere al no rechazar la hipótesis nula H0 cuando de hecho es falsa.

    La probabilidad de cometer el er ror de tipo I se denota por α, mientras mas grande sea laprobabilidad α, mas probable sera H0 de que sea rechazada equivocada, esto es, existe mayorprobabilidad de que se cometa el error de tipo I. El error de tipo II se denota por β, α y β seusan para indicar tanto el error como la probabilidad de cometerlo, esto es:

    P(error de tipo I) = α P(error de tipo II) = β 

    Idealmente los valores de α y β deben ser elegidos por el investigador antes de empezar elestudio, estos pueden determinar el tamaño de la muestra N que será necesario utilizar para

    usar la prueba estadística que se ha elegido. Una vez que se han especificado α y N sedetermina β, ya que existe una relación inversa entre la probabilidad de cometer los dos tiposde errores para cualquier N, a decrementos en α corresponden incrementos en β, por otro ladosi deseamos reducir la posibilidad de ambos tipos de errores, debemos incrementar el tamañode la muestra N.

    El investigador debe comprometerse para tratar de mejorar el equilibrio entre las probabilidadesde cometer ambos errores, lograr tal balance es importante para la potencia de una pruebaestadística. La potencia de una prueba se define como la probabilidad de rechazar H0 cuandode hecho es falsa, esto es,

    Potencia = 1 - P(error de tipo II) = 1 – β 

    1.3 La distribución muestral

    La distribución muestral es una distribución teórica, es la distribución que se podría obtener sise tomara en cuenta todas las posibles muestras del mismo tamaño de la población, extraídascada una de ellas de manera aleatoria.

    La distribución muestral nula de algún estadístico consiste en las probabilidades bajo H 0 asociadas con valores numéricos posibles del estadístico. La probabilidad asociada con laocurrencia de un valor particular del estadístico cuando H0 es verdadera, no es la probabilidadexacta de ese valor. En lugar de esto la probabilidad asociada con la ocurrencia según H 0 esusada para referirse a la probabilidad de un valor particular más las probabilidades de todos lovalores posibles que son extremos o más inconsistentes con H0. Esto es, la probabilidadasociada o la probabilidad asociada con la ocurrencia bajo H

    0, es la probabilidad de ocurrencia

    según H0  de un valor tan extremo o más extremo que el valor particular del estadístico deprueba. Supongamos que nos interesa la probabilidad de que cuando se lanzan tres monedas

  • 8/19/2019 Metodos de Estadistica No Parametrica

    3/26

      3

    equilibradas, caigan soles. La distribución muestral del número de caras podría trazarse a partirde la lista de todos los posibles resultados de lanzar al aire tres monedas equilibradas, loscuales se presentan a continuación:

    Monedas

    Resultados 1 2 3

    1 S S S2 S S A

    3 S A S

    4 S A A

    5 A S S

    6 A S A

    7 A A S

    8 A A A

    El numero total de eventos posibles (combinaciones posible de soles y águilas) es ocho, solouno de ellos es el evento en el que estamos interesados, la ocurrencia simultanea de tressoles. Así la probabilidad de ocurrencia bajo H0  de los tres soles en el lanzamiento de tresmonedas es un octavo. Aquí H0 es loa aseveración de que las monedas son normales, lo que

    significa que para cada moneda la probabilidad de que caiga un sol es igual a la probabilidadde que caiga águila.

    La distribución muestral de todos los posibles eventos proporciona la probabilidad deocurrencia del evento en el que estamos interesados, cuando H0 es verdadero. Es obvio que esesencialmente imposible usar este método de imaginar todos los posibles resultados con elpropósito de enumerar la distribución muestral, aun cuando las poblaciones no fueran muygrandes, si ese fuera el caso, entonces se depende de los teoremas invariantes que incluyensuposiciones, como es el caso del teorema del limite central.

    Cuando una variable esta normalmente distribuida, su distribución esta por completocaracterizada por su media y por su desviación estándar. Si este es el caso, sabemos que laprobabilidad de que un valor observado de la variable difiere de la media de la población enmas de 1.96 desviaciones estándar, es menor que 0.05.

    1.4 La región de rechazo

    La región de rechazo consiste en un subconjunto de los valores posibles, y se elige tal que laprobabilidad de ocurrencia de un estadístico de prueba según H0, tenga un valor en esesubconjunto sea α. La naturaleza de la región de rechazo es afectada por la forma de lahipótesis alterna H1. Si H1  indica la dirección predicha de la diferencia, entonces se usa unaprueba unidireccional. Si H1 no indica la dirección de la diferencia predicha, se usa una pruebabidireccional, las pruebas uni y bidi difieren en la localización (pero no en el tamaño) de laregión de rechazo; es decir, en una prueba unidireccional la región de rechazo estaenteramente en un extremo (o cola) de la distribución muestral.

    1.5 La decisión

    Si la prueba estadística proporciona un valor que cae en la región de rechazo, rechazamos H0.Cuando la probabilidad asociada con un valor observado de una prueba estadística es igual omenor que el valor de α previamente determinado, concluimos que H0  es falsa. Tal valorobservado es llamado significativo, la hipótesis sometida a prueba H0  es siempre que unresultado significativo ocurre, un valor significativo es aquel que se encuentra en la región derechazo y cuya probabilidad asociada de ocurrencia es menor o igual a α. 

  • 8/19/2019 Metodos de Estadistica No Parametrica

    4/26

      4

    2. Elección de una prueba estadística adecuada

    Cuando se dispone de pruebas estadísticas alternativas y validas para una hipótesis deinvestigación, es necesario emplear algunas racionalizaciones para elegir entre ellas. Unaprueba estadística es valida si la probabilidad de rechazar H0 cuando H0 es verdadera, es igual

    al valor elegido para α; es una prueba potente si tiene gran probabilidad de rechazar H 0 cuandoH0 es falsa. Supongamos que se encuentran dos pruebas estadísticas A y B, las cuales tienenla misma probabilidad de rechazar H0  cuando esta es verdadera, esto significa que ambaspruebas son igualmente validas. Podría parecer que nosotros simplemente deberíamosseleccionar aquella que tiene la probabilidad más grande de rechazar H 0 cuando sea falsa; sinembargo, existen otras consideraciones además de la potencia, que determinan la elección dela prueba estadística.

    2.1 Medición

    La teoría de la medición consiste en un conjunto de teorías separadas o distintas, cada una delas cuales concierne a un distinto nivel de medición, las operaciones interpretables es unconjunto dado de puntuaciones dependen del nivel de medición alcanzado. Aquí se examinan

    cuatro tipos o niveles de medición  –nominal, ordinal, de intervalo y de razón- y lasimplicaciones a cada uno de ellos para la interpretación de las pruebas.

    2.2 La escala nominal o categórica

    La medición en su nivel más débil existe cuando los números u otros símbolos se usansimplemente para clasificar un objeto, una persona o una característica. Cuando se empleannúmeros u otros símbolos para identificar los grupos a los cuales pertenecen varios objetos,estos números o símbolos constituyen una escala nominal o categórica. Esta escala se conocecomo escala clasificatoria.

    2.3 La escala ordinal o de rangos

    Puede suceder que los objetos en una categoría de una escala no sean tan solo diferentes delos objetos en otras categorías de esa escala, sino que también exista algún tipo de relaciónentre ellos. Las relaciones típicas entre las clases son: más alto, más preferido, más difícil, másperturbador, etc. Tales relacionan se denotan por el símbolo mayor que, su significadodepende de la relación que define la escala.

    Dado un grupo de clases de equivalencia (esto es, una escala nominal), si la relación mayorque se sostiene entre algunos pero no todos los pares de clases, tenemos una escalaparcialmente ordenada. Si la relación mayor que se sostiene para todos los pares de clases, demanera que es posible un rango completo ordenado de clases, tenemos una escala ordinal.

    2.4 La escala de intervalo

    Cuando una escala tiene todas las características de una escala ordinal y cuando ademástienen sentido las distancias o diferencias entre cualesquiera dos números de la escala, se halogrado una medición considerablemente más fuerte que la ordinal. En tal caso, la medición hasido lograda en el sentido de una escala de intervalo. Esto es, si nuestro mapeo de variasclases de objetos es tan preciso que conocemos que tan grandes son los intervalos (distancias)entre todos los objetos de la escala, y estos intervalos tienen significado sustantivo, entoncesse ha logrado una medida del intervalo. Una escala de intervalo esta caracterizada por unaunidad común y constante de medida que asigna un número a todos los pares de objetos en elorden establecido, esta clase de medición, la razón de cualesquiera dos intervalos esindependiente de la unidad de medida y del punto cero. En la escala de intervalo, el punto ceroy la unidad de medida son arbitrarios.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    5/26

      5

    2.5 La escala de razón

    Cuando una escala tiene todas las características de una escala de intervalo y además, tieneun punto cero verdadero en su origen, se llama escala de razón. En una escala de razón, larazón de cualesquiera dos puntos es independiente de la unidad de medida.

    2.6 Pruebas estadísticas paramétricas y no paramétricas

    Una prueba estadística paramétrica especifica tiene ciertas condiciones acerca de ladistribución de respuestas en la población de la cual se ha obtenido la muestra investigada. Yaque estas condiciones no son ordinariamente evaluadas, solo se suponen. La significación delos resultados de la prueba paramétrica depende de la validez de estas suposiciones. Unaadecuada interpretación de las pruebas paramétricas basadas en la distribución normaltambién supone que las puntuaciones que están siendo analizadas resultan de medidas en porlo menos una escala de intervalo.

    Una prueba estadística no paramétrica esta basada en un modelo que especifica solocondiciones muy generales y ninguna acerca de la forma especifica de la distribución de la cual

    fue obtenida la muestra. Ciertas suposiciones están asociadas con la mayoría de la pruebas noparamétricas: que las observaciones son independientes y quizás que la variable en estudio escontinua, pero estas suposiciones son menores y más débiles que aquellas asociadas con laspruebas paramétricas; mas aun, los procedimientos no paramétricos prueban diferenteshipótesis acerca de la población, que los procedimientos paramétricos no hacen, y por ultimo adiferencia de las pruebas paramétricas, existen pruebas no paramétricas que pueden aplicarseapropiadamente a datos en una escala ordinal, y otra pruebas para datos en una escalanominal o categórica.

    2.7 Ventajas y desventajas de las pruebas estadísticas no paramétricas

    Las ventajas son:

    1. Si el tamaño de la muestra es muy pequeño, puede no haber otra opción que usar unaprueba estadística no paramétrica, a menos que la naturaleza de la distribución de lapoblación se conozca con exactitud.

    2. Las pruebas no paramétricas típicamente hacen menos suposiciones acerca de losdatos y pueden ser más relevantes a una situación particular. Además, las hipótesisprobadas por una prueba no paramétrica pueden ser más adecuadas para lainvestigación.

    3. Las pruebas estadísticas no paramétricas están disponibles para analizar datos queson inherentes a los rangos, así como datos cuyas puntuaciones numéricas tienenaparentemente la fuerza de los rangos. Estos es, el investigador puede solo ser capazde decir que algunos sujetos tienen la misma característica en cuestión que otros, sinser capaces de determinar que tanto mas o menos.

    4. Los métodos no paramétricos están disponibles para tratar datos que son simplementeclasificatorios o categóricos; es decir, que son medidos en una escala nominal, ningunatécnica paramétrica se aplica a tales datos.

    5. Existen pruebas no paramétricas que son adecuadas para tratar muestras obtenidas deobservaciones de diferentes poblaciones. Las pruebas paramétricas a menudo nopueden manipular tales datos sin exigirnos hacer suposiciones aparentemente irrealeso requisitos pesados de computación.

    6. Las pruebas estadísticas no paramétricas típicamente son mas fáciles de aprender yaplicar que las pruebas estadísticas paramétricas, además su interpretación suele sermas directa.

    Las desventajas son:

    1. Si se encontraran en los datos todas las suposiciones del modelo estadísticoparamétrico, y si las hipótesis de investigación pudieran ser probadas mediante unaprueba paramétrica, entonces las pruebas estadísticas no paramétricas serian inútiles.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    6/26

      6

    Este grado de falta de utilidad es expresado por la potencia- eficacia de la prueba noparamétrica.

    2. Las pruebas estadísticas no paramétricas no son sistemáticas, mientras que laspruebas estadísticas paramétricas han sido sistematizadas y diferentes pruebas sonvariaciones de un tema central; mas aun, en un examen cuidadoso de las pruebas noparamétricas revela temas comunes: las pruebas para datos categóricos son

    sistemáticas como lo son las pruebas aplicadas para datos ordenados.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    7/26

      7

    3. El caso de una muestra simple

    Estas son pruebas estadísticas no paramétricas que son utilizadas para probar una hipótesisderivada de una muestra únicamente. Las pruebas nos dicen si la muestra proviene de algunapoblación especificada, esta prueba es diferente a la prueba para dos muestras, que comparanmuestras y prueban si es probable que las dos provengan de la misma población.

    Las pruebas de una muestra con frecuencia son pruebas de bondad de ajuste, en el caso típicose extrae una muestra aleatoria de alguna población y se prueba la hipótesis de que la muestrase extrajo de una población con distribución específica o con características especificas. Laspruebas responde a preguntas como:

    1. ¿Existe una diferencia significativa en la localización (tendencia central) entre lamuestra y la población?

    2. ¿Existe una diferencia significativa entre las frecuencias observadas y las frecuenciasque podríamos esperar con base a los postulados de alguna teoría?

    3. ¿Existe alguna diferencia significativa entre las proporciones observadas y esperadasen una serie de observaciones dicotómicas?

    4. ¿Es razonable creer que la muestra fue extraída de una población con una forma

    específica (normal o uniforme)?5. ¿Es posible creer que la muestra es una muestra aleatoria de alguna población

    conocida?6. En una serie de observaciones, ¿existe un cambio en el modelo teórico subyacente

    que se supone genera los datos?

    En el caso de una prueba paramétrica, una técnica común es aplicar una prueba t a ladiferencia entre la medida observada (de la muestra) y la media esperada (de la población). Entérminos estrictos, la prueba t supone que las observaciones provienen de una población quetiene una distribución normal, la interpretación apropiada de la prueba t supone que lasvariables están medidas como mínimo en una escala de intervalo.

    Existen muchas clases de datos para los cuales la prueba t puede ser inadecuada, el

    investigador puede encontrar que:

    1. Las suposiciones y los requisitos para una apropiada interpretación de la prueba t noson realistas para los datos.

    2. Es preferible evitar hacer suposiciones de la prueba t y así ganar una generalidadmayor en conclusiones.

    3. Los datos están inherentemente en rangos (en escala ordinal) y por tanto las pruebasparamétricas pueden ser inadecuadas.

    4. Los datos pueden ser categóricos o clasificatorios.5. No existe una prueba paramétrica útil para la hipótesis particular que va a ser probada.

    3.1 Prueba no paramétrica Binomial

    Existen muchas poblaciones que son concebidas como compuestas de solo dos clases; porejemplo, hombre y mujer, alfabeto y analfabeto, miembro y no miembro, interno y ambulatorio.Para tales casos todas las observaciones de la población caerán en una de dos categoríasdiscretas, tal población generalmente se denomina población binaria o población dicotómica.

    Supón que una población consta de solo dos categorías o clases, entonces cada observación(X) muestreada de la población puede tomar uno de dos valores, dependiendo de la categoríamuestreada, se puede denotar los posibles valores de la variable aleatoria usando cualquierpar de valores, pero es conveniente denotar cada resultado como 1 o 0. Asumiremosposteriormente que la probabilidad de muestrear un objeto de la primera categoría es p y laprobabilidad de muestrear un objeto de la otra categoría es q = 1 – p; esto es,

    P(X = 1) = p y P(X = 0) = 1

     – p = q

  • 8/19/2019 Metodos de Estadistica No Parametrica

    8/26

      8

    También se supone que cada probabilidad es constante, sin considerar el número de sujetosmuestreados u observados, aunque el valor de p puede variar de población a población, elmuestreo aleatorio generalmente impide que la muestra duplique precisamente los valores dela población de p y q. Por ejemplo, los registros oficiales de los votantes de cierta ciudad estándivididos a la mitad por el partido ROSA y el partido MORADO, pero una muestra aleatoria delos votantes registrados pueden contener 47% de rosas y 53% de morados, o quizá 56% de

    rosas y 44% de morados. Tales diferencias entre los valores de la población y los observadosse originan debido a fluctuaciones al azar o aleatorias en la las observaciones. La distribuciónbinomial se usa para determinar las probabilidades de los posibles resultados que podemosobservar al muestrear una población binomial. Si nuestra hipótesis es H 0: p = p0, podemoscalcular las probabilidades de varios resultados cuando suponemos que H 0 es cierta. La pruebanos dirá si es razonable que las proporciones (o frecuencias) de las categorías en la muestrahan sido extraídas de una población con valores hipotéticos de p0  y 1 - p0. Al hablar de ladistribución binomial, donde X = 1 es un éxito y X = 0 es un fracaso, además una serie de Nobservaciones,

    Y = Σ Xi  donde i = 1, 2, 3, …, N 

    Es el numero de éxitos o el numero de resultados de tipo X = 1.

    Método. En una muestra de tamaño N, la probabilidad de obtener k objetos en una categoría yN – k objetos en otra categoría, esta dada por

    P(Y = k) = NCk pkq

    N - k

      con k = 0,1,2,…,N 

    Donde p = la proporción de observaciones esperadas cuando X = 1, y q = la proporción deobservaciones esperadas cuando X = 0. La tabla E proporciona los valores deP(Y = k) para diferentes valores de N y p.

    Ejemplo: En un estudio de los efectos del estrés un investigador enseño a 18 estudiantes dosmétodos diferentes para hacer el mismo nudo. La mitad de los sujetos (seleccionadosaleatoriamente) aprendieron primero el método A y la otra mitad aprendió primero el método B.Posteriormente –a media noche y después de un examen final de cuatro horas de duración- a

    cada sujeto se le pidió que hiciera el nudo. La predicción fue que el estrés induciría regresión;esto es, que los sujetos regresarían al primer método aprendido para hacer el nudo, cadasujeto fue categorizado conforme a si uso el primer o el segundo método aprendido de hacernudos cuando se le pedía que hiciera el nudo bajo el estrés.

    i.  Hipótesis nula. H0: p = q = 0.5, esto es que no existen diferencias entre laprobabilidad de usar el primer o segundo método aprendido bajo estrés (p),cualquier diferencia entre las frecuencias que pueda ser observada es detal magnitud que pudiera esperarse en una muestra de la población deposibles resultados según H0. H1: p ≥ q, es decir, cuando se esta bajoestrés, la probabilidad de usar el primer método aprendido es mayor que laprobabilidad de usar el segundo método aprendido.

    ii.  Prueba estadística. Se elige la prueba binomial debido a que los datos

    están en dos categorías discretas y el diseño es del tipo de una muestra.Ya que los métodos A y B se asignaron aleatoriamente para serenseñados en primer y en segundo lugares, no hay razón para pensar queel primer método aprendido debería ser preferido al segundo métodoaprendido según H0, y así p = q = 0.5.

    iii.  Nivel de significación. Sea α = 0.01 y N es el numero de casos siendo 18. iv.  Distribución muestral. La distribución muestral esta proporcionada por la

    ecuaciónP(Y≥k) = Σ NCi pi qN – i  con i= k, k+1, …, N 

    Sin embargo, cuando N≤35 y p = p = 0.5 la tabla   D proporciona lasprobabilidades asociadas con la ocurrencia de H0  de valores observadostan pequeños como k, y así en este ejemplo no es necesario calcular

    directamente la distribución muestral.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    9/26

      9

    v.  Región de rechazo. La región de rechazo consta de todos los valores de Y(donde Y es el numero de sujetos que uso el segundo método aprendidobajo estrés), que son tan pequeños que la probabilidad asociada con suocurrencia según H0 es igual o menor que α = 0.01. 

    vi.  Decisión. En el experimento, todos los sujetos menos dos usaron el primermétodo aprendido cuando se les pidió que hicieran el nudo bajo estrés

    (tarde en la noche y después de un largo examen). Estos datos semuestran a continuación:

    Método escogido

     Aprendidoantes

     Aprendidodespués

    Total

    Frecuencia 16 2 18

    En la tabla D, para N = 18, la probabilidad asociada con k ≤ 2 es 0.001, ya que estaprobabilidad es mas pequeña que α, decisión es rechazar H0 a favor de H1, así se concluye quep ≥ q, esto es que la gente bajo estrés regresa al primero de los dos métodos aprendidos.  

    La tabla D no se utiliza para N≥35, sin embargo puede demostrarse que al incrementar el

    tamaño de N, la distribución binomial tiende a la distribución normal.

    3.2 Prueba JI cuadrada de la bondad e ajuste

    Frecuentemente, para el estudio del investigador es necesario conocer el número de sujetos,objetos o respuestas que caen en varias categorías. Por ejemplo, un grupo de pacientes puedeser clasificado de acuerdo con su propio preponderante de respuestas en la prueba deRorschach, y el investigador puede predecir que ciertos tipos serán mas frecuentes que otros.O los niños pueden ser categorizados de acuerdo con sus modalidades de juego masfrecuentes, siendo la hipótesis que esas modalidades diferirán en frecuencia de una maneraprescrita. O las personas pueden ser categorizadas con base en si están a favor de,indiferentes a, u opuestas a, una opinión que facilite al investigador probar la hipótesis de queesas respuestas difieren en frecuencia.

    La prueba Ji cuadrada es adecuada para analizar datos como estos: el número de categoríaspuede ser dos o más. La técnica es del tipo de bondad de ajuste en que puede ser usada paraprobar si existe una diferencia significativa entre un numero observado de objetos o respuestasque caen en cada categoría y un numero esperado basado en la hipótesis nula; es decir, laprueba ji cuadrada evalúa el grado de correspondencia entre las observaciones observadas ylas esperadas en cada categoría.

    Para comparar un grupo de frecuencias observado como uno esperado, debemos ser capacesde establecer que frecuencias deben ser esperadas. La hipótesis H 0 establece la proporción deobjetos que caen en una de las categorías en la población supuesta; esto es, de la hipótesisnula podemos deducir cuales son las frecuencias esperadas, la técnica ji cuadrada proporcionala probabilidad de que las frecuencias observadas pudieran haber sido muestreadas de unapoblación con los valores esperados proporcionados.

    La hipótesis nula H0 puede probarse mediante el siguiente estadístico:

    X2 = Σ ((Oi  – Ei)

     2/ Ei) = Σ (Oi)

    2/Ei  - N con i = 1,2,3,4,….,k y N es el total de observaciones

    Donde Oi es el numero observado de casos en la categoría i-esima, E i es el numero esperadode casos en la categoría i-esima cuando H0 es verdadera, k es el numero de categorías.

     Así la ecuación nos indica sumar sobre k categorías el cuadrado de las diferencias entre cadafrecuencia observada y esperada, dividido por la frecuencias esperada correspondiente.Mientras mayor sea el término de X

    2, menor será la probabilidad de que las frecuencias

    observadas provengan de la población en la cual están basadas las hipótesis H 0  y lasfrecuencias esperadas.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    10/26

      10

    La tabla C contiene la distribución muestral de ji cuadrada y proporciona la probabilidadasociada con ciertos valores, existe un valor diferente de ji cuadrada para cada grado delibertad; por ejemplo, cuando gl = 1 y H0 es verdadero, la probabilidad de observar un valor de jicuadrada tan grande como 3.84 (o mayor) es 0.05; esto es, P(X2≥3.84) = 0.05  El tamaño de los grados de libertad refleja el número de observaciones que son libres de variardespués de que se han colocado ciertas restricciones en los datos.

    Para usar la ji cuadrada a fin de probar una hipótesis en una situación de una muestra debondad de ajuste, se debe colocar cada observación dentro de cada una de las k celdas. Elnúmero total de observaciones debe ser N, el número de casos en la muestra; es decir, cadaobservación debe ser independiente de cualquier otra, no se pueden hacer variasobservaciones de la misma persona y contarlas como independientes. Hacer eso produce unaN inflada. Si la probabilidad asociada con la ocurrencia según H0 de la X

    2 obtenida para grados

    de libertad k – 1 es igual o menor al valor previamente determinado por α, entonces  H0 puedeser rechazada, en caso contrario H0 no puede ser rechazada.

    Ejemplo: Los aficionados a las carreras de caballos sostienen que una carrera alrededor deuna pista circular, los caballos tienen ventajas significativas acumuladas al ser colocados enciertas posiciones. Cualquier posición del caballo se asigna en la línea de salida, la posición 1

    es la mas cercana al carril del interior de la pista, la posición 8 esta en el extremo mas alejadadel carril en una carrera de ocho caballos. Podemos probar el efecto de la posición analizandolos resultados de la carrera, proporcionados de acuerdo con la posición, durante el primer mesde la temporada, en una pista circular.

    i. Hipótesis nula. H0: no existe diferencia en el número esperado de ganadorescomenzando en cada una de las posiciones y cualesquiera diferencias observadasson meramente variables causales que pueden esperarse en una muestra aleatoriade una distribución uniforme. H1: las frecuencias teóricas no son iguales.

    ii. Prueba estadística. Ya que estamos comparando los datos de una muestra conalguna población supuesta, la prueba ji cuadrada de bondad de ajuste esapropiada, se elige debido a que la hipótesis se va a probar concierne a la

    comparación de frecuencias observadas y esperadas en categorías discretas, eneste ejemplo, las categorías comprenden las ocho posiciones.

    iii. Nivel de significancia. Sea α = 0.01 y N = 144, el numero de ganadores en 18 díasde carreras.

    iv. Distribución muestral. La distribución muestral del estadístico X2  calculado (de la

    ecuación anterior) sigue la distribución ji cuadrada con k – 1 grados de libertad = 8 – 1 = 7.

    v. Región de rechazo. H0  será rechazada si el valor observado de X2  es tal que la

    probabilidad asociada con el valor calculado según H0 para 7 grados de libertad esmenor o igual a 0.01.

    vi. Decisión. La muestra de 144 ganadores rindieron los datos que se presentan en lasiguiente tabla:

    Posiciones1 2 3 4 5 6 7 8 Total

    Número deganadoresesperados

    29

    18

    19

    18

    18

    18

    25

    18

    17

    18

    10

    18

    15

    18

    11

    18

    144

    Las frecuencias observadas de ganadores están ubicadas en el centro de cada celda,las frecuencias esperadas están en cursivas en la esquina de cada celda; por ejemplo,29 ganadores resultaron los caballos colocados en la posición 1, mientras que segúnH0 deberían de haber sido solo 18 ganadores, etc. El calculo de X

    2 es directo, dando

    como resultado 16.3, la tabla C muestra que P(X2≥16.3) con 7 grados de libertad, tiene

    una ocurrencia entre p = 0.05 y p = 0.02, ya que esta probabilidad es mas grande queel nivel de significación establecido α = 0.01 no se puede rechazar H0 en ese nivel designificación, H0 podía haber sido rechazada si α = 0.05 

  • 8/19/2019 Metodos de Estadistica No Parametrica

    11/26

      11

    3.3 La prueba de Kolmogorov – Smirnov de una muestra

    Esta es otra prueba de bondad de ajuste, esta interesada en el grado de acuerdo entre ladistribución de un conjunto de valores muestreados (puntuaciones observadas) y algunadistribución teórica especifica. Esta prueba determina si las puntuaciones en una muestrapueden razonablemente provenir de una población que tiene una distribución teórica.

    La prueba incluye la especificación de la distribución de frecuencias acumuladas que pudieranocurrir dados la distribución teórica y comparándola con la distribución de frecuenciasacumuladas observadas, la distribución teórica representa lo que podría ser esperado segúnH0, la prueba permite mostrar en estas dos distribuciones, la teórica y la observada.

    Sea F0(X) una función de distribución de frecuencias relativas acumuladas completamenteespecificada por la distribución teórica según H0. Esto es, para cualquier valor de X, el valor deF0(X) es la proporción de casos esperados que tienen puntuaciones iguales o menores que X.

    Sea SN(X) la distribución la distribución de frecuencias relativas acumuladas observadas deuna muestra aleatoria de N observaciones, si X i  es una puntuación posible, entoncesSN(Xi)=Fi/N, donde Fi es el numero de observaciones que son menores o iguales que X i, F0(Xi)

    es la proporción esperada de observaciones que son menores o iguales a X i.

    Según la hipótesis nula de que la muestra ha sido extraída de la distribución teóricaespecificada, se espera que para cada valor X i, SN(Xi) sea ligeramente cercano a F0(Xi). Estoes, cuando H0  es verdadera, podemos esperar que las diferencias entre SN(Xi) y F0(Xi) seanpequeñas y dentro de los limites del error aleatorio. La prueba de Kolmogorov  – Smirnov seenfoca sobre las desviaciones mas grandes, el valor absoluto mas grande de F 0(Xi) – SN(Xi) sellama máxima desviación de D:

    D = max │F0(Xi) – SN(Xi)│ para i = 1, 2, 3, …., N.

    La distribución muestral de D según H0  es conocida, la tabla F proporciona ciertos valorescríticos para esa distribución muestral, nótese que la significancia de un valor dado D depende

    de N.

    Ejemplo: Durante los últimos anos los investigadores han estado estudiando la duración de unavariedad de eventos tales como: trabajos, huelgas y guerras. Como parte de tal investigación,las suposiciones concernientes a acciones individuales y el curso de los acontecimientos haconducido a modelos matemáticos de los mismos que hacen predicciones acerca de sudistribución, ya que los detalles de los modelos matemáticos no son de especial interés en estaobra, la evaluación del acuerdo entre los datos y las predicciones del modelo proporciona unabuena ilustración de la prueba de bondad de ajuste Kolmogorov  – Smirnov de una muestra.Los datos concernientes a la duración de las huelgas que empezaron en 1965 en el ReinoUnido fueron recabados, analizados y se hicieron predicciones con el uso del modelomatemático. La siguiente tabla contiene la distribución de frecuencias acumulativas para N =840 duraciones de huelga, también se proporciona la tablas de las frecuencias acumuladas

    predichas por el modelo matemático.

    Frecuencia acumulada Frecuencia acumuladarelativa

    Duraciónmáxima(días)

    Observada Predicha Observada Predicha │F0(X) - SN(X)│ 

    1 – 2 203 212.81 0.242 0.253 0.0112 – 3 352 348.26 0.419 0.415 0.0043 – 4 452 442.06 0.538 0.526 0.0124 – 5 523 510.45 0.623 0.608 0.0155 – 6 572 562.15 0.681 0.669 0.0126 – 7 605 602.34 0.720 0.717 0.003

    7 – 8 634 634.27 0.755 0.755 0.0008 – 9 660 660.10 0.786 0.786 0.0009 – 10 683 681.32 0.813 0.811 0.002

  • 8/19/2019 Metodos de Estadistica No Parametrica

    12/26

      12

    10 – 11 697 698.97 0.830 0.832 0.00211 – 12 709 713.82 0.844 0.850 0.00612 – 13 718 726.44 0.855 0.865 0.01013 – 14 729 737.26 0.868 0.878 0.01014 – 15 744 746.61 0.886 0.889 0.00315 – 16 750 754.74 0.893 0.899 0.00616 – 17 757 761.86 0.901 0.907 0.00617 – 18 763 768.13 0.908 0.914 0.00618 – 19 767 773.68 0.913 0.921 0.00819 – 20 771 778.62 0.918 0.927 0.00920 – 25 788 796.68 0.938 0.948 0.01025 – 30 804 807.86 0.957 0.962 0.00530 – 35 812 815.25 0.967 0.971 0.00435 – 40 820 820.39 0.976 0.977 0.00140 – 50 832 826.86 0.990 0.984 0.006

    ≥ 50  840 840.01 1.000 1.000 0.000

    Los pasos son los siguientes:

    i. Hipótesis nula. H0: la distribución de las duraciones de huelga sigue las

    predicciones del modelo matemático, es decir, la diferencia entre las duraciones dehuelga observadas y predichas no excede la diferencia que podría ser esperada siocurrieran al azar. H1: las duraciones de huelga observadas no coinciden conaquellas predichas por el modelo matemático.

    ii. Prueba estadística. Se elige la prueba de Kolmogorov  – Smirnov de una muestradebido a que el investigador desea comparar una distribución de puntuacionesobservadas de una escala ordinal con una distribución teórica de puntuaciones.

    iii. Nivel de significancia. Sea α = 0.05 y N es el numero de huelgas que empezaronen el Reino Unido en 1965 = 840.

    iv. Distribución muestral. Los valores críticos de D, la desviación máxima absolutaentre las distribuciones acumulativas observadas y predichas, están presentadosen la tabla F, junto con sus probabilidades asociadas de ocurrencia cuando H 0 esverdadera.

    v. Región de rechazo. La región de rechazo consiste de todos los valores de D queson tan grandes que la probabilidad asociada con su ocurrencia cuando H0  esverdadera, es menor o igual a α = 0.05 

    vi. Decisión. La diferencia entre la distribución de frecuencias relativas acumuladasobservadas SN(X) y la distribución de frecuencias relativas acumuladas predichasF0(X) es calculada, el valor de D es la diferencia máxima entre las frecuenciasacumulativas, es F0(X) – SN(X) = (510.45 / 840) – (523 / 840) = 0.015. ya que N esmayor a 35, se debe usar la aproximación de muestras grandes, con N = 840 elvalor critico de D es 1.36 / 840 = 0.047, puesto que el valor observado de D es0.015 siendo menor al valor critico, no se puede rechazar H0.

    La prueba de bondad de ajuste de Kolmogorov  –  Smirnov de una muestra trata lasobservaciones individuales por separado y por tanto a diferencia de la prueba ji cuadrada no

    necesariamente pierde información al hacer la combinación de categorías, aunque puede serconvincente usar agrupaciones de variables. Cuando las muestras son pequeñas y lascategorías adyacentes deben combinarse para usar adecuadamente el estadístico X

    2, la

    prueba de ji cuadrada es definitivamente menos potente que la prueba Kolmogorov  – Smirnov,mas aun para muestras pequeñas, la prueba ji cuadrada no puede ser usada, pero la pruebade Kolmogorov  –  Smirnov si. La prueba ji cuadrada supone que las distribuciones sonnominales, mientras que la prueba de Kolmogorov  – Smirnov supone una distribución continua.En principio, ambas pruebas pueden aplicarse a datos ordinales, sin embargo el agrupamientoes necesario para la aplicación de la prueba ji cuadrada la hace menos precisa que la pruebade Kolmogorov – Smirnov.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    13/26

      13

    4. El caso de una muestra medida dos veces y obtenida por medio de paresreplicados

    Las pruebas estadísticas de una sola muestra que implican dos medidas o pares replicados, seutilizan cuando el investigador desea establecer si dos tratamientos son diferentes o si untratamiento es mejor que otro. El tratamiento puede ser cualquiera de una amplia variedad de

    condiciones: aplicación de una droga, cierto entrenamiento, aculturación, propaganda,separación familiar, trastornos quirúrgicos, introducción de un nuevo elemento en la economía,etc. En cada caso, al grupo al cual se le aplica el tratamiento es comparado con uno al cual nose le aplico, o bien, se le aplico un tratamiento diferente.

    En las comparaciones entre dos grupos, en ocasiones las diferencias significativas que seobservan no son el resultado del tratamiento. Por ejemplo, un investigador puede intentarcomparar dos métodos de enseñanza utilizando dos grupos de estudiantes, un grupo que estesiendo ensenado con un método y un grupo diferente al cual se le esta enseñando con unprocedimiento distinto. Si uno de los grupos incluye estudiantes mas capaces o mas motivados,la ejecución de los dos grupos después de las experiencias de aprendizaje puede no reflejarcon precisión la efectividad relativa de los diferentes métodos utilizados, porque otras variablesson las que produjeron las diferencias observadas en la ejecución.

    Una manera de resolver la dificultad por las diferencias extrañas entre los grupos es utilizar dosmuestras relacionadas en la investigación, esto es, se puede igualar o relacionar las dosmuestras estudiadas. Esta igualación se obtiene utilizando a cada sujeto como su propiocontrol o pareando a los sujetos y asignándoles a los miembros del par una de doscondiciones.

    La técnica estadística paramétrica usual para analizar los datos de dos muestras relacionadases la aplicación de una prueba t a las diferencias en las puntuaciones obtenidas. Lasdiferencias se obtienen entre las puntuaciones obtenidas por los dos miembros de cada par obien, de las dos puntuaciones obtenidas por el mismo sujeto en cada condición. La prueba tsupone que las diferencias en las puntuaciones obtenidas pertenecen a una distribución normallo cual implica que las variables pueden medirse al menos en una escala de intervalo. En

    ocasiones la prueba t no es adecuada, ya que:

    1. Las suposiciones y los requisitos de la prueba t no son aplicables a los datos.2. Es conveniente evitar hacer las suposiciones o probar los requisitos de la prueba t y así

    dar una mayor generalidad a sus conclusiones.3. Las diferencias entre los pares igualados no se presentan como puntuaciones, sino

    como signos.4. Las puntuaciones son clasificaciones: los dos miembros del par pueden responder de

    la misma manera o de maneras diferentes, lo cual no afirma o propone alguna relacióncuantitativa a cada uno.

    Para tales circunstancias el investigador debe seleccionar alguna prueba estadística noparamétrica, para las dos mediciones de una sola muestra o para los pares replicados.

    4.1 La prueba del cambio de McNemar

    La prueba de MacNemar para la significación de los cambios es particularmente aplicable a losdiseños antes  – después, en los cuales cada sujeto se utiliza como su propio control y en losque las mediciones se realizan ya sea en escala nominal u ordinal. Bajo estas condiciones sepuede emplear para probar la efectividad de un tratamiento particular (reuniones, editoriales enlos diarios, discursos de campana, visitas personales, etc.) sobre las preferencias de losvotantes acerca de candidatos a puestos públicos o para probar el efecto de la migración delcampo a la ciudad sobre la filiación política de las personas. Note que estos estudios laspropias personas pueden servir como su propio control y que la escala nominal (o decategorización) se utiliza de manera adecuada para evaluar el cambio antes – después.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    14/26

      14

    Con este método para probar la significación de cualquier cambio observado se utiliza unatabla de 2 por 2 para representar el primero y el segundo conjunto de respuestas de losmismos individuos, los rasgos generales de dicha tabla se muestran a continuación:

    Después

    - +

     Antes + A B- C D

    En donde + y  –  se usan para denotar diferentes respuestas, las entradas en la tablacorresponden a las frecuencias (ocurrencias) de los resultados asociados, así, A denota elnumero de individuos cuyas respuestas fueron + en la primera medición y  –  en la segundamedición. De manera similar, D es el numero de individuos quienes cambiaron de  – a +, B es lafrecuencia de individuos que se respondieron + en ambas ocasiones y C es el numero depersonas que respondieron – en la primera y en la segunda evaluación.

     Así A + D es el total de personas cuyas respuestas cambiaron, la hipótesis nula es que elnumero de cambios en cada dirección es el mismo, de A + D individuos que cambiaron seesperaría que (A + D) / 2 personas cambiaran de  – a +, es decir, cuando H0 es verdadera, lafrecuencia esperada en cada una de las celdas es (A + D) / 2.

    En la prueba de McNemar para la significación de los cambios, se debe estar interesado soloen las celdas en las cuales pueden ocurrir cambios, si A es el numero de casos observadoscuyas respuestas cambiaron de + a -, D es el numero observado de casos que cambiaron de – a +, y (A + D) / 2 es el numero de casos en las celdas A y D, entonces

    X2 = Σ ((Oi  – Ei) / Ei) = ((A – (A+D)/2)

    2) / ((A+D)/2) + ((D – (A+D)/2)2) / ((A+D)/2)

    Desarrollando términos y reduciendo se tiene que

    X2 = (│ A - D│ - 1)2 / (A+D) con 1 grado de libertad

    La distribución de X2 calculada por la ecuación anterior, cuando H0 es verdadera, se distribuyeasintóticamente como ji cuadrada con un grado de libertad.

    Ejemplo: Durante las campañas presidenciales de 1980 en Estados Unidos se realizarondebates televisivos entre dos o más candidatos. Un investigador en técnicas de comunicaciónestaba interesado  –tanto como los candidatos- en determinar si los debates entre loscandidatos presidenciales en las elecciones de 1980 eran efectivos o no en cuanto a cambiarlas preferencias de los televidentes hacia los distintos candidatos. Se predijo que si loscandidatos (Jimmy Carter y Ronald Reagan) eran igualmente efectivos, habría cambioscomparables en las preferencias a cada candidato por parte de los televidentes. Por otro lado,si un candidato era mas efectivo o persuasivo durante el debate, entonces habría un cambiodiferencial de un candidato a otro. Para evaluar la efectividad del debate, el investigadorselecciono 70 adultos al azar antes del debate, les volvió a preguntar acerca de su predicción,

    así en cada caso el conocía las preferencias de las personas antes del debate y después delmismo, los resultados fueron los siguientes:

    Preferencias antesdel debate

    Preferencias después del debate

    Reagan Carter

    Carter 13 28

    Reagan 27 7

    Los resultados obtenidos son:

    i. Hipótesis nula. H0: entre los televidentes que cambiaron sus preferencias, laprobabilidad de que hayan cambiado de Reagan a Carter será la misma de los quecambiaron de Carter a Reagan. La hipótesis alterna es H

    1: Hay un cambio

    diferencial en la preferencia. Las hipótesis pueden resumirse como sigue:

  • 8/19/2019 Metodos de Estadistica No Parametrica

    15/26

      15

    H0: P(Reagan →Carter) = P(Carter → Reagan) H1: P(Reagan →Carter) ≠ P(Carter → Reagan) 

    ii. Prueba estadística. Se selecciona la prueba de McNemar para la significación delos cambios, ya que el estudio utiliza dos muestras relacionadas (los mismossujetos medidos en dos ocasiones), esta prueba es de tipo antes  –  después y

    utiliza medidas nominales (categóricas).iii. Nivel de significación. α = 0.05 y N = 70 (numero de personas a las cuales se lespidió su opinión antes del debate y después del debate).

    iv. Distribución muestral. La tabla C proporciona los valores críticos de la distribución jicuadrada para varios niveles de significancia, La distribución muestral X

    2 calculada

    por medio de la ecuación anterior se distribuye asintóticamente como ji cuadradacon 1 grado de libertad.

    v. Región de rechazo. Puesto que H1  no especifica la dirección de la diferencia encuanto a preferencia, la región de rechazo es bidireccional. La región de rechazoconsiste en todos los valores de X

    2 que sean mayores que aquellos que tienen una

    probabilidad no direccional asociada con su ocurrencia cuando H0  es verdaderapara α = 0.05 o menor. 

    vi. Decisión. Los datos muestran que A = 13 (los televidentes que cambiaron de Cater

    a Reagan) y D = 7 (los televidentes que cambiaron de Reagan a Carter), B = 28 yC = 27 son los televidentes que no cambiaron su preferencia a pesar del debate.

    Con los datos anteriores, tenemos

    X2 = (│13 - 7│ - 1)2 / (13+7) = 1.25

    Recurriendo a la tabla C, tenemos que cuando H0 es verdadera y con un grado de libertad, laprobabilidad de X

    2 ≥3.84 es 0.05. Como el valor observado de X2 es 1.25 siendo menor que el

    valor critico de ji cuadrada, no podemos rechazar la hipótesis de que los candidatos fueronigualmente efectivos para cambiar de preferencias de los televidentes.

    4.2 Prueba de los signos

    La prueba de los signos adquiere su nombre del hecho que esta basada en la dirección de lasdiferencias entre dos mediciones, más que en medidas cuantitativas. La prueba de los signoses aplicable al caso de dos muestras relacionadas cuando el investigador desea establecer quedos condiciones son diferentes, la única suposición que subyace a esta prueba es que lavariable estudiada tiene una distribución continua, la prueba no hace suposiciones acerca de laforma de la distribución y tampoco supone que los sujetos pertenecen a la misma población.Los diferentes pares pueden pertenecer a diferentes poblaciones en cuanto a edad, sexo,inteligencia, etc. el único requisito es que dentro de cada par, el investigador haya igualadorespecto a las variables.

    La hipótesis nula evaluada por la prueba de los signos es si

    P(Xi≥Yi) = = P(Xi≤Yi) = 1/ 2

    Donde Xi es el juicio o permutación de acuerdo con una condición (o antes del tratamiento) y Y i es el juicio o puntuación de acuerdo con la otra condición (o después del tratamiento). Esto es,Xi  y Yi  son las dos puntuaciones obtenidas por cada miembro de la pareja, otra manera deplantear H0 es: la mediana de las diferencias entre X i y Y i es cero. Durante la aplicación de laprueba se debe prestar atención a la dirección de la diferencia de cada X i y Yi, notando dondeel signo de la diferencia es positivo o negativo (+ o -). Cuando H0  es verdadera, debemosesperar a que el numero de pares donde Xi >Yi sea igual al numero de pares donde Xi 

  • 8/19/2019 Metodos de Estadistica No Parametrica

    16/26

      16

    Muestras pequeñas. La probabilidad asociada a la ocurrencia de un numero particular depositivos (+) y negativos (-) puede determinarse recurriendo a la distribución binomial con p = q= ½, donde N es el numero de pares; si algún(os) par(es) no muestran diferencia por tanto, noexiste signo, dichos datos son excluidos del análisis y N se reduce. La tabla D nos proporcionalas probabilidades asociadas a la ocurrencia de acuerdo con valores de H 0 tan pequeños comox para N ≤ 35, para utilizar esta tabla, x será el numero de de signos con menor frecuencia. 

    Por ejemplo, supongamos que observamos 20 pares, de los cuales 16 muestran diferencias enuna sola dirección (+) y los otros 4 muestran diferencias (-), en este caso N = 20 y x = 4, alremitirnos a la tabla D, la probabilidad con estos pocos signos negativos cuando H 0  esverdadera (esto es, p= 1/2) es 0.006.

    La prueba de los signos puede ser tanto unidireccional como bidireccional, en la pruebaunidireccional la hipótesis alterna (H1) plantea que un signo (+ o -) ocurrirá masfrecuentemente; en la prueba bidireccional, la predicción es simplemente que las frecuenciasde los signos diferirán significativamente, para la prueba bidireccional los valores deprobabilidad de la tabla D deben duplicarse.

    Ejemplo para muestras pequeñas: Un investigador estaba estudiando el proceso de toma de

    decisión esposo  –  esposa. Se estudio exhaustivamente una muestra de parejas esposo  – esposa para determinar el papel percibido de cada uno de ellos respecto de mejorar lasadquisiciones domesticas. En cada ocasión, una pareja (cada uno por separado) contestaba uncuestionario concerniente a la influencia que creía ejercer cuando el matrimonio enfrentaba unasituación en la que tenia que decidirse la adquisición de enseres para el hogar, las respuestasa las preguntas se evaluaban mediante una escala que iba de esposo dominante a esposadominante. Para cada pareja, la diferencia entre sus percepciones era determinada ycodificada como + si a juicio del esposo, la esposa no debería tener una mayor influencia queel y esto no coincide con lo informado por la esposa (esposo: mi opinión debería tener mayorpeso que la de ella, y la esposa: ambos deberíamos ponernos de acuerdo para decidir). Ladiferencia se codifica como (-) cuando ocurría el caso contrario, la diferencia se codifica comocero si la pareja estaba en completo acuerdo acerca del grado de influencia ejercida en ladecisión.

    i. Hipótesis nula. H0: los esposos y esposas están de acuerdo en el grado deinfluencia que ambos deben tener cuando deciden sobre las adquisicionesdomesticas. H1: los esposos juzgan que ellos deben tener mayor influencia que susesposas acerca de las decisiones de adquirir enseres para el hogar.

    ii. Prueba estadística. La escala utilizada en este estudio es una escala parcialmenteordenada, la información contenida en los juicios se mantiene si las diferenciasentre las parejas se puede expresar por medio de un signo (+ o -). Cada pareja eneste estudio constituye un par igualado, están igualados en el sentido de que cadauno de ellos respondió a la misma pregunta. La prueba de los signos es apropiadapara la clase o el tipo de medidas descritas y, por supuesto, para el caso demuestras relacionadas o igualadas.

    iii. Nivel de significación. α= 0.05 y N es el numero de parejas en una de las

    condiciones = 17 (N puede reducirse si ocurren empates).iv. Distribución muestral. La probabilidad asociada a la ocurrencia de los valores tan

    grandes como x, es proporcionada por la distribución binomial para p = q = ½. Ladistribución binomial para los valores seleccionados de N se presenta en la tabla D.

    v. Región de rechazo. Puesto que H1 predice la dirección de las diferencias, la regiónde rechazo es unidireccional, esta consiste en todos los valores de x (donde x es elnumero de signos positivos, dada la predicción para H1 de que predominaran lossignos positivos) para los valores de la probabilidad de ocurrencia (unidireccional).H0 es verdadera cuando estos son iguales o menores que α= 0.05.

    vi. Decisión. Los juicios acerca de la influencia de los esposos varían en una escalade 1 a 7. En esta escala, el 1 representa al juicio en que la esposa tiene laautoridad completa sobre la decisión, una puntuación de 7 representa al juiciodonde es el esposo quien tiene la autoridad completa sobre la decisión; una

    puntuación de 7 representa al juicio donde es el esposo quien tiene la autoridadcompleta, los valores indeterminados representan el juicio de diferentes niveles de

  • 8/19/2019 Metodos de Estadistica No Parametrica

    17/26

      17

    acuerdo o influencia. En la siguiente tabla se muestran las puntuaciones asignadaspara cada esposo (H) y esposa (E) de las 17 parejas. Los signos de las diferenciasentre las puntuaciones de los pares se presentan en la última columna de la tabla.

    Tasa de influenciaPareja Esposo Esposa Dirección en la

    diferencia

    Signo

     A 5 3 XH > XE  +B 4 3 XH > XE  +C 6 4 XH > XE  +D 6 5 XH > XE  +E 3 3 XH = XE  0F 2 3 XH < XE  -G 5 2 XH > XE  +H 3 3 XH = XE  0I 1 2 XH < XE  -J 4 3 XH > XE  +K 5 2 XH > XE  +L 4 2 XH > XE  +

    M 4 5 XH < XE  -N 7 2 XH > XE  +O 5 5 XH = XE  0P 5 3 XH > XE  +Q 5 1 XH > XE  +

    Notemos que tres parejas mostraron diferencias opuestas a las predichas, estas se codificaroncomo (-), otras tres parejas estuvieron completamente de acuerdo en el nivel de influencia delos miembros de la pareja, por tanto, se declaro empate y se redujo la N a 14. x es el numerode signos positivos = 11 y N el numero de pares iguales (14). En la tabla D se muestra que laprobabilidad de observar x ≥11 (de una cola) es de 0.029, puesto que este valor esta en laregión de rechazo para α=0.05, la decisión es rechazar H 0 a favor de H1, así se concluye quelos esposos creen que son ellos los que deben tener una mayor influencia al momento de

    tomar decisiones acerca de la adquisición de enseres domésticos, en comparación con la quedeben tener las esposas.

    Empates. Para la prueba de los signos ocurre un empate cuando no es posible discriminarentre los valores de un par igualado o ambos valores son iguales. Todos los casos querepresentan empates son excluidos del análisis en la prueba de los signos y entonces la Ndisminuye con el número de empates que existan.

    La relación con la expansión binomial. El estudio presentado anteriormente debería esperarque cuando la H0 es verdadera, la frecuencia en los signos positivos y negativos fuera la mismaque las caras y cruces de 14 lanzamientos de una moneda. La probabilidad de obtener 11caras y tres cruces en catorce lanzamientos nos da la distribución binomial.

    P(x ≥ 11) = 0.029, este método es parecido al valor encontrado en el ejemplo de las parejas.  

    Muestras grandes. Si N es mayor que 35, puede utilizarse la aproximación normal a ladistribución binomial. Esta distribución tiene una

    Media = µx = Np = N/ 2 Varianza = σ2 x = Npq = N/ 4 de donde el valor de z esta dado

    porz= (x - N)/ √N  esta expresión esta distribuida normalmente con media 0 y

    varianza 1. La aproximación puede ser mejor si aplicamos la corrección por continuidad, estacorrección se efectúa reduciendo la diferencia entre el número observado de signos positivos(o negativos) y el número esperado (media) cuando H0 es verdadera al 0.5, quedando

    z = (2x ±1 - N) / √N Se usa +1 cuando X < N/2 y se usa -1 cuando X > N/2. El valor obtenido de z mediante laaplicación puede considerarse normalmente distribuida, la tabla A nos proporciona los valores

  • 8/19/2019 Metodos de Estadistica No Parametrica

    18/26

      18

    de probabilidad (unidireccional) asociada con la ocurrencia cuando H0  es verdadera, convalores extremos observados de x, si se requiere el valor bidireccional el valor de la tabla Adebe duplicarse.

    Ejemplo: Supongamos que un investigador estuviera interesado en determinar si una ciertapelícula acerca de delincuencia juvenil puede cambiar las opiniones de ciertos miembros de

    alguna comunidad particular, en relación con la severidad de las medidas punitivas aplicadas amenores infractores, el obtiene una muestra al azar de 100 adultos de dicha comunidad y llevaa cabo un diseño antes-después, teniendo a cada sujeto como su propio control. Pide a cadasujeto que de su opinión acerca de la cantidad o el grado de las medidas punitivas quedeberían aplicarse a menores infractores. Después les muestra la película a los 100 adultos yposteriormente les repite la pregunta.

    Opinión Numero

    Incremento en la severidad 26

    Decremento en la severidad 59

    No hubo cambio 15

    i. Hipótesis nula. H0: la película no tiene efectos sistemáticos sobre las opiniones, es

    decir, las posibles diferencias observadas se deberán más bien a lo esperado deuna muestra tomada al azar de una población en la cual la película no tiene efectossistemáticos. H1: la película tiene efectos sistemáticos en las opiniones.

    ii. Prueba estadística. Para este estudio se escogió la prueba de los signos portratarse de una muestra relacionada y porque se utilizan medidas ordinales y portanto las diferencias pueden ser representadas por signos positivos y negativos.

    iii. Nivel de significación. α=0.01 y N es el numero de adultos que muestran cambio ensu opinión.

    iv. Distribución muestral. Cuando H0  es verdadera, z calculada se encuentradistribuida de manera normal, la tabla A nos proporciona la probabilidad asociadade ocurrencia de valores tan extremos como la z obtenida.

    v. Región de rechazo. Ya que H1 no plantea la dirección de las diferencias predichas,la región de rechazo es bidireccional, consiste en todos los valores de z cuya

    probabilidad de ocurrencia asociada sea extrema, cuando H0  es verdadera, esmenor o igual que α=0.01. 

    vi. Decisión. ¿tuvo algún efecto la película?. Los resultados nos muestran que solo 15adultos no presentan cambio en su opinión y 85 que si cambiaron. El análisisfundamenta solo en aquéllos sujetos que cambiaron. Si la película no hubieratenido un efecto sistemático, habríamos esperado que alrededor de la mitad de laspersonas que mostraron cambios en su opinión se repartiera equitativamente entreincremento en la severidad y decremento en la severidad; esto es, que de las 85personas, 42.5 estuvieran en una categoría y 42.5 estuvieran en la categoríacontraria. Se determina que la probabilidad de que H0 sea verdadera utilizandoX > N/ 2 z = (118 – 1 - 85) / √85 = 3.47

    La tabla A, muestra que la probabilidad de z ≥ 3.47 cuando H 0 es verdadera es 2(0.0003)=0.0006, el valor de la probabilidad se duplica porque la tabla de valores es unidireccional,como 0.0006 es mas pequeño que 0.01, la decisión es rechazar la hipótesis nula a favor dela hipótesis alterna. Se concluye que la película tuvo efectos sistemáticos sobre la opiniónde los 100 adultos en relación con la severidad deseable de las medidas punitivasaplicables a menores infractores.

    Este problema también pudo ser analizado con la prueba de McNemar, usando

    X2 = (│A - D│- 1)2 / (A + D)

    Donde A = 59, D = 26, el resultado es 12.05.La tabla C muestra que X

    2  ≤ 12.05 con 1 grado de libertad tiene una probabilidad de

    ocurrencia cuando H0 es verdadera menor que 0.001. Este resultado no se contrapone conla prueba de los signos.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    19/26

      19

    4.3 Prueba de rangos asignados de Wilcoxon

    La prueba de los signos utiliza información solo en términos de la dirección de lasdiferencias en cada uno de los pares analizados. Si se consideran tanto la magnitudrelativa como la dirección de las diferencias, se puede utilizar una prueba más poderosa.La prueba de rangos asignados de Wilcoxon adjudica mayor peso a los pares que

    muestran mayores diferencias entre las dos condiciones, más que a los pares cuyadiferencia es pequeña.

    La diferencia de las puntuaciones entre los miembros del par igualado (d i) representa ladiferencia entre las puntuaciones del par en los tratamientos (X y Y). Esto es, d i = X i  – Yi,para utilizar la prueba de Wilcoxon se deben poner en columna todas las diferencias sintener en cuenta el signo: adjudique el rango 1 a la d i mas pequeña, el rango 2 a la siguientey siga de manera consecutiva, cuando se tiene que decidir el rango entre un -1 y un +2 o -2, el mas pequeño será -1, entonces a cada rango se debe añadir el signo de la diferencia,así se puede indicar e identificar los rangos de las diferencias positivas, de los rangos delas diferencias negativas.

    La hipótesis nula es que los tratamientos X y Y son equivalentes, son muestras de la

    misma población, con la misma mediana y la misma distribución continua. Si H 0  esverdadera, de debe encontrar algunas diferencias a favor del tratamiento X y otras a favordel tratamiento Y; es decir, si sumamos los rangos que tienen signo positivo y aquellos sonsigno negativo, se espera que ambas sumas fueran iguales (siempre que H 0  seaverdadera). Pero si la suma de los rangos positivos es muy diferente de la suma de losrangos negativos se inferirá que el tratamiento X difiere del tratamiento Y, y por tanto serechaza H0; es decir, se rechaza siempre que cualquiera de las sumas de las diferencias(positivas o negativas) sea demasiado pequeña. Para desarrollar esta prueba se define dosestadísticos:

    T+ = suma de los rangos de las diferencias positivas

    T- = suma de los rangos de las diferencias negativas

    De lo anterior, la suma de todos los rangos es

    N (N + 1)/ 2, T- = N(N+1)/ 2 – T+

    Empates. Ocasionalmente las dos puntuaciones de cualquier par son iguales, es decir, noexiste diferencia entre los miembros de ese par, así que X i  – Yi = di = 0. Tales pares sonexcluidos del análisis y el tamaño de N se reduce, es lo mismo que se hizo con la pruebade los signos, N es el numero de pares igualados menos el numero de pares donde X = Y.

    Puede ocurrir otro tipo de empate cuando dos o mas diferencias son de la misma magnitud,a estos casos se les asigna el mismo rango, el cual se calcula de la siguiente manera,imaginemos que tres pares presentan diferencias de la misma magnitud -1, -1, y +1, a cadapar se le asigna el rango 2, ¿Por qué?, porque los rangos que les correspondían se

    promediaron ((1+2+3)/3) = 2, el rango que corresponde al par siguiente es 4 porque losrangos 1, 2 y 3 ya fueron asignados.

    Muestras pequeñas. Sea T+  la suma de los rangos para los cuales las diferencias (di)

    fueron positivas, la tabla H proporciona varios valores de T+  y sus probabilidades de

    ocurrencia asociadas, en la suposición de que no existen diferencias en los grupos X y Y, siuna T

    + observada es igual al valor presentado en la tabla H para un tamaño de muestra (N)

    particular, la probabilidad de un valor de T+  tan grande es tabulada. Si la probabilidad es

    menor o igual al nivel de significación obtenido, la hipótesis nula puede rechazarse en esenivel de significación. La tabla H se utiliza tanto para pruebas unidireccionales comobidireccionales. Una prueba unidireccional es adecuada si el investigador ha predichoalguna dirección particular de las diferencias, para pruebas bidireccionales se tiene queduplicar el valor proporcionado por la tabla.

    Ejemplo para muestras pequeñas: Existe considerable evidencia de que los adultos soncapaces de utilizar señales visuales en el procesamiento de información auditiva. En una

  • 8/19/2019 Metodos de Estadistica No Parametrica

    20/26

      20

    conversación normal, las personas pueden utilizar los movimientos de los labios en elprocesamiento de la charla, la congruencia entre los movimientos de los labios y lossonidos del habla son particularmente benéficos en ambientes ruidosos. La investigaciónha demostrado que el procesamiento del habla se deteriora cuando las señas auditivas yvisuales no son congruentes. En los niños, la habilidad para discriminar y localizar la fuentede estímulos auditivos y visuales complejos se establece alrededor de los seis meses de

    edad. Se diseño un experimento para determinar si los niños de 10 a 16 semanas de edadse dan cuenta de la sincronía entre los movimientos de los labios y los sonidos del habla enuna conversación normal. Los niños se colocaron en una habitación a prueba de ruido, quetenia una ventana a través de la cual podían ver a una persona hablando. La personahablaba en un micrófono y el sonido era dirigido directamente al cuarto (en sincronía) o conuna demora de 400 milisegundos (fuera de sincronía). En cada condición se midió eltiempo que el niño miraba la cara de la persona que hablaba. Se argumento que si elpequeño es capaz de discriminar ambas condiciones, la cantidad de tiempo de ver a lapersona seria diferente, aunque a priori no se planteo en cual de las dos condiciones entiempo seria mayor.

    Existen considerables diferencias individuales entre los infantes respecto al tiempo quepasaron atendiendo al estimulo; sin embargo, la diferencia en el tiempo que pasaron viendo

    en la condición en sincronía y el tiempo que pasaron viendo en la condición fuera desincronía podría ser un indicador confiable de la capacidad de discriminar. Si el niño pasamas tiempo atendiendo el estimulo en la presentación asincrónica, la diferencia serianegativa. Si el pequeño es capaz de discriminar, las diferencias deberían tender hacia unadirección; mas aun, cualquier diferencia en dirección contraria debería ser relativamentepequeña.

     Aunque el investigador confía en que las diferencias en el tiempo promedio que se pasaronmirando indican las diferencias en la atención, no esta seguro de que las puntuacionessean suficientemente precisas para que sean representadas en una escala que no seaordinal. Esto es, solo puede afirmar que las grandes diferencias reflejan incrementos en laatención, aunque la interpretación de las diferencias en las magnitudes numéricas en eltiempo de mirar no reflejan directamente las diferencias en la atención, el establecer los

    rangos de las diferencias en el mirar reflejara el orden de las diferencias en el atender alestimulo.

    Sujeto En sincronía Fuera de sincronía D Rango de d

    DC 20.3 50.4 30.1 10

    MK 17.0 87.0 70.0 12

    VH 6.5 25.1 18.6 6

    JM 25.0 28.5 3.5 3

    SB 5.4 26.9 21.5 8

    MM 29.2 36.6 7.4 5

    RH 2.9 1.0 -1.9 -1

    DJ 6.6 43.8 37.2 11

    JD 15.8 44.2 28.4 9

    ZC 8.3 10.4 2.1 2

    CW 34.0 29.9 -4.1 -4

     AF 8.0 27.7 19.7 7

    i. Hipótesis nula. H0: la cantidad de tiempo que pasan los niños viendo a través de laventana no depende del tipo de presentación, la suma de los rangos positivos nodifiere de la suma de los rangos negativos. La hipótesis alterna es H 1: la cantidadde tiempo que los niños pasan viendo depende del tipo de presentación; la sumade los rangos positivos difiere de la suma de los rangos negativos.

    ii. Prueba estadística. Se selecciona la prueba de Wilcoxon porque en el estudio seemplean dos muestras relacionadas y las diferencias en las puntuaciones puedenser ordenadas por medio de rangos.

    iii. Nivel de significación. Plantearemos α= 0.01 y N es el numero de pares utilizadosmenos el numero de pares cuyas diferencias sean di=0.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    21/26

      21

    iv. Distribución muestral. La tabla H proporciona los valores de probabilidad de ladistribución muestral T

    + para N ≤ 15. 

    v. Región de rechazo. Como se predice la dirección de las diferencias, una región derechazo bidireccional es apropiada. La región de rechazo consiste en todos losvalores de T

    + (suma de rangos positivos) cuya probabilidad asociada cuando H 0 es

    verdadera, es menor o igual a α=0.01 para una prueba bidireccional. 

    vi. Decisión. En este estudio se utilizaron 12 niños como sujetos. El porcentaje deltiempo que pasaron viendo a través de la ventana se muestra en la tabla. Dondese advierte que solo en dos niños (RH y CW) se observan diferencias en ladirección de las presentaciones en sincronía. Las diferencias para las puntuacionesde esos niños son las mas pequeñas, sus rangos son 1 y 4.

    La suma de los rangos positivos es T+  = 10+12+6+3+8+5+11+9+2+7=73. La tabla H

    muestra que con N=12 y T+=73, se debe rechazar la hipótesis nula en α=0.01 para una

    prueba bidireccional, puesto que el valor de tablas es (0.0024) y para una pruebabidireccional se duplica (0.0048). Se rechaza H0 en favor a H1 y concluimos que los niñosson capaces de discriminar entre la sincronía o asincronía en los movimientos de los labiosy los sonidos del habla.

    Muestras grandes. Cuando N es mayor que 15 la tabla H no puede utilizarse; sin embargo,la suma de los rangos T

    + se distribuye aproximadamente de manera normal con

    Media = µT+ = (N(N+1))/ 4

    Varianza = σ2T+ =(N(N+1)/4)(2N+1) / 24 y por tanto

    Z= (T+  - N(N+1)/ 4)/ √(N(N+1)(2N+1)/24) también se distribuye normal con media cero y

    varianza uno. Así la tabla A puede utilizarse para encintrar la probabilidad asociada a losvalores extremos de z, calculada mediante la ecuación cuando H0 es verdadera.

    Ejemplo para muestras grandes: Los internos de una prisión federal sirvieron como sujetosen un estudio de toma de decisiones, primero se midió de manera individual la utilidad de

    los cigarrillos para los reclusos (valor subjetivo), ya que los cigarrillos son el objeto masnegociado en las prisiones. Haciendo uso de la función de utilidad de cada sujeto, elinvestigador intento predecir las decisiones que cada hombre haría en un juego donderepetidamente tendría que escoger entre dos pociones y en las cuales pudiera perder oganar cigarrillos.

    La hipótesis evaluada fue que los investigadores podrían predecir las decisiones de lossujetos en términos del valor de utilidad, en lugar de suponer que la utilidad de loscigarrillos es equivalente al valor objetivo de los mismos y, por tanto predecir la elecciónracional en términos del valor objetivo. Esta hipótesis fe confirmada; sin embargo, algunasrespuestas no se predijeron con éxito, por la hipótesis de maximización de la utilidadesperada. Los investigadores habían conjeturado que tales errores en la predicción sedeberían a la probable indiferencia de los sujetos hacia las dos opciones disponibles, esto

    es, un recluso podía encontrar igualmente atractivas ambas opciones o no parecerleatractiva ninguna y por tanto, ser indiferente a la elección entre ambas opciones. Taleselecciones (de indiferencia) son difíciles de predecir. Pero en tales casos, se razono que elsujeto vacilara en plantear una apuesta y tardaría más en decidir, la latencia entre elofrecimiento de las opciones y el aceptar alguna de ellas seria mayor, la segunda hipótesisfue que las latencias o tiempos de respuesta que no se predijeran satisfactoriamente por lamaximización de la utilidad esperada, serian mayores que las elecciones predichas conéxito.

    Reclusos D Rango de d

    1 -2 -11.5

    2 0 -

    3 0 -

    4 1 4.55 0 -

  • 8/19/2019 Metodos de Estadistica No Parametrica

    22/26

      22

    6 0 -

    7 4 20

    8 4 20

    9 1 4.5

    10 1 4.5

    11 5 23

    12 3 16.513 5 23

    14 3 16.5

    15 -1 -4.5

    16 1 4.5

    17 -1 -4.5

    18 5 23

    19 8 25.5

    20 2 11.5

    21 2 11.5

    22 2 11.5

    23 -3 -16.5

    24 -2 -11.525 1 4.5

    26 4 20

    27 8 25.5

    28 2 11.5

    29 3 16.5

    30 -1 -4.5

    i. Hipótesis nula. H0: no hay diferencia entre las latencias de las decisiones predichascorrectamente y las predichas incorrectamente. H1: las latencias de las eleccionespredichas incorrectamente serán mayores que las predichas correctamente.

    ii. Prueba estadística. Puesto que los datos representan las diferencias entrepuntuaciones de dos muestras relacionadas (decisiones predichas correctamente y

    decisiones predichas incorrectamente en el mismo recluso), donde cada sujetosirve como su propio control.

    iii. Nivel de significación. α=0.01 y N es el numero de reclusos que sirvieron comosujetos (se puede reducir si se encuentran empates).

    iv. Distribución muestral. Cuando H0  es verdadera, los valores calculados de zmediante una distribución normal, así la tabla A proporciona la probabilidadasociada a la ocurrencia según H0 de valores extremos como la z obtenida.

    v. Región de rechazo. Puesto que se predice la dirección, la prueba es unidireccionalT

    +, la suma de los rangos positivos será la suma de los rangos de los reclusos

    cuyas diferencias se encuentran en la dirección predicha. La región de rechazoconsiste en todos los valores de z (obtenidos de T

    +) tan extremos como la

    probabilidad asociada cuando H0  es verdadera cuyo valor es igual o menor queα=0.001. 

    vi. Decisión. Las diferencias para cada sujeto se calcularon restando su tiempopromedio en tomar la opción correctamente predicha (Y i) del tiempo promedio entomar la opción incorrectamente predicha (Xi) (di  =Xi  - Yi). Aplicando la ecuacióntenemos:

    Z= (298 – (26)(27)/4) / √((26)(27)(53)/24 ) = 3.11, notemos que N = 26, la tabla A muestra queel valor de z tiene una probabilidad asociada cuando H0 es verdadera de 0.0009, en vista deque es menor a α=0.01, entonces el valor de z esta en la zona de rechazo, y nuestra decisiónes rechazar H0  en favor de H1. Se concluye que las latencias para las decisionesincorrectamente predichas fueron significativamente mayores que las latencias de lasdecisiones correctamente predichas.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    23/26

      23

    5. Dos muestras independientes

     Al estudiar las diferencias entre dos grupos, primero debemos determinar si ambos gruposestán relacionados o si son independientes. Aunque los meritos para utilizar dos muestrasrelacionadas o pares replicados en un diseño de investigación son grandes, hacerlo no siemprees factible. A menudo la naturaleza de la variable dependiente impide la utilización de sujetos

    como su propio control, como es el caso cuando la variable dependiente es la cantidad detiempo que pasa un sujeto resolviendo un problema desconocido. Un problema puede serdesconocido solo una vez. Además, puede resultar imposible diseñar un estudio que utilicepares igualados, tal vez por la incapacidad del investigador de descubrir variables para igualar,o por su incapacidad para obtener medidas adecuadas de algunas variables que se sabe queson relevantes o no siempre es posible realizar buenas igualaciones.

    Cuando el uso de dos muestras relacionadas no es factible o apropiado, se puede utilizar dosmuestras independientes, las dos muestras deben ser obtenidas por uno de los siguientes dosmétodos:

    1. Puede obtenerse al azar de dos poblaciones2. Puede originarse asignando al azar un sujeto a uno de los dos tratamientos de los

    miembros de una misma muestra cuyo origen sea arbitrario.

    En cualquiera de los dos casos, no es necesario que las muestras sean del mismo tamaño. Unejemplo del muestreo al azar de dos poblaciones seria obtener cada décimo republicano y cadadécimo demócrata de las listas de orden alfabético de los votantes registrados en EU. Estoresultaría en una muestra al azar de los demócratas y republicanos registrados en sus áreas devotación cubiertos en las listas y el número de demócratas seria igual al de republicanos, solosi el registro de ambos partidos fuera sustancialmente igual en cada área. Otro ejemplo, seriala obtención de cada estudiante de nuevo ingreso por cada duodécimo estudiante del tercergrado del mismo colegio.

    Un ejemplo del método de asignación al azar podría ocurrir en un estudio de la efectividad dedos instructores en la enseñanza del mismo curso, se obtendría una tarjeta de registro de los

    estudiantes inscritos en el curso y la mitad de esas tarjetas serian asignadas al azar, a uninstructor y la otra mitad se asignaría al otro instructor.

    La técnica paramétrica usual para analizar los datos de dos muestras independientes consisteen aplicar una prueba de t a las medias de los dos grupos. La prueba t supone que laspuntuaciones en las muestras son observaciones independientes de poblaciones normalmentedistribuidas con las mismas varianzas, la prueba supone además que las observacionescorresponden, al menos, a una escala de tipo intervalo.

    Para un tipo de investigación dado, la prueba t puede no ser aplicable por una variedad derazones, el investigador debe encontrar:

    1. que los supuestos de la prueba t no sean aplicables a sus datos

    2. que prefiere evitar hacer suposiciones y así dar a sus conclusiones mayor generalidad3. que las puntuaciones no sean numéricas y realmente, no cubran los requisitos de las

    mediciones para la prueba t.

    En casos como estos, el investigador debe analizar los datos de las pruebas estadísticas noparamétricas para dos muestras independientes.

    5.1 Tablas de contingencia de 2x2

    Tal vez el mas común de los usos de la prueba ji cuadrada sea el de evaluar si un conjunto defrecuencias observadas en la tabla de contingencia de 2x2 pudieran ocurrir siendo H 0 verdadera. La prueba X

    2 se aplica con la siguiente ecuación:

    X2 = (N(│AD - BC│ - N/2)2)/ (A+B)(C+D)(A+C)(B+D) con 1 grado de libertad

  • 8/19/2019 Metodos de Estadistica No Parametrica

    24/26

      24

    Ejemplo: En un estudio realizado a los ex fumadores como sujetos, Shiffman recolecto losdatos durante las crisis producto de las recaídas, las crisis de recaída incluyen el periodo actualde abstinencia y las situaciones en las cuales era inminente un periodo de abstinencia, peroque fue evitado con éxito. Estos episodios críticos fueron recolectados a través de llamadasque los ex fumadores realizaban en el momento de la crisis. Varios datos se recolectaron,incluida la estrategia utilizada en un intento de evitar la recaída. Las estrategias de

    afrontamiento se categorizaron como conductuales (abandonar la situación) o cognoscitivas(revisar las razones por las cuales la persona había decidido dejar de fumar). Algunos sujetosdijeron haber utilizado una clase de estrategia de afrontamiento, otra información que habíanempleado ambas clases de estrategias y otros más refirieron no haber usado ninguna de lasdos. La hipótesis fue que la utilización de estrategias de afrontamiento diferiría entre aquellasque fueron exitosas y aquellas que no lo fueron en cuanto a evitar la recaída.

    Grupo de resultados

     Afrontamiento Fumaron No fumaron Combinación

    Conductual 15 24 39

    Cognoscitivo 15 21 36

    Cognoscitivo yconductual

    13 43 56

    Ninguno 22 6 28

    Otra variable registrada, es el consumo o no de alcohol era un factor durante la crisis derecaída. A los sujetos se les pregunto si consumieron alcohol antes de la crisis o durante sutranscurso. La hipótesis fue que el consumo de alcohol estaba relacionado con el hecho de queel sujeto recayera o se abstuviera durante la crisis.

    Grupos de resultados

    Consumo dealcohol

    Fumaron No fumaron Combinación

    Si 20 13 33

    No 48 96 144

    i. Hipótesis nula. H0: el consumo de alcohol no esta relacionado con el resultado dela crisis. H1: el consumo de alcohol esta relacionado con el éxito o el fracaso enabstenerse durante la crisis.

    ii. Prueba estadística. Puesto que ambas variables (grupo y consumo de alcohol) sonnominales (categóricas) y ya que las medidas son mutuamente excluyentes yexhaustivas, es apropiada la prueba ji cuadrada, puesto que ambas variables sonde naturaleza dicotómica, puede emplearse la prueba ji cuadrada para tablas de2x2.

    iii. Nivel de significación. α=0.01 y N es el numero de sujetos que respondieron = 177. iv. Distribución muestral. La distribución muestral de X

    2 determinada por la ecuación ji

    cuadrada con 1 gl.v. Región de rechazo. La región de rechazo para este ejemplo consta de todos los

    valores de X2  para los cuales la probabilidad de observar un valor tan grande o

    mayor cuando H0 es verdadera, sea menor que α=0.01 vi. Decisión. Se resume en que 20 de las 68 personas que sufrieron una recaída

    (29%) consumieron alcohol durante la crisis y 13 de las 109 (12%) que no sufrieronde recaída, no consumieron alcohol durante la crisis. Se calculo el valor de X

    donde

    X2 = (177(│(20)(96) – (13)(48)│ - 177/2)2)/ (33)(144)(68)(109) = 7.33

     Al hacer referencia a la tabla C, esta muestra que X2 ≥ 7.33 con 1 gl, tiene una probabilidad de

    ocurrencia cuando H0 es verdadera, menor que 0.01. Puesto que el valor observado de X2 

    excede el valor critico de 6.64, rechazamos la hipótesis de que el consumo de alcohol no tieneefecto en la recaída o abstinencia durante una crisis relacionada con dejar de fumar.

  • 8/19/2019 Metodos de Estadistica No Parametrica

    25/26

      25

    5.2 Partición de los grados de libertad en tablas de rx2

    Una vez que el investigador determina que el valor de X2  para una tabla particular de

    contingencia es significativo, debe saber si existe una diferencia entre los dos grupos donde fuemedida la variable; sin embargo, puede no saber donde se dieron esas diferencias, puesto quelas variables medidas pueden tomar distintos valores, es posible que la diferencia se refleje por

    algunos valores y no por otros. La pregunta de donde se encuentran las diferencias en la tablade contingencia puede contestarse al dividir la tabla de contingencia en subtablas y analizarcada una de ellas. Se podría considerar construir un cierto número de subtablas de 2x2 que seanalizarían mediante la prueba exacta de Fisher; sin embargo, tales tablas no sonindependientes e interpretarlas resulta difícil. Afortunadamente es posible construir subtablasde 2x2 que sean independientes, las cuales son interpretables construyéndolas según elmétodo. El método de construir tablas es relativamente sencillo y se comprende mejormediante los ejemplos que siguen:

    Cada una de estas tablas tiene un grado de libertad, para probar la independencia entre losdos grupos, la X

    2 debe ser modificada para reflejar que son subtablas obtenidas de una tabla

    mayor y reflejar también las características de la muestra total. Las formulas de particiones son:

    X2

     = (N2

    (n22n11  – n21n12)2

    ) / (C1C2R2R1(R1+R2))

    =(N(n32(n11+n21) – n31(n12+n22)2) / (C1C2R3(R1+R2))

    Cada uno de estos estadísticos X2 se distribuye como ji cuadrada con un grado de libertad.

    n11  n12  R1 n21  n22  R2 

    C1  C2  NParticiones aditivas para una tabla de contingencia de 3x2

    Ejemplo: En el ejemplo de ex fumadores descrito y resumido, se detecto que existían

    diferencias significativas en las conductas de afrontamiento entre aquellos que fumaron y losque no fumaron en sus crisis de recaídas. Seria deseable determinar cuales de las conductasresultaron efectivos durante la crisis, para determinar esto, dividimos la X

    2 obtenida, puesto que

    los grados de libertad son 3, existe la probabilidad de realizar tres particiones. El examen de losniveles de las variables sugiere las particiones más provechosas.

    La primera partición contrasta los dos tipos de afrontamiento cuando se emplearonindividualmente, afrontamiento