40
ESTADISTICA APLICADA ECON. SOLEDAD MALPICA

Prueba de los signos

Embed Size (px)

DESCRIPTION

La prueba de los signos es una herramienta útil para hacer pruebas de hp cuando nos encontramos casos como la muestra es pequeña y tenemos datos cualitattivos.

Citation preview

ESTADISTICA APLICADA

ECON. SOLEDAD MALPICA

PRUEBA DE LOS SIGNOS

PRESENTACION

INTRODUCCION

CONOCIMIENTOS PREVIOS

PRUEBA DE LOS SIGNOS

CONCLUSION

En las

investigaciones que

realizamos

contamos con una

muestra que nos

permite extraer

(medir) datos para

luego afirmar (o

negar) alguna

característica que

posteriormente la

extenderemos a la

población

De esta manera podemos hacer una

afirmación , por ejemplo que el 70%de los

empresarios leen El Comercio, basados en un

estudio y análisis donde la muestra debe

tener ciertos requerimientos, en especial

cuando estas son cuantitativas.

Pero que pasa cuando el tamaño de la

muestra que queremos analizar es pequeña,

como cuando queremos analizar a los

trabajadores de una pequeña empresa.

Que pasa cuando queremos medir ya no

unos datos cuantitativo sino cualitativo,

como sexo, o alternativas como: bueno,

regular y malo, o un grado: superior,

intermedio e inferior

La estadística no

paramétrica:

1.- Por lo general, son

fáciles de usar y

entender.

2.- Eliminan la

necesidad de

suposiciones

restrictivas de las

pruebas paramétricas.

3.- Se pueden usar con

muestras pequeñas.

4.- Se pueden usar con

datos cualitativos.

Muchas aplicaciones de negocios involucran

opiniones o sentimientos y esos datos se

usan de manera cualitativa. La Estadística

no paramétrica nos facilita el estudio de

estos casos.

Las pruebas

no

paramétricas

son pruebas

estadísticas

que no hacen

suposiciones

sobre la

constitución

de los datos

de la

población.

Por lo general,

las pruebas

paramétricas

son mas

poderosas que

las pruebas no

paramétricas

y deben

usarse

siempre que

sea posible.

Es importante observar, que aunque las

pruebas no paramétricas no hacen

suposiciones sobre la distribución de la

población que se muestrea, muchas veces se

apoyan en distribuciones muestrales como la

normal o la ji cuadrada.

1.- A veces, ignoran, desperdician o pierden

información.

2.- No son tan eficientes como las

paramétricas.

3.- Llevan a una mayor probabilidad de no

rechazar una hipótesis nula falsa

(incurriendo en un error de tipo II).

Ventajas y Desventajas

No tiene requisito previo (ventaja)

Con “n” pequeña (menor de 30) puede no haber

alternativa

Se necesita transformar los valores en rangos

(desventaja)

Rango: valor arbitrario del orden del dato en el

conjunto

Con “n” grande es menos potente que la

paramétrica

Con “n” muy pequeña es inconsistente; no

tabulada (n mayor de 5-6)

A veces es compleja; no aparece siempre en

programas informáticos estándar (desventaja),

pero suele ser más sencilla de aprender y aplicar

incluso ser más directa.

La Mediana 14

Se ha utilizado la media para distribuciones

como la normal y la binomial.

En la estadística no paramétrica el

parámetro de posicionamiento hacia el

centro de la distribución de mayor utilidad

es la Mediana y como medida de dispersión

el Rango o alguna variante de éste.

Una característica importante es que la

distribución de datos debe corresponderse

con el Orden Estadístico. Esto es, con el

número que tiene una variable en un

conjunto de datos ordenados

ascendentemente.

Factoriales

Un factorial se designa con un

número natural positivo seguido

por un signo de exclamación (es

decir 8!). El valor de un factorial

es el producto de todos los

números desde 1 hasta el

número del factorial. Por

ejemplo:

8! = 1*2*3*4*5*6*7*8 = 40,320.

Los factoriales se utilizan para

determinar las cantidades de

combinaciones y permutaciones

y para averiguar probabilidades.

http://www.aaamatematicas.com/sta-factorial.htm

Calculando un factorial cuando se conoce el

valor anterior

Si 9! = 362 880. Entonces:

10! = 10 x 9!

10! = 10 x 362 880 = 3 628 800

http://www.disfrutalasmatematicas.com/numeros/factorial.html

Numero combinatorio

Se tiene un conjunto con 6 objetos

diferentes {A,B,C,D,E,F}, de los cuales se

desea escoger 2 (sin importar el orden de

elección). Existen 15 formas de efectuar

tal elección:

6

Así 2 = 15

Puesto que hay 15

formas de escoger

2 objetos a partir

de un conjunto con

6 elementos

http://es.enc.tfode.com/N%C3%BAmeros_Combinatorios

Pruebas No paramétricas para una

sola muestra

Prueba de los Signos

Se usa para hacer pruebas de

hipótesis acerca de la mediana de

una población.

Ho: La Mediana poblacional es igual

a un valor dado.

Ha: La mediana es menor (mayor ó

distinta) del valor dado.

La prueba estadística está basada en la

distribución Binomial con probabilidad de

éxito p=½, puesto que la probabilidad de

que un dato sea mayor o menor que la

mediana es ½. Para calcularla se

determinan las diferencias de los datos con

respecto al valor dado de la mediana y se

cuentan los signos positivos y negativos.

Ejemplo

Los tiempos de sobrevivencia (en años) de

12 personas que se han sometido a un

trasplante de corazón son los siguientes:

3.1 .9 2.8 4.3 .6 1.4 5.8 9.9 6.3

10.4 0 11.5

Probar con 95% de confianza si los datos del

tiempo de vida después del trasplante

sugieren que la mediana sea distinta de 5.

3,1

0,9

2,8

4,3

0,6

1,4

5,8

9,9

6,3

10,4

0

11,5

El valor 0 nos esta

indicando que la persona no

salió vivo de la operación, el

que vivió más tiempo fue de

11.5 años.

Trasladamos los datos

en una tabla, se debe

observar que personas

con un trasplante de

corazón no es una

muestra que puedes

obtener al azar, por

ello utilizamos la

estadística no

paramétrica.

Proponemos que la mediana es

5, se calculan las diferencias

contra el valor de prueba (cada

dato menos 5).

El resultado de restar las

observaciones menos la

mediana (-5) nos arrojará tanto

números positivos como

negativos.

En el caso de salir 0 hay que

obviar esa observación o dato.

Como el resultado no arroja

ningún cero debemos considerar

todos los datos (12)

3,1 -5 -1,9

0,9 -5 -4,1

2,8 -5 -2,2

4,3 -5 -0,7

0,6 -5 -4,4

1,4 -5 -3,6

5,8 -5 0,8

9,9 -5 4,9

6,3 -5 1,3

10,4 -5 5,4

0 -5 -5

11,5 -5 6,5

3,1 -5 -1,9 (-)

0,9 -5 -4,1 (-)

2,8 -5 -2,2 (-)

4,3 -5 -0,7 (-)

0,6 -5 -4,4 (-)

1,4 -5 -3,6 (-)

5,8 -5 0,8 (+)

9,9 -5 4,9 (+)

6,3 -5 1,3 (+)

10,4 -5 5,4 (+)

0 -5 -5 (-)

11,5 -5 6,5 (+)

Ocupamos otra

columna solo para

señalar los signos,

sean estos positivos

(+) o negativos (-)

Así, para este caso,

tenemos 7 negativos

y 5 positivos.

Como tenemos 12

resultados debemos

evaluar los

resultados (de los

signos)7(-)

(5+)

La prueba se basa

en la distribución

binomial. Ya que

bien sale positivo o

negativo

Para ello podemos

usar la fórmula o

bien emplear una

herramienta de

software.

En este caso :

Probabilidad

binomial para

n= 12, p=0.5

Lo que deseamos saber es qué tan

acertado es encontrar , con 12 datos:

Que 12 sean positivos y 0 negativos

Que 11 sean positivos y 1 negativo

Que 10 sean positivos y 2 negativos

Que 0 sean positivos y 12 negativos

El primero y el ultimo son los valores

extremos y, tienen la misma probabilidad:

P(x=12) = P(x=0)

P(x =11) = P(x=1)

La función de probabilidad de la distribución

binomial, también denominada función de la

distribución de Bernoulli, es:

n es el número de pruebas.

k es el número de éxitos.

p es la probabilidad de éxito.

q es la probabilidad de fracaso.

El número combinatorio:

Si p = 0.5 entonces q= 0.5

Para trabajar con:

Debemos recordar que:

12! Es 12x11x10x9x8x7x6x5x4x3x2x1

También es: O:

12x11x10x9x8x7! 12x11!

Son diferentes formas de expresar lo mismo

pero que se puede usar de acuerdo a la

necesidad de relacionarla con otros valores

semejantes.

Recordemos que la formula es:

Para el caso de nuestro ejemplo:

n = 12

k = puede tomar valores de 0 a 12

p = 0.5

q = 05

Cual será la probabilidad de encontrar 12

positivos y 0 negativos o viceversa:

P(x = 12)= 12 0.5¹²x 0.5

12

P(12) = 12! 0.5¹²x 0.5

12! (12-12)!

P(12) = 0.0002

Hay que recordar que en el otro extremo

tenemos 0, y que ambos tienen el mismo

valor, por lo tanto:

P(x = 0) = 0.0002

Para verlo gráficamente,

tenemos que representar una

curva normal en el que se

presenta las 12

observaciones.

0.0002

0.0002

Hasta ahora solo se ha

encontrado la probabilidad

de encontrar 12 o 0 signos

positivos o negativos

Para:

P(x = 11)= 12 0.5¹¹x 0.5¹

11

P(11) = 12! 0.5¹¹x 0.5¹

11! (12-11)!

P(11) = 0.0029 = P(1)

0.0029

0.0029

Podemos seguir hallando las probabilidades

de que se presente otras combinaciones

como :

10 positivos y 2 negativos o viceversa

9 positivos y 3 negativos o viceversa

(…)

Lo recomendable es que se halle los

primeros de los extremos y solo uno de

ellos ya que en ambos lados los valores

son iguales.

La finalidad es probar si la mediana de la

muestra es diferente a la mediana de

prueba.

Esto implica que el valor de p (dentro del

95%) a 0 (Hipótesis nula).

Entonces α = 0.05 (5%)

Debemos sumar las

probabilidades de los extremos

pero no debemos pasarnos de

0.05.

Calculamos la suma de las probabilidades

de los extremos(“colas”) hasta llegar lo más

próximo a 0.05 y podemos ver que los

valores que nos interesan son 0,1,2 y 10,11

y 12

Sumando sus probabilidades,

0.0002+0.0029+0.016+0.016

+0.0029+0.0002=0.0382 nos acercamos a

0.05

Si usamos otro valor nos pasamos. Tiene

que ser por ambos lados

La zona de rechazo esta en los extremos

con los valores: 0,1,2 y 10,11,12

O sea que para que haya diferencia debe

haber 2 o menos o bien10 o más.

Como tenemos7 (-) y 5 (+) concluimos que

no hay diferencia con la mediana (no

podemos rechazar la hipótesis nula de que

no hay diferencia con la mediana).

Teníamos:

Ho: Me = 5

Ha: Me ≠ 5

Por lo tanto: aceptamos la Ho

Interpretación: Las personas que han sido

operadas del corazón tienen una mediana

del tiempo de vida que es de 5 años.

La prueba de los signos es una

herramienta muy útil y confiable, es de

fácil elaboración y permite realizar la

prueba de hipótesis respectiva.

GRACIAS