Upload
edson-arturo-quispe-sanchez
View
259
Download
1
Embed Size (px)
Citation preview
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
1/36
Aplicaciones de la DistribucinChi-Cuadrado
Ejemplos
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
2/36
Prueba de Bondad de Ajuste- Distribucin Binomial
Considere el siguiente caso. En la comercializacin demanzanas, una empresa exportadora envasemanalmente lotes de 50 cajas al exterior, cada caja
tiene un peso aproximado de 20 kilos. Las cajas sonpreviamente almacenadas. Para el control de calidad seexaminan al azar, si en alguna caja encuentran por lomenos una manzana malograda, esta es calificadamala. Para que pase el control mediante la inspeccinde la muestra no debe haber caja malograda, si soloexiste una caja esta ser cambiada, si hay mas de 1 enlas 5 inspeccionadas, inspeccionaran las cincuentacajas. Segn las estadsticas pasadas de un total de 40envos, registro lo siguiente: Se puede afirmar que lavariable numero de cajas malogradas en la muestra de 5sigue una distribucin binomial?.
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
3/36
Solucin:
H0: La variable numero de cajas sigue una distribucin
Binomial.Ha: No siguen una binomial.
Riesgo 0.10
Estimacin de parmetros.En este caso n=5 y p es la probabilidad de encontraruna caja malograda que es desconocida, pero
se supone constante a travs del proceso de control de
calidad.Estimacin de p.
Promedio (x) = np
Promedio ponderado = (0x6++5x1) /40 = 1.775p estimado es: 1.775/ 5 = 0.355
Con estos resultados se procede a los clculos de losvalores esperados, Bajo la hiptesis planteada, que la
variable X es binomial, los valores observados yesperados serian:
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
4/36
X
FrecuenciasObservadas pi
FrecuenciasEsperadas Reagrupadas (Oi-El)2/Ei
0 6 0,1116 4,4654
1 13 19 0,3072 12,2885 16,7538 0,3011
2 10 10 0,3382 13,5268 13,5268 0,9195
3 7 11 0,1861 7,4450 9,7193 0,1687
4 3 0,0512 2,0488
5 1 0,0056 0,225540 40 1,3894
Valor Chi Cuadrado (3-1-1)=1 g.l 2,70554397
Hay evidencia , para afirmar que los datos se ajustan a ladistribucin binomial: Binomial (n=5 , p=0.355)
5...,2,1,0:)645.0()355.0()( 55 xCxXP xxx
==
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
5/36
Prueba de Independecia
Ejemplo El consejo de administracin de
Telefnica desea conocer si la opinin, Y,de sus accionistas respecto a una posible
fusin es independiente del nmero de
acciones, X, que poseen. Una muestra de
500 accionistas proporciona la siguiente
tabla:
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
6/36
Menos de 200 25 18 21 64
200-1000 93 62 67 222
Ms de 1000 82 70 62 214
Total 200 150 150 500
Total
OpininNmero de
Acciones A favor En contra Indecisos
Contrastar a un nivel de confianza del 99,5% la independencia de lasvariables Nmero de Acciones y la Opinin. La poblacin en estudio
son los accionistas de Telefnica y deseamos ver si existedependencia entre el nmero de acciones y la opinin acerca de unaposible fusin.Se trata de un test no paramtrico donde las hiptesis nula y
alternativa son:
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
7/36
Ho: Nro de Acciones y Opinin son independientesH1: Nro de Acciones y Opinin son dependientes
El nivel de confianza es 1- = 0,95, luego = 0,05 y el tamaomuestral n=500
Calculamos los valores esperados eij bajo la hiptesis nula(independencia de X e Y) aplicando la frmula
donde n es el tamao de la muestra, 500.Por ejemplo e11=64.200/500=25,6 e12=64.150/500=19,2
La tabla de los valores esperados sera:
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
8/36
Menos de 200 25,6 19,2 19,2 64
200-1000 88,8 66,6 66,6 222
Ms de 1000 85,6 64,2 64,2 214
Total 200 150 150 500
Nmero de
AccionesOpinin
A favor En contra Indecisos Total
El valor del estadstico experimental vale:
=c
c
El valor del punto crtico es el valor de una chi-cuadrado con (3-1).(3-1)= 4 grados de libertad y 1-alfa =0,95 Tabla Chi-Cuadrado con 4 g.l. da:
X20.95(4)= 9.48 La regin crtica es, es decir, rechazamos Ho si: ValorChi-Cuadrado Calculado es mayor a 9.48; Como = 1,53 es menor que 14,86se acepta Ho y podemos decir que no tenemos evidencias de que Nro de Acciones yla Opinin sean dependientes y se acepta la hiptesis de que la opinin de losaccionistas es independiente del nmero de acciones que poseen con un riesgo del0,5%.
05.053.1500
53.12
2
=+
=+
=
nC
Coeficiente de Contingenciatiende a 0 No hay relacin
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
9/36
Prueba de Igualdad de proporcionesEn un estudio de un taller, se rene un conjunto de datos para
determinar si la proporcin de defectuosos producida por los
trabajadores es la misma para el turno matutino, vespertino o
nocturno. Se reunieron los siguientes datos:
Matutino Vespertino Nocturno
Defectuosos 45 55 70
No defectuosos 905 890 870
Utilice un nivel de significancia de 0.025 para determinar si la
proporcin de defectuosos es la misma para los tres turnos.
Ho: La proporcin de artculos defectuosos es la misma para los tres
turnos.
Ha: La proporcin de artculos defectuosos no es la misma para los tres
turnos.
===
unaaH
ppppH
a
NVM
lg:
:0
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
10/36
Alfa= 2.5%
Matutino Vespertino NocturnoTotal
Defectuosos45
(57.0)
55
(56.7)
70
(56.3)
170
No defectuosos 905(893.0) 890(888.3) 870(883.7)
2665
Total 950 945 940 2835
Se acepta
Ho : la
proporcin
de defectos
es la misma
en los tres
turnos
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
11/36
EjercicioSe est estudiando el problema vehicular que impera en una ciudad.
Con los diversos datos de un ao que se han recolectado, se ha
resumido la siguiente informacin, respecto a los accidentes deacuerdo a la gravedad de los accidentes y al tipo de vehculo de
servicio:
Combi Tico Micro
Gravedad 1 92 106 87
Gravedad 2 17 14 15
Gravedad 3 6 10 3
a)Entre que valores podra usted decir, con un nivel de confianza del
95%, que se encuentra la proporcin de accidentes de gravedad 1
que se producen en las combis?
b)Hay razones para afirmar que las proporciones de accidentessegn tipo de vehiculo son las mismas?
c)Hay razones para afirmar que la proporcin de veces en las cuales
el accidente es de gravedad 2, no es igual para todos los vehculos?
Use = 0.05.
d)Puede afirmarse que el tipo de accidentes es independiente deltipo de vehculo? Use = 0.05
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
12/36
PRUEBA DE KOLMOGOROV-SMIRNOV
HiptesisHo: La distribucin observada se ajusta a la distribucin terica.
F(x) = Ft(x) para todo x.
H1: La distribucin observada no se ajusta a la distribucin terica.
Tambin:
F(x) Ft(x) para algn x
F(x): es funcin desconocidaFt(x): es la funcin terica. Esta puede ser por ejemplo la funcinnormal con cierta media y varianzas conocidas.
Estadgrafo y distribucin muestral
)()( xSxFMxD nt =
Sn(x): es la funcin de distribucin emprica
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
13/36
Ejemplo
Las puntuaciones obtenidas por una muestra de
sujetos en una prueba de habilidad han sido lassiguientes:
48,1; 47,8; 45.1; 46,3; 45,4; 47,2; 46,6; y 46.
Sabiendo que la media en dicha prueba es 40 y
su desviacin tpica es 3, podemos afirmar
que la distribucin de las puntuaciones sigueuna normal, con un = 0,01?
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
14/36
Datos Datos OrdenadosZ=(X-
40)/3ProbabilidadAcumulada S(n)
ProbabilidadAcumulada IF(x)-S(n)
48,1 45,1 1,7 0,125 0,955 0,830
47,8 45,4 1,8 0,25 0,964 0,714
45,1 46 2 0,375 0,977 0,602
46,3 46,3 2,1 0,5 0,982 0,482
45,4 46,6 2,2 0,625 0,986 0,361
47,2 47,2 2,4 0,75 0,992 0,242
46,6 47,8 2,6 0,875 0,995 0,120
46 48,1 2,7 1 0,997 0,003
Hiptesis:
H0: F (X) = Fs (X) de una N(, )
H1: F (X) ??? Fs (X) de una N(, )
Muestra: 8 observaciones indep.Se estandarizan las puntuaciones para poder trabajar con una N (0,1).
Para = 0,01 y n = 8 en la tala encontramos un valor de 0,543, por tanto, se rechaza H0
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
15/36
PRUEBAS NO PARAMETRICAS
Estos contrastes reciben el nombre de no paramtricos porque las
hiptesis contrastadas no hacen referencia a ningn parmetro
poblacional. Son comparables con los mtodos paramtricos
correspondientes a la diferencia de medias de dos o ms
distribuciones normales.
Para aplicar estos contrastes no es necesario especificar la
distribucin de probabilidad de la poblacin analizada ni que las
observaciones estn medidas en escala de intervalo. stas puedenpresentarse en una escala ordinal y en algunas ocasiones en una
escala nominal.
En general, los contrastes no paramtricos son menos potentes que
los paramtricos y, en consecuencia, ante la posibilidad de aplicarcualquiera de ellos siempre es preferible el paramtrico.Pruebas No Parametricas con SPSS
http://www2.uca.es/serv/ai/formacion/spss/Imprimir/19nparam.pdf
http://e-stadistica.bio.ucm.es/web_spss/results_ks.html
http://www2.uca.es/serv/ai/formacion/spss/Imprimir/19nparam.pdfhttp://www2.uca.es/serv/ai/formacion/spss/Imprimir/19nparam.pdf8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
16/36
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
17/36
Prueba de Signo La prueba del signo se utiliza para probar la hiptesis sobre la
mediana de una distribucin continua. La mediana de unadistribucin es un valor de la variable aleatoria X tal que laprobabilidad de que un valor observado de X sea menor o igual, o
mayor o igual, que la mediana es 0.5. Esto es, . Puesto que la distribucin normal es simtrica, la media de una
distribucin normal es igual a la mediana. Por consiguiente, laprueba del signo puede emplearse para probar hiptesis sobre la
media de una poblacin normal. Las hiptesis son:
Supngase que X1, X2, . . . , Xn es una muestra aleatoria tomada dela poblacin de inters.
Frmense las diferencias
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
18/36
Estadstico de prueba apropiado:
X: Nmero de estas diferencias que son positivas,
La prueba de la hiptesis nula es en realidad una prueba de queel nmero de signos positivos es un valor de una variablealeatoria binomial con parmetro P = . Puede calcularse un
valor P para el nmero observado de signos positivos Xdirectamente de la distribucin binomial. Al probar la hiptesis quese muestra al principio, se rechaza H0 en favor de H1 slo si laproporcin de signos positivos es suficientemente menor que (
o de manera equivalente, cada vez que el nmero observado designos positivos r+ es muy pequeo). Por tanto, si el valor Pcalculado
es menor o igual que algn nivel de significancia seleccionadopreviamente, entonces se rechaza H0 y se concluye que H1 esverdadera.
Para probar la otra hiptesis unilateral
)2/1/( 0 == pXXPValorP
)2/1/( 0 == pXXPValorP
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
19/36
Ejemplo
Un artculo informa cerca de un estudio en el que semodela el motor de un cohete reuniendo elcombustible y la mezcla de encendido dentro de uncontenedor metlico. Una caracterstica importante esla resistencia al esfuerzo cortante de la unin entre losdos tipos de sustancias. En la siguiente tabla semuestran los resultados obtenidos al probar 20
motores seleccionados al azar. Se desea probar lahiptesis de que la mediana de la resistencia alesfuerzo cortante es 2000 psi, utilizando
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
20/36
Observacin
Resistenciaal
esfuerzocortante
xi
Signo de ladiferencia
xi-2000
Observacin
Resistenciaal
esfuerzocortante
xi
Signo de ladiferencia
xi-2000
1 2158.70 + 11 2165.20 +
2 1678.15 - 12 2399.55 +
3 2316.00 + 13 1779.80 -
4 2061.30 + 14 2336.75 +
5 2207.50 + 15 1765.30 -
6 1708.30 - 16 2053.50 +
7 1784.70 - 17 2414.40 +
8 2575.10 + 18 2200.50 +
9 2357.90 + 19 2654.20 +
10 2256.70 + 20 1753.70 -
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
21/36
De la tabla se puede observar que el estadstico deprueba X = 14.
Regla de decisin:
Si el valor de P correspondiente a X=14 es menor oigual que =0.05 se rechaza H0.
Clculos: Puesto que X=14 es mayor que n/2=20/2=10, el valor
de P se calcula de
El valor p se calcula con la frmula de la distribucin
binomial:
)2/1/14(2)2/1/(2 0
==
==
pXPValorPpXXPValorP
Valor p supera el 5%
por lo tanto se acepta
Ho
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
22/36
Aproximacin a la NormalX: Nro de signos positivos
n
nXZ
5.0
5.0=
789.1205.0
)20(5.014=
=Z
Como 1.789 esta entre 1.96 y 1.96, no se rechaza H0 y se concluye
con un =0.05 que la mediana es de 2000 psi.
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
23/36
Prueba del Signo para Muestras Pareadas
Tambin se puede utilizar la prueba de signo paraprobar la hiptesis nula
para observaciones pareadas. Aqu se reemplaza cadadiferencia, di, con un signo ms o menos dependiendo si
la diferencia ajustada, di-d0, es positiva o negativa.Suponemos que las poblaciones son simtricas. Sinembargo, aun si las poblaciones son asimtricas sepuede llevar a cabo el mismo procedimiento de prueba,pero las hiptesis se refieren a las medianaspoblacionales en lugar de las medias.
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
24/36
Ejemplo: datos pareados
Una compaa de taxis trata de decidir si el uso dellantas radiales en lugar de llantas regulares con
cinturn mejora la economa de combustible. Seequipan 16 automviles con llantas radiales y semanejan por un recorrido de prueba establecido. Sincambiar de conductores, se equipan los mismos autos
con llantas regulares con cinturn y se manejan unavez ms por el recorrido de prueba. Se registra elconsumo de gasolina, en kilmetros por litro, de lasiguiente manera: Se puede concluir en el nivel designificancia de 0.05 que los autos equipados conllantas radiales obtienen mejores economas decombustible que los equipados con llantas regularescon cinturn?
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
25/36
Automvil
Llantas radialesLlantas con
cinturn
d
1 4.2 4.1 +2 4.7 4.9 -
3 6.6 6.2 +
4 7.0 6.9 +
5 6.7 6.8 -6 4.5 4.4 +
7 5.7 5.7 0
8 6.0 5.8 +
9 7.4 6.9 +10 4.9 4.9 0
11 6.1 6.0 +
12 5.2 4.9 +
13 5.7 5.3 +14 6.9 6.5 +
15 6.8 7.1 -
16 4.9 4.8 +
Al observar las diferencias
se ve que slo existe un
n=14, ya que se descartan
los valores de cero. Se tiene
X = 11
14.2145.0
)14(5.011=
=Z
Como 2.14 es mayor a 1.645 se rechaza H0 y se concluye con un = 0.05
que las llantas radiales mejoran la economa de combustible.
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
26/36
PRUEBA DE SUMA DE RANGOS DE WILCOXON
Cuando se trata de variables medibles en por lo menosuna escala ordinal y pueden suponerse poblaciones
contnuas la prueba no paramtrica ms potente es lade Wilcoxon.
La hiptesis nula del contraste postula que las muestras
proceden de poblaciones con la misma distribucin deprobabilidad; la hiptesis alternativa establece que haydiferencias respecto a la tendencia central de laspoblaciones y puede ser direccional o no.
El contraste se basa en el comportamiento de lasdiferencias entre las puntuaciones de los elementos decada par asociado, teniendo en cuenta no slo el signo,sino tambin la magnitud de la diferencia.
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
27/36
EjemploLos siguientes datos representan el nmero de horas que un compensador
opera antes de requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0,
1.2 y 1.7. Utilice la prueba de rango con signo para probar la hiptesis en el
nivel de significancia de 0.05 que este compensador particular opera con una
media de 1.8 horas antes de requerir una recarga.
Prueba de Wilcoxon: Una Muestra
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
28/36
Prueba de Wilcoxon: Una Muestra
Dato di = dato - 1.8 Rangos
1.5 -0.3 5.5
2.2 0.4 7
0.9 -0.9 10
1.3 -0.5 8
2.0 0.2 3
1.6 -0.2 3
1.8 0 Se anula
1.5 -0.3 5.5
2.0 0.2 3
1.2 -0.6 9
1.7 -0.1 1
8.1:
8.1:0
=
aH
H
Para n = 10, despus de descartar la
medicin que es igual a 1.8, la tabla
muestra que la regin crtica es w
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
29/36
Prueba de Wilcoxon: Dos Muestras Relacionadas
Se afirma que un estudiante universitario de ltimo ao puedeaumentar su calificacin en el rea del campo de su especialidaden al menos 50 puntos si de antemano se le proporcionan
problemas de muestra. Para probar esta afirmacin, se dividen 20estudiantes del ltimo ao en 10 pares de modo que cada partenga casi el mismo promedio de puntos de calidad general ensus primeros aos en la universidad. Los problemas y respuestasde muestra se proporcionan al azar a un miembro de cada par
una semana antes del examen. Se registran las siguientescalificaciones del examen.
Pruebe la hiptesis nula en el nivel de significancia de 0.05 deque los problemas aumentan las calificaciones en 50 puntos
contra la hiptesis alternativa de que el aumento es menor a 50puntos.
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
30/36
Par
Conproblemasdemuestra
Sinproblemasdemuestra
di di d0 Rangos
1 531 509 22 -28 5
2 621 540 81 31 6
3 663 688 -25 -75 9
4 579 502 77 27 3.5
5 451 424 27 -23 2
6 660 683 -23 -73 8
7 591 568 23 -27 3.5
8 719 748 -29 -79 10
9 543 530 13 -37 7
10 575 524 51 1 1
50:
50:
211
210
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
31/36
Prueba de Mann-Whitney (comparacin de dos grupos independientes)
Es la prueba no paramtrica paralela a la t de dos grupos independientes
Pasos:1. pasar las puntuaciones a rangos (conjuntamente en los dos grupos)
2. computar la suma de los rangos del grupo 1
Muestras pequeas (n1 y n2 20)
(U es la suma de los rangos asignados a la muestra 1)
Muestras grandes
Hay tablas para este caso de
muestras pequeas; en todocaso, si la muestra es
relativamente grande, se puede
efectuar la aproximacin a la
distribucin normal
La hiptesis nula es que no haya diferencias entre los dos grupos
Ejemplo
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
32/36
Un experimentador utiliza dos mtodos para
ensear a leer a un grupo de 10 nios de 6aos, quienes ingresan por primera vez a la
escuela. El experimentador quiere demostrar
que el procedimiento ideado por l es msefectivo que el tradicional; para ello, mide el
desempeo en la lectura en funcin de la
fluidez, comprensin, anlisis y sntesis.
Hiptesis nula (Ho). Las diferencias observadas entre las calificacionesde ejecucin de lectura mediante los dos mtodos se deben al azar.
Hiptesis alterna (Ha). Las calificaciones de ejecucin de lectura, segnel mtodo de enseanza del experimentador son ms altas y diferentes
que las observadas en el mtodo tradicional.
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
33/36
Dos mtodos diferentes aplicados en dos grupos de nios.
Aplicacin de la prueba estadstica:
de acuerdo con los paso, las observaciones se deben ordenar en rangos
del menor al mayor.
Poblacin de nios de 6 aos a los cuales se les aplic dos mtodos de enseanza.
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
34/36
Prueba de Kruskal Wallis (comparacin de "a" grupos independientes)
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
35/36
Prueba de Kruskal-Wallis (comparacin de a grupos independientes)
Es la prueba no paramtrica paralela a la F unifactorial entre-sujetos
Pasos:1. pasar las puntuaciones a rangos (conjuntamente en los "a" grupos)
2. computar la suma de los rangos en cada grupo (son las Rj)
Estadstico de contraste
H =12
N (N + 1)
R j2
n j
3 (N + 1)
Si la Hiptesis nula es cierta (es decir, que no haya diferencias entre los grupos),H se distribuye segn chi-cuadrado con a-1 grados de libertad
Observa que se puede aplicar esta prueba cuando no se
cumplan los supuestos de homogeneidad de varianzas ni elde normalidad del ANOVA unifactorial entresujetos.
Combi Tico Micro
8/8/2019 Aplicaciones de la Distribucin Chi-Cuadrado
36/36
Combi Tico Micro
92 106 87
17 14 15
6 10 3
===
MTc
MTco
H
H
:
:
1
Rangos
3 5,33
3 5,33
3 4,33
9
tipo
combi
Taxi
Micro
Total
Accidentes
N
Rango
promedio
Estadsticos de contrastea,b
,267
2
,875
Chi-cuadrado
gl
Sig. asintt.
Accidentes
Prueba de Kruskal-Wallisa.
Variable de agrupacin: tipob.
Se concluye que el nmero de
accidentes promedio no difiere
segn tipo de auto