Upload
jota-de-copas
View
487
Download
5
Embed Size (px)
Citation preview
1
PRUEBA DE HIPÓTESIS
UNIV
ERSI
DAD
NACI
ONAL
DE
INGE
NIER
ÍAEs
cue la
Pr o
f esi o
nal d
e Ing
e nie r
ía Es
tadí
s tic a
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Prueba del Ratio de Verosimilitud
Ho: θ∈ Ωo
H1: θ∈ Ω1
Teorema
Si Ω1⊂ Rq es un espacio q-dimensional y si Ωo⊂ Ω1 es un subespacio r-dimensional, entonces, bajo condiciones de regularidad:
∀θ∈Ωo: -2logλ → χ2(q-r) cuando n →∞
Región de rechazo R:
R = {X: -2log λ(X)> χ21-α;(q-r) }
2
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Hipótesis (A)
Ho: μ=μo ; Σ conocido
-2logλ = n( x - μo )’ Σ-1 ( x - μo ) ~ χ2(p)
Rα
χ2(p)
Sea x1, x2, …, xn una muestra aleatoria independiente e identicamente distribuida de una población Np(μ, Σ)
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Hipótesis (B)
Ho: μ=μo ; Σ desconocido
-2logλ = nlog( 1 +d’S-1d)
((n-p)/p)d’S-1d ~ F(p, n-p)Se sabe que:
Prueba de T2 de Hotelling para una muestra
d = x - μo
Sea x1, x2, …, xn una muestra aleatoria independiente e identicamente distribuida de una población Np(μ, Σ)
3
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Hipótesis (C)
Ho: Σ= Σ o ; μ desconocido
Estimadores Máximo Verosímiles
Ho verdaderoH1 verdadero
μ = x y Σ = Σoμ = x y Σ = S
-2logλ = np ( a – log g - 1) ~ χ2(m)
m = p ( p + 1 )
2g = ( Πλi )1/p a = Σ λi / p
Sea x1, x2, …, xn una muestra aleatoria independiente e idénticamente distribuida de una población Np(μ, Σ)
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
HIPÓTESIS LINEALES
4
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Sea x1, x2, …, xn una muestra aleatoria independiente e identicamente distribuida de una población Np(μ, Σ)
Hipótesis Lineales I (D)
Ho: Aμ = a ; Σ conocido
donde A(qxp) y a(qx1) q≤p son conocidos
Si Ho es verdadera:
n( Ax – a )’( AΣA’)-1( Ax – a ) ~ χ2(q)
Se rechaza Ho si el estadístico calculado es mayor a χ2(q)
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Sea x1, x2, …, xn una muestra aleatoria independiente e identicamente distribuida de una población Np(μ, Σ)
Hipótesis Lineales II (E)
Ho: Aμ = a ; Σ desconocido
donde A(qxp) y a(qx1) q≤p son conocidos
Si Ho es verdadera:
(n-1) ( Ax – a )’( ASA’)-1( Ax – a ) ~ T2(q, n-1)
Se rechaza Ho si el estadístico calculado es mayor a χ2(q)
5
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
HIPÓTESIS PARA MEDIDAS REPETIDAS
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Xk i j
Variablei = 1,...,p
Unidad Experimental
j = 1,...,n
Tratamientok = 1,2
Observación
6
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
X11jX12j...X1pj
X21jX22j...X2pj
Tratamiento k=1 Tratamiento k=2
“p” observaciones en la j-ésima unidad para el tratamiento 1
“p” observaciones en la j-ésima unidad para el tratamiento 2
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Diferencias Pareadas
D1j = X11j - X21j
D2j = X12j - X22j
Dpj = X1pj - X2pj
.
.
.
donde Dtj = D1j , D2j , ... , Dpj
Supuestos
E( Dj ) = δ =
δ1δ2..δp
y Cov ( Dj ) = Σd
7
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Comparación de Tratamientos para un Diseño de Medidas Repetidas
X1jX2j...Xqj
Xj = j = 1, 2, ..., n
Xij es la respuesta al i-ésimotratamiento sobre la j-ésima unidad
Los “q” tratamientos se aplican repetidamente a la j-ésima unidad
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
(i) μ1 - μ2
μ1 - μ3
μ1 - μq
.
.
μ2 - μ1
μ3 - μ2
μq - μq-1
.
.
(ii)
=
1
1...
1
-1
0...
0
0
-1...
0
. . .
. . .
. . .
0
0...
-1
μ1
μ2
μq
.
.
=
-1
0...
0
1
-1...
0
0
1...
0
. . .
. . .
. . .
0
0...
1
μ1
μ2
μq
.
.
0
0...
-1
= C1μ
= C2μ
Contrastes para μ
8
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Ho : C2μ = 0
H1 : C2μ ≠ 0
Hipótesis (F) No hay efecto de tratamientos
Hipótesis (G)
Ho : C1μ = 0
H1 : C1μ ≠ 0
Existen diferencias respecto al control
x’C’( CSC’)-1 Cx ~ F(1-α ; p-1, n-p+1)p - 1
(n- p+1)
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Hipótesis (H) Comparación de dos vectores de medias
Sea xi1, xi2, …, xin1 una muestra aleatoria iid Np(μ1, Σ) y xj1, xj2, …, xjn2 una muestra aleatoria iid de una población Np(μ2, Σ) donde las variables son independientes.
Ho : μ1 = μ2
Si Ho es cierta, la región de rechazo está dada por:
n1n2( n1+ n2 – p - 1)p (n1+ n2)2
( x1 – x2 )’S-1 ( x1 – x2 ) ≥ F (1-α ; p, n1+n2-p-1)
H1 : μ1 ≠ μ2
9
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Hipótesis (I) Comparación de matrices de covarianzas
Sea xih ~ Np(μh, Σh) i=1, …, nh; h=1, …, k son variables aleatorias independientes
Ho: Σ1= Σ2 = … = Σk
H1: Σi ≠ Σj
-2logλ = n log lSl -Σ nh log lShl ~ χm2
h=1
k
m =12
(k-1) p (p+1)
(Ho cierta)
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Hipótesis (J) Comparación de dos medias, diferentes matrices de covarianzas en muestras grandes
Sea xi1 ~ Np(μ1, Σ1) con i=1, …, n1; y xi2 ~ Np(μ2, Σ2) con j=1, …, n2 son variables aleatorias independientes
Ho : μ1 = μ2
H1 : μ1 ≠ μ2
( x1 – x2 )’ ( S1 + S2 ) ( x1 – x2 )n1 n2
-1χp
2
10
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
ANALISIS DE PERFILES
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
Hipótesis (K) Perfiles Paralelos (Similares)
De Hipótesis (F):
Ho : C2 (μ1 - μ2) = 0
H1 : C2 (μ1 - μ2) ≠ 0
La hipótesis se rechaza si:
n1n2(n1+n2-p)
(n1 + n2)2(p-1)(C x)T (CSC’)-1 C x > F(1-α, p-1, n1+n2-p)
Grupo 1
Grupo 2
Perfiles Poblacionales
Media
Tratamiento
11
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Hipótesis (L) Igualdad de dos niveles
Lic. Luis Huamanchumo de la Cuba
Ho : 1tp(μ1 - μ2) = 0
H1 : 1tp (μ1 - μ2) ≠ 0
La región de rechazo bajo Ho es:
n1 n2 (n1 + n2 - 2)
(n1 + n2)2
1tp( x1 - x2 )
2
1tp S 1p
> F (1-α; 1, n1+n2 - 2)
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Hipótesis (M) Efecto Tratamiento
Lic. Luis Huamanchumo de la Cuba
Ho : C2(μ1 + μ2) = 0
H1 : C2(μ1 + μ2) ≠ 0
(n1+n2-p)
p-1(C x)T (CSC’)-1 C x > F(1-α, p-1, n1+n2-p)
x = n1x1 + n2x2
n1 + n2
12
APLICACIONES
ESCU
ELA
PROF
ESIO
NAL
DE I N
GENI
ERÍA
EST
ADÍS
T ICA
UNI-F
IECS
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
CASO: Cheques Antiguos del Banco Suizo.(en pulgadas)
x1
x2 x3
x4
x5
x6
13
Lic. Luis Huamanchumo de la Cuba
Se dispone de 200 datos sobre seis medidas, respecto a 100 cheques bancarios genuinos y 100 cheques falsificados
Queremos probar si la media muestral de las observaciones obtenidas de las notas bancarias falsas es igual a:
214.9129.9129.7
8.310.1
141.5
μo =
Media muestral de los cheques genuinos (asumiremos que corresponde a la media poblacional)
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
214.8130.3130.210.511.1
139.4
xf =
Media muestral de los cheques falsificados
Asumimos que “Σ” es conocida e igual Sf
-2logλ = n( x - μo )’ Σ-1 ( x - μo ) = 7,552.0074
χ2 (0.95; 6)=12.592
Se rechaza Ho
ANÁLISIS MULTIVARIANTE IUNI-EPIES
14
Lic. Luis Huamanchumo de la Cuba
Asumimos que “Σ” es desconocida
((n-p)/p)d’S-1d ~ F(p, n-p)Se sabe que: d = x - μo
De los datos: ((n-p)/p)d’S-1d = 183.147
F(0.95; 6, 94) = 2.1966
Se rechaza Ho
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Se dispone de información estadística de 15 compañías del sector energía y estamos interesados en analizar sus activos (X1) y ventas(x2).
Con la información disponible se obtiene la matriz de covarianzas:
S = 107 x 1.6635 1.2410
1.2410 1.3747
15
Lic. Luis Huamanchumo de la Cuba
Ho: Σ= Σ o ; μ desconocido
Probar que la varianza del vector (x1,x2) del sector Energía es igual a Σ O
13608514,178 12694886,40012694886,400 16790650,178Σ O =
X1: Activos ; X2: Ventas
-2logλ = n tr(Σ o-1S) – n log Σ o
-1S - np = 4.541
χ2(0.95;3) =
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Lic. Luis Huamanchumo de la Cuba
ANÁLISIS MULTIVARIANTE IUNI-EPIES
Se desea comparar el valor medio de los activos del sector y de las ventas del sector energetico y manufacturero. Se dispone de 15 empresas del sector energía y 10 del sector manufacturero.
A partir de la información muestral se obtuvo los siguientes resultados:
4,0802,580.5
4,307.24,925.2x1 = x2 =
S1 = 107 x 1.6635 1.2410
1.2410 1.3747S2 = 107 x 1.2248 1.1425
1.1425 1.5112
16
Lic. Luis Huamanchumo de la Cuba
Probar si existe diferencias significativos de posición entre el sector Energía y Manufacturero
Ho : μ1 = μ2
H1 : μ1 ≠ μ2
Si Ho es cierta, la región de rechazo está dada por:
n1n2( n1+ n2 – p - 1)p (n1+ n2)2
( x1 – x2 )’S-1 ( x1 – x2 ) ≥ F (1-α ; p, n1+n2-p-1)
n1n2( n1+ n2 – p - 1)p (n1+ n2)2
( x1 – x2 )’S-1 ( x1 – x2 ) = 2.287
F(0.95; 2,22)=3.4434 Se acepta Ho
ANÁLISIS MULTIVARIANTE IUNI-EPIES