View
219
Download
2
Category
Preview:
Citation preview
20/9/2008 1
Prof. Adriano Mendona Souza, Dr.Departamento de Estatstica- PPGEMQ / PPGEP - UFSM -
Intervalos de Confiana
Estimao de Parmetros
O objetivo da Estatstica a realizao de inferncias
acerca de uma populao, baseadas nas informaes
amostrais. Como as populaes so caracterizadas por
medidas numricas descritivas, denominadas
parmetros, a inferncia estatstica diz respeito
realizao de inferncias sobre esses
parmetros populacionais.
Os mtodos de realizar inferncias a respeito dos
parmetros pertencem a duas categorias.
Pode-se tomar decises relativas ao valor do parmetro, atravs de um teste de hiptese;
Pode-se estimar ou prever o valor do parmetro.
A estimao o processo que consiste em utilizar dados amostrais
para estimar os valores de parmetros populacionais
desconhecidos.
Qualquer caracterstica de uma populao pode ser estimada a
partir de uma amostra aleatria.
Entre as mais comuns, esto a mdia e o desvio padro de uma populao
e a proporo populacional.
Estimao Pontual
As estatsticas amostrais so utilizadas como estimadores de
parmetros populacionais.
Assim uma mdia amostral usada como estimativa de uma
mdia populacional.
Tais estimativas chamam-se estimativas pontuais, porque originam
uma nica estimativa do parmetro.
Mdia e varincia de uma populao normal N(; )
O melhor estimador da mdia populacional a mdia
amostral :
sendo Xi variveis aleatrias independentes tem-se:
, i = 1, 2, ... n.
( )X
E X i( )
Var X i( ) 2
)...(1
21 nXXXnX
Assim,
n
n
n
XEXEXEn
XXXEn
XE nn
...1
)(...)()(1
)...(1
)( 2121
nn
n
n
XVarXVarXVarn
XXXVarn
XVar nn
2
2
2222
2
212212
...1
)(...)()(1
)...(1
)(
revela que um estimador no tendencioso de
. revela que quanto maior o valor de n, menor a sua
variabilidade. Assim, neste caso, sendo , adotaremos
A varincia populacional ( ) o estimador S2, com
, no tendencioso, conforme j foi exemplificado.
Adotaremos assim, para .
E X( ) X
Var X n( ) 2
2 S n X Xiin
2 2
1
1
1
( )
2
X
2 S
Se de uma populao normal extramos amostras cujos valores so: 1.1; 0.9; 0.3; -0.2; -3.1; 1.5; -2.7; 0.5; -1.5; 2.1, obtenha estimativas pontuais da ; e P(X > 2.5).
Estimativa de :
Estimativa de :
2
Exemplo:
2
11.01.2...3.09.01.110
1X
17.3)11.01.2(...)11.09.0()11.01.1(9
1 2222 S
Estimativa de P(X > 2.5):
Sendo
Assim para
e
2 317 178~ . .
X zX
252 5 011
1781466.
. ( . )
..
P X P Z P Z( . ) ( . ) ( . ) . . 25 1466 1 1466 1 0 9286 714%
Mdia e varincia de uma proporo (p)
Consideremos agora o caso em que , de uma
populao que apresenta certa caracterstica. Extrai-se
da populao uma amostra de tamanho n. X ser o nmero de elementos da amostra que apresentam a
caracterstica em estudo.
intuitivo que um estimador da proporo p seja a proporo amostral :
p
n
XP
p
As observaes dos n elementos podem ser considerados como nprovas de Bernoulli com probabilidade de sucesso p, ou seja, X tem distribuio binomial com mdia np e varincia npq, temos:
Assim no tendencioso.
pnpnn
XEpE
)(
1)(
n
pqnpq
nn
XVarpVar
2
1)(
p
O desvio padro de tambm denominado de Erro-Padro de ,
representado por sendo
p p
n
pqpEP )( .1 pqqepp
Para se avaliar a taxa de desemprego em determinado Estado, escolhe-se uma amostra aleatria de 1000 habitantes em idade de trabalho e contam-se os desempregados: 87. Estimar a proporo de desempregados em todo o Estado (populao). Avaliar o erro padro de estimativa.
~ . 0 009
%7.8087.0100
87
n
Xp %7.8 pp
913.01 pq
009.01000
)913.0)(087.0()(
n
qppEP
Estimao Intervalar
Sabemos que a estimao por ponto em geral
insuficiente, pois a probabilidade, de que a estimativa
adotada venha a coincidir com o verdadeiro valor do
parmetro praticamente nula.
Isso decorre dos estimadores serem muitas vezes VA contnuas,
logo as estimativas sero diferentes do valor do parmetro,
ento temos um erro de estimao.
Em virtude da variabilidade amostral, usual incluir uma estimativa
intervalar, com certo nvel de confiana (1-) ou de
significncia , para acompanhar a estimativa pontual.
Essa nova estimativa proporciona um intervalo, de possveis
valores do parmetro populacional.
Constroe-se um intervalo em torno da estimativa por ponto, de modo que este intervalo contenha o
verdadeiro parmetro populacional.
Seja ento uma amostra aleatria de uma
populao e o parmetro de interesse. Sejam
e estatsticas tais que:
Ento chamado intervalo de confiana de nvel 100( 1 - )% para o parmetro . Usualmente toma-
se 1 - = 0.95 ou 0.99.
nXXX ...21
0
1
1)( 10P
10 ;
1 - o nvel ou grau de confiana e fornece a probabilidade de conter o verdadeiro parmetro.
o nvel de significncia, representa o erro que se estcometendo ao afirmar que a probabilidade do intervalo
[ i s ] conter o verdadeiro valor do parmetro
populacional ( 1 - ).
Valores Crticos de Z para e / 2.
Muitos estatsticos consideram a construo de intervalos de confiana
como o principal mtodo de estudo de um parmetro populacional
atravs de uma amostra.
Z / 2 1,64 1,96 2,58 2,81 3,06
Z 1,28 1,64 2,36 2,58 2,88
10% 5% 1% 0,5% 0,2%
Como o IC construdo com base na estimativa por
ponto, aleatrio, ao passo que o parmetro
suposto uma constante da populao.
Assim, o IC conter ou no o parmetro, com probabilidades 1 - e .
incorreto dizer " probabilidade do parmetro CAIR no intervalo".
Consideremos uma populao normal com mdia
e desvio padro e uma amostra dessa populao.
Sabemos pelos resultados do Teorema Central do
Limite que a mdia desta amostra tem distribuio
normal com mdia e desvio padro , ou
seja:
X n
X u
n
~ N : (0,1)
Fixando em 0.05, ou seja, , vemos pela
tabela de distribuio normal padronizada z, que:
1 0 95 .
z
X
-1.96 0 1.96
0.0250.025
0.95
P Z( . . ) . 196 196 095
isto :
Reescrevendo as desigualdades entre parnteses, temos:
PX
n
1 9 6 1 9 6 0 9 5. . .
P X n X n 196 196 0 95. ( ) . ( ) . Neste caso: o parmetro
o IC de 95% para , ( :IC 95%)
nXnX /96.1,/96.1; 10
importante observar que o nvel de confiana (1 - )
se aplica ao processo de construo de intervalos,
e no a um intervalo especfico.
Para explicitar o conceito de IC, suponha que retiremos
um grande nmero de amostras de tamanho n, fixo,
da populao em estudo e, para cada amostra,
construamos um intervalo.
Os limites dos intervalos resultantes sero diferentes.
O verdadeiro valor do parmetro estar contido, em mdia, em 100(1 - )% desses intervalos.
100(1 - )% dos intervalos construdos abrangero o verdadeiro valor do parmetro.
No caso , conforme ilustrado na figura, mas cada valor contm, ou no contm, o parmetro.
A expresso
deve ser interpretada muito cuidadosamente.
Ela no significa que a probabilidade do parmetro cair
dentro de um intervalo especificado seja igual a 0.95.
sendo o parmetro, est ou no est dentro do intervalo acima. De
preferncia a expresso acima deve ser interpretada assim:
0.95 a probabilidade de que um intervalo aleatrio contenha .
P X n X n 1 96 1 96 0 95. . .
X n X n 196 196. ; .
Para uma amostra de 50 observaes de uma
populao normal com mdia desconhecida e
desvio padro , seja 20,5 a mdia amostral .
Construir um intervalo de 95% de confiana para a
mdia populacional.
Temos, de imediato que:
Assim, tal intervalo [18.84; 22.16].
6 X
P X n X n 196 196 0 95. . .
A figura seguinte representa a curva N(0,1) e a notao
que iremos utilizar, onde P Z Z 2 1
-z /2 0 +z /2
/2 /2
1-
Na situao aqui apresentada, com conhecido, sabemos que:
logo o intervalo de confiana para ser:
N ( ; )
X
nN
~ ( ; )0 1
e
P ZX
nZ
2 2 1
P X Z n X Z n 2 2 1
IC X Z n X Z n : ( ) ;1 1 0 0 2 2
Intervalo de Confiana para a mdia da populao conhecido = mdia da populao
= mdia da amostra
= desvio-padro da populao
S = desvio-padro da amostra
n = tamanho da amostra
eo = Semi-amplitude do intervalo de confiana
x
Seja uma populao X ~ N (, 2), sabe-se que:
Pela figura anterior temos:
)1,0(,~2
Nn
xZe
nNx
1][ 22 ZZZP
1][ 22 Z
n
xZP
1].[ 22n
Zxn
ZP
Multiplicando-se por (-1):
Ordenando, temos:
1]..[ 22n
Zxn
ZxP
1]..[ 22n
Zxn
ZxP
1]..[ 22 Zn
xZn
xP
Como a distribuio normal simtrica
Z/2 = Z1 - /2
Se for desconhecido e n 30, pode-se usar S, resultando em um intervalo aproximado.
, podendo o IC ser escrito como:n
Ze
.20
1)( 00 exexP
Feito um ensaio de corroso com 64 peas de um lote de produo, verificou-se que o tempo que a pea suportou nesse teste apresentou uma mdia igual a 200 horas. Calcular o IC de 95% para a verdadeira mdia, sabendo que = 16 horas.
Sabe-se que os comprimentos das barras produzidas por uma siderrgica tem uma distribuio normal de varincia 1,69 m2. Numa amostra de cinco barras encontrou-se: 20,1; 21,0; 21,4; 22,1; 23,3 m. Determinar o IC para a mdia, com:
a) = 0,10 Z/2 = 1,645b) = 0,06 Z/2 = 1, 881
Exemplo:
desconhecidoEm geral nos problemas prticos desconhecido e
devemos estim-lo:
Quanto menor a amostra, mais necessria se torna a
introduo de uma correo, a qual consiste em a
varivel t de Student ao invs de Z.
1
)(1
2
n
xxiS
n
i
n
Sx
t
P [ - t /2 t t /2 ] = 1 -
P [ - t /2 t /2 ] = 1 -
..........................
xS
n
P [ . t /2 . t /2 ] = 1 - xS
n x
S
n
"t" possui n - 1 graus de liberdade => t ( n - 1 ); / 2
Convm ressaltar que, quanto maior for o nvel de confiana (isto , quanto menor for o nvel de significncia); mais amplo ser o intervalo
e0 = t /2 .
1
. 22
n
xnxS i
n fxii iifxnS
2.2.
1
1
A seguinte amostra foi extrada de uma populao normal:
6, 6, 7, 8, 9, 9, 9, 10, 11, 12. Construir um intervalo para
, ao nvel de significncia de 10%.
Construir um I.C. de 95%, para a mdia populacional, a
partir da seguinte distribuio amostral:
Classe 0 | 5 5 | 10 10 | 15 15 | 20
Freqncia 2 3 5 2
Exemplo:
Suponha que x tenha uma distribuio N ( , 2 ).
Uma amostra de tamanho 25 fornece os seguintes
valores: xi = 70,8 ; xi2 = 3546,8. Determine um
IC de 95% para .
Exemplo:
IC para a 2 de uma populao normal
Seja X uma populao com mdia e varincia 2. Sabe-
se pelo Teorema de Fisher, que: ;
P [ 12 2 22 ] = 1 -
P [ 12 S2 (n - 1) 22 ] = 1 - 2
2
22
1
)1(
nSX n
P [ 12___ 1_ 22_ ] = 1 - (n-1).S2 2 (n-1).S2
P [ S2 (n-1) 2 S2 (n-1) ] = 1 - 2sup 2inf
2inf = x21 = x21 - /22sup = x22 = x2 /2 ambos com = n 1
Quando > 30 graus de liberdade comum usar a
seguinte aproximao:
2 = 1_ ( Z . )2
2 a abscissa normal reduzida
Como a tabela 2 unicaudal a direita e o I.C. deve
ser central, deve-se entrar na tabela com /2 e
( 1 - /2), para encontrar 2inf e 2sup.
2 1
Exemplo:
Para 6, 6, 7, 8, 9, 9, 9, 10, 11, 12, calcular o IC para 2, ao nvel de 90%.
De uma populao normal foi retirada uma amostra de 15 elementos e calculou-se:xi = 8,7 e xi2 = 27,3. Determinar um IC de 80% para a varincia dessa populao.
Calcular um IC de 96% para a varincia da distribuio mostrada a seguir (suposta como normal):
Classe 2,2 | 6,2 6,2 | 10,2 10,2 | 14,2 14,2 | 18,3 Freq. 3 4 5 3
IC para desvio-padro de uma populao normal
Se estimador justo de 2, mas S no
estimador de , pois E[S] = , tem-se:
V(S2) = E(S2) - E2(S2), logo V(S2) = 2 - 2 = 0, o que
no tem sentido. O vcio de S com estimador de ,
tende a zero quando n .
Deveramos adotar um coeficiente de correo, mas calcularemos um
IC aproximado para , bastando
extrair a raiz quadrada do IC da 2.
1
)( 22
n
xxS i
Fazer EX.1, EX.2, EX.3 anteriores.
I.C. para a proporo populacional p
Sabemos que f N ( p , )e que, para n > 30, a
distribuio binomial tende a uma normal, ento
pq
n
npq
pfZ
P [-Z /2 Z Z /2 ] = 1 -
. . . . . . . . .
1][ 22 Znpq
pfZP
1].[ 22 npqZfpnpqZfP
amostradatotal
eresseintdecasos
n
xf
1])1(
.)1(
.[ 22 n
ffZfp
n
ffZfP
Retirada uma amostra de 1.000 peas da produo de uma mquina, verificou-se que 35 eram defeituosas. Construir um IC, ao nvel de 95%, para a proporo real de peas defeituosas fornecidas por essa mquina.
Uma a.a. de 400 domiclios de uma cidade mostra que 25% so casas de aluguel. Qual o IC que podemos supor que seja o nmero de casas de aluguel dessa cidade, usando = 2%, supondo que tal cidade tem 20.000 casas?
Exemplo:
IC para a soma e para a diferena entre duas mdias (1 e 2) de duas populaes normais, conhecidas suas varincias 12 e 22 .
Se X1 = N ( 1 , 12) e X2 = N (2 , 22), sendo X1 e X2independentes. Como = N(1, )
= N (2, )
( ) = N [(1 2); + ] para amostras
a.a. independentes, temos:
x1 12
1nx2
22
2n
x2x11
2
1n2
2
2n
2
22
1
21
2121
nn
xxZ
Uma empresa tem duas filiais ( A e B ), para os quais os desvios-padres de vendas dirias so de 5 e 3 peas, respectivamente. Uma amostra de 20 dias fornecem uma venda mdia diria de 40 peas para a filial A e 30 peas para a filial B. Supondo que a distribuio diria de vendas seja normal, construir um I.C. de 92% para a venda diria das duas filiais.
1].)(.)[(2
22
1
21
221212
22
1
21
221 nnZxx
nnZxxP
I.C. para a Soma e para a Diferena entre duas mdias (1 e 2) de duas populaes normais, de mesma varincia 2 desconhecida.
Sendo X1 = N (1 , 2) e X2 = N ( 2 , 2), com X1 e X2
independentes, logo e ,
tem-se que( ) = N [(1 2); 2 . ( )] e:x1 x21 1
1 2n n
x x
n n
1 2 1 2
1 2
1 1
.Z =
),(1
2
11 nNx
),(2
2
22 nNx
P[( ) - t/2. S 1 2 ( ) + t/2. S' ] = 1 -
Como no se conhece 2, deve-se estim-lo por S'2 , onde:
= (n1 + n2 - 2) graus de liberdade
t (n1 + n2 - 2 ), = t,
n S n Sn n
1 12
2 22
1 2
1 1
2
. .S'2 =
x1 x21 1
1 2n n
1 1
1 2n n x1 x2
Duas populaes normais: X1 e X2 tem a mesma
varincia. Da populao 1 foi extrada uma amostra
de tamanho 10, obtendo-se X=15 e S=8. Da
populao 2 foi extrada uma amostra de 12
elementos, obtendo-se X=12 e S=2. Construir o I.C.
de 95% para a diferena de mdias.
P[( ) - t/2 1 2 ( ) + t/2] = 1 -
I.C. para a Soma e para a Diferena entre duas mdias (1 e 2) de duas populaes normais, de varincias desconhecidas e 12 22 .
Se X1 = N ( 1 , 12 ) e X2 = ( 2 , 22 ), com X1 e X2
independentes, ento
. Como 12 e 22 so
desconhecidos, temos que estim-las.
x1 x2 Sn
S
n12
1
22
2
x1 x2 Sn
S
n12
1
22
2
)](;)[()(2
22
1
21
2121 nnNxx
= onde V1 = e V2 =
- t, /2 onde o gl. dado pelo mtodo de Aspin-
Welch, com arredondamento para menos.
V VV
n
V
n
1 2
2
12
1
22
21 1
2
S
n12
1
S
n22
2
Duas mquinas de embalar de embalar arroz esto
sendo usadas por uma empresa, sendo uma nova e
outra velha; pegas duas amostras de sacos
embalados, encontramos os eguintes pesos, em Kg.
Mquina Nova: 82, 83, 79, 81, 81, 80
Mquina Velha: 79, 82, 78, 74, 80, 77, 75, 84, 78
Construir o I.C. para a diferena dos pesos mdios
populacionais, ao nvel de significncia de 5%.
I.C. para a Soma e para a Diferena de duas propores populacionais p1 e p2 .
Se f1 = N ( p1 , ) e f2 = N ( p2 , ); logo,
( f1 f2 ) = N [( p1 p2 ); + ] e,
, logo o intervalo de confiana
ser:
p q
n1 1
1
. p q
n2 2
2
.
p q
n1 1
1
. p qn2 2
2
.
2
22
1
11
2121
11.n
ppn
pp
ppffZ
P [ - Z/2 Z Z/2 ] = 1 -
P [- Z/2 Z/2 ] = 1 -
f f p p
p p
n
p p
n
1 2 1 2
1 1
1
2 2
2
1 1
.
P [( f1 f2 ) - Z/2 . p1 p2
( f1 f2 ) + Z/2 . ] = 1 -
p pn
p p
n1 1
1
2 2
2
1 1.
p pn
p p
n1 1
1
2 2
2
1 1.
Como p1 e p2 so valores populacionais desconhecidos,
eles podem ser estimados por f1 e f2, desde que os
tamanhos das amostras sejam maiores do que 30,
da temos:
P [( f1 f2 ) - Z/2 p1 p2
( f1 f2 ) + Z/2 ] = 1 -
f fn
f f
n1 1
1
2 2
2
1 1.
f fn
f f
n1 1
1
2 2
2
1 1.
Exemplo:
Um levantamento estatstico mostrou que 80
pessoas, das 200 consultadas, numa cidade, vo
votar no candidato A na prxima eleio; uma outra
amostra de 500 pessoas, dessa mesma cidade,
mostrou que 150 delas vo votar no candidato B.
Construir um IC de 93% para a diferena das
propores de pessoas que vo votar em A e B.
IC para o quociente das varincias populacionais
Seja: F(1 , 2 ) = =
para duas populaes normais de varincias descontinuas,
pelo Teorema de Fischer: 2n-1 = (n- 1) . S2 ou
2 = . S2
1
1
2
2
2
2
1
2
2
22
1
.
2
2
Portanto
logo o intervalo ser:
P[ F1 - /2 F F /2 ] = 1 -
21
22
22
21
211
2
22
222
21
211
21 .),(..
.
),(
S
SF
S
S
F
1].[ 221
22
22
21
21 FS
SFP
ou:
1]),(;.
),(,
1.[ 21
22
1
22
21
22
12
2
21
22 F
S
S
FS
SP
1)],(;.
),(,
1.[ 21
222
21
21
22
21
2
22
21 F
S
S
FS
SP
Exemplo:
Construir um IC, para = 2%, para o quociente de
varincias de duas populaes normais, das quais
foram extradas as amostras seguintes: 41 elementos
da primeira, obtendo-se S12 = 43,8 e 31 elementos
da segunda, obtendo-se S22 = 29,5.
Intervalos de Confiana
Prof. Adriano Mendona Souza, Dr.
Departamento de Estatstica
- PPGEMQ / PPGEP - UFSM -
Estimao de Parmetros
O objetivo da Estatstica a realizao de inferncias acerca de uma populao, baseadas nas informaes amostrais. Como as populaes so caracterizadas por medidas numricas descritivas, denominadas parmetros, a inferncia estatstica diz respeito realizao de inferncias sobre esses
parmetros populacionais.
Os mtodos de realizar inferncias a respeito dos parmetros pertencem a duas categorias.
Pode-se tomar decises relativas ao valor do parmetro, atravs de um teste de hiptese;
Pode-se estimar ou prever o valor do parmetro.
A estimao o processo que consiste em utilizar dados amostrais para estimar os valores de parmetros populacionais desconhecidos.
Qualquer caracterstica de uma populao pode ser estimada a partir de uma amostra aleatria.
Entre as mais comuns, esto a mdia e o desvio padro de uma populao e a proporo populacional.
Estimao Pontual
As estatsticas amostrais so utilizadas como estimadores de parmetros populacionais.
Assim uma mdia amostral usada como estimativa de uma
mdia populacional.
Tais estimativas chamam-se estimativas pontuais, porque originam uma nica estimativa do parmetro.
Mdia e varincia de uma populao normal N(m; s)
O melhor estimador da mdia populacional a mdia amostral :
sendo Xi variveis aleatrias independentes tem-se: , i = 1, 2, ... n.
Assim,
revela que um estimador no tendencioso de . revela que quanto maior o valor de n, menor a sua variabilidade. Assim, neste caso, sendo , adotaremos
A varincia populacional ( ) o estimador S2, com
, no tendencioso, conforme j foi exemplificado.
Adotaremos assim, para .
Se de uma populao normal extramos amostras cujos valores so: 1.1; 0.9; 0.3; -0.2; -3.1; 1.5; -2.7; 0.5; -1.5; 2.1, obtenha estimativas pontuais da ; e P(X > 2.5).
Estimativa de :
Estimativa de :
Exemplo:
Estimativa de P(X > 2.5):
Sendo
Assim para
e
Mdia e varincia de uma proporo (p)
Consideremos agora o caso em que , de uma populao que apresenta certa caracterstica. Extrai-se da populao uma amostra de tamanho n. X ser o nmero de elementos da amostra que apresentam a caracterstica em estudo.
intuitivo que um estimador da proporo p seja a proporo amostral :
As observaes dos n elementos podem ser considerados como n provas de Bernoulli com probabilidade de sucesso p, ou seja, X tem distribuio binomial com mdia np e varincia npq, temos:
Assim no tendencioso.
O desvio padro de tambm denominado de Erro-Padro de , representado por sendo
Para se avaliar a taxa de desemprego em determinado Estado, escolhe-se uma amostra aleatria de 1000 habitantes em idade de trabalho e contam-se os desempregados: 87. Estimar a proporo de desempregados em todo o Estado (populao). Avaliar o erro padro de estimativa.
Estimao Intervalar
Sabemos que a estimao por ponto em geral insuficiente, pois a probabilidade, de que a estimativa adotada venha a coincidir com o verdadeiro valor do parmetro praticamente nula.
Isso decorre dos estimadores serem muitas vezes VA contnuas, logo as estimativas sero diferentes do valor do parmetro, ento temos um erro de estimao.
Em virtude da variabilidade amostral, usual incluir uma estimativa intervalar, com certo nvel de confiana (1-) ou de significncia , para acompanhar a estimativa pontual.
Essa nova estimativa proporciona um intervalo, de possveis valores do parmetro populacional.
Constroe-se um intervalo em torno da estimativa por ponto, de modo que este intervalo contenha o
verdadeiro parmetro populacional.
Seja ento uma amostra aleatria de uma populao e o parmetro de interesse. Sejam
e estatsticas tais que:
Ento chamado intervalo de confiana de nvel 100( 1 - )% para o parmetro . Usualmente toma-se 1 - = 0.95 ou 0.99.
1 - o nvel ou grau de confiana e fornece a probabilidade de conter o verdadeiro parmetro.
o nvel de significncia, representa o erro que se est cometendo ao afirmar que a probabilidade do intervalo [ i s ] conter o verdadeiro valor do parmetro populacional ( 1 - ).
Valores Crticos de Z para e / 2.
Muitos estatsticos consideram a construo de intervalos de confiana como o principal mtodo de estudo de um parmetro populacional atravs de uma amostra.
10% 5% 1% 0,5% 0,2%
Z 1,28 1,64 2,36 2,58 2,88
Z / 2 1,64 1,96 2,58 2,81 3,06
Como o IC construdo com base na estimativa por ponto, aleatrio, ao passo que o parmetro suposto uma constante da populao.
Assim, o IC conter ou no o parmetro, com probabilidades 1 - e .
incorreto dizer " probabilidade do parmetro CAIR no intervalo".
Consideremos uma populao normal com mdia
e desvio padro e uma amostra dessa populao. Sabemos pelos resultados do Teorema Central do Limite que a mdia desta amostra tem distribuio normal com mdia e desvio padro , ou seja:
~ N : (0,1)
Fixando em 0.05, ou seja, , vemos pela tabela de distribuio normal padronizada z, que:
0.95
0.025
0.025
-1.96 0 1.96
INCORPORAR Equation.2
z
isto :
Reescrevendo as desigualdades entre parnteses, temos:
Neste caso: o parmetro
o IC de 95% para
importante observar que o nvel de confiana (1 - ) se aplica ao processo de construo de intervalos, e no a um intervalo especfico.
Para explicitar o conceito de IC, suponha que retiremos um grande nmero de amostras de tamanho n, fixo, da populao em estudo e, para cada amostra, construamos um intervalo.
Os limites dos intervalos resultantes sero diferentes.
O verdadeiro valor do parmetro estar contido, em mdia, em 100(1 - )% desses intervalos.
100(1 - )% dos intervalos construdos abrangero o verdadeiro valor do parmetro.
No caso , conforme ilustrado na figura, mas cada valor contm, ou no contm, o parmetro.
(
A expresso
deve ser interpretada muito cuidadosamente.
Ela no significa que a probabilidade do parmetro cair dentro de um intervalo especificado seja igual a 0.95.
sendo o parmetro, est ou no est dentro do intervalo acima. De preferncia a expresso acima deve ser interpretada assim:
0.95 a probabilidade de que um intervalo aleatrio contenha .
Para uma amostra de 50 observaes de uma populao normal com mdia desconhecida e desvio padro , seja 20,5 a mdia amostral . Construir um intervalo de 95% de confiana para a mdia populacional.
Temos, de imediato que:
Assim, tal intervalo [18.84; 22.16].
A figura seguinte representa a curva N(0,1) e a notao que iremos utilizar, onde
-za/2 0 +za/2
1-a
a/2
a/2
Na situao aqui apresentada, com conhecido, sabemos que:
logo o intervalo de confiana para ser:
e
Intervalo de Confiana para a mdia da populao conhecido
= mdia da populao
= mdia da amostra
= desvio-padro da populao
S = desvio-padro da amostra
n = tamanho da amostra
eo = Semi-amplitude do intervalo de confiana
Seja uma populao X ~ N (, 2), sabe-se que:
Pela figura anterior temos:
Multiplicando-se por (-1):
Ordenando, temos:
Como a distribuio normal simtrica
Z/2 = Z1 - /2
Se for desconhecido e n 30, pode-se usar S, resultando em um intervalo aproximado.
, podendo o IC ser escrito como:
Feito um ensaio de corroso com 64 peas de um lote de produo, verificou-se que o tempo que a pea suportou nesse teste apresentou uma mdia igual a 200 horas. Calcular o IC de 95% para a verdadeira mdia, sabendo que = 16 horas.
Sabe-se que os comprimentos das barras produzidas por uma siderrgica tem uma distribuio normal de varincia 1,69 m2. Numa amostra de cinco barras encontrou-se: 20,1; 21,0; 21,4; 22,1; 23,3 m. Determinar o IC para a mdia, com:
a) = 0,10 Z/2 = 1,645
b) = 0,06 Z/2 = 1, 881
Exemplo:
desconhecido
Em geral nos problemas prticos desconhecido e devemos estim-lo:
Quanto menor a amostra, mais necessria se torna a introduo de uma correo, a qual consiste em a varivel t de Student ao invs de Z.
P [ - t /2 t t /2 ] = 1 -
P [ - t /2 t /2 ] = 1 -
..........................
P [ . t /2 . t /2 ] = 1 -
"t" possui n - 1 graus de liberdade => t ( n - 1 ); / 2
Convm ressaltar que, quanto maior for o nvel de confiana (isto , quanto menor for o nvel de significncia); mais amplo ser o intervalo
e0 = t /2 .
A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 9, 10, 11, 12. Construir um intervalo para , ao nvel de significncia de 10%.
Construir um I.C. de 95%, para a mdia populacional, a partir da seguinte distribuio amostral:
Classe 0 | 5 5 | 10 10 | 15 15 | 20 Freqncia 2 3 5 2
Exemplo:
Suponha que x tenha uma distribuio N ( , 2 ). Uma amostra de tamanho 25 fornece os seguintes valores: xi = 70,8 ; xi2 = 3546,8. Determine um IC de 95% para .
Exemplo:
IC para a 2 de uma populao normal
Seja X uma populao com mdia e varincia 2. Sabe-se pelo Teorema de Fisher, que: ;
P [ 12 2 22 ] = 1 -
P [ 12 S2 (n - 1) 22 ] = 1 -
2
P [ 12___ 1_ 22_ ] = 1 -
(n-1).S2 2 (n-1).S2
P [ S2 (n-1) 2 S2 (n-1) ] = 1 -
2sup 2inf
2inf = x21 = x21 - /2
2sup = x22 = x2 /2 ambos com = n 1
Quando > 30 graus de liberdade comum usar a seguinte aproximao:
2 = 1_ ( Z . )2
2 a abscissa normal reduzida
Como a tabela 2 unicaudal a direita e o I.C. deve ser central, deve-se entrar na tabela com /2 e
( 1 - /2), para encontrar 2inf e 2sup.
Exemplo:
Para 6, 6, 7, 8, 9, 9, 9, 10, 11, 12, calcular o IC para 2, ao nvel de 90%.
De uma populao normal foi retirada uma amostra de 15 elementos e calculou-se:
xi = 8,7 e xi2 = 27,3. Determinar um IC de 80% para a varincia dessa populao.
Calcular um IC de 96% para a varincia da distribuio mostrada a seguir (suposta como normal):
Classe 2,2 | 6,2 6,2 | 10,2 10,2 | 14,2 14,2 | 18,3
Freq. 3 4 5 3
IC para desvio-padro de uma populao normal
Se estimador justo de 2, mas S no estimador de , pois E[S] = , tem-se:
V(S2) = E(S2) - E2(S2), logo V(S2) = 2 - 2 = 0, o que no tem sentido. O vcio de S com estimador de , tende a zero quando n .
Deveramos adotar um coeficiente de correo, mas calcularemos um IC aproximado para , bastando
extrair a raiz quadrada do IC da 2.
Fazer EX.1, EX.2, EX.3 anteriores.
I.C. para a proporo populacional p
Sabemos que f N ( p , )e que, para n > 30, a distribuio binomial tende a uma normal, ento
P [-Z /2 Z Z /2 ] = 1 -
. . . . . . . . .
Retirada uma amostra de 1.000 peas da produo de uma mquina, verificou-se que 35 eram defeituosas. Construir um IC, ao nvel de 95%, para a proporo real de peas defeituosas fornecidas por essa mquina.
Uma a.a. de 400 domiclios de uma cidade mostra que 25% so casas de aluguel. Qual o IC que podemos supor que seja o nmero de casas de aluguel dessa cidade, usando = 2%, supondo que tal cidade tem 20.000 casas?
Exemplo:
IC para a soma e para a diferena entre duas mdias (1 e 2) de duas populaes normais, conhecidas suas varincias 12 e 22 .
Se X1 = N ( 1 , 12) e X2 = N (2 , 22), sendo X1 e X2 independentes. Como = N(1, )
= N (2, )
( ) = N [(1 2); + ] para amostras a.a. independentes, temos:
Uma empresa tem duas filiais ( A e B ), para os quais os
desvios-padres de vendas dirias so de 5 e 3 peas, respectivamente. Uma amostra de 20 dias fornecem uma venda mdia diria de 40 peas para a filial A e 30 peas para a filial B. Supondo que a distribuio diria de vendas seja normal, construir um I.C. de 92% para a venda diria das duas filiais.
I.C. para a Soma e para a Diferena entre duas mdias (1 e 2) de duas populaes normais, de mesma varincia 2 desconhecida.
Sendo X1 = N (1 , 2) e X2 = N ( 2 , 2), com X1 e X2 independentes, logo e ,
tem-se que( ) = N [(1 2); 2 . ( )] e:
Z =
Como no se conhece 2, deve-se estim-lo por S'2 , onde:
= (n1 + n2 - 2) graus de liberdade
t (n1 + n2 - 2 ), = t,
P[( ) - t/2. S 1 2 ( ) + t/2. S' ] = 1 -
S'2 =
Duas populaes normais: X1 e X2 tem a mesma varincia. Da populao 1 foi extrada uma amostra de tamanho 10, obtendo-se X=15 e S=8. Da populao 2 foi extrada uma amostra de 12 elementos, obtendo-se X=12 e S=2. Construir o I.C. de 95% para a diferena de mdias.
I.C. para a Soma e para a Diferena entre duas mdias (1 e 2) de duas populaes normais, de varincias desconhecidas e 12 22 .
Se X1 = N ( 1 , 12 ) e X2 = ( 2 , 22 ), com X1 e X2 independentes, ento
. Como 12 e 22 so desconhecidos, temos que estim-las.
P[( ) - t/2 1 2 ( ) + t/2] = 1 -
- t, /2 onde o gl. dado pelo mtodo de Aspin-Welch, com arredondamento para menos.
= onde V1 = e V2 =
Duas mquinas de embalar de embalar arroz esto sendo usadas por uma empresa, sendo uma nova e outra velha; pegas duas amostras de sacos embalados, encontramos os eguintes pesos, em Kg.
Mquina Nova: 82, 83, 79, 81, 81, 80
Mquina Velha: 79, 82, 78, 74, 80, 77, 75, 84, 78
Construir o I.C. para a diferena dos pesos mdios populacionais, ao nvel de significncia de 5%.
I.C. para a Soma e para a Diferena de duas propores populacionais p1 e p2 .
Se f1 = N ( p1 , ) e f2 = N ( p2 , ); logo, ( f1 f2 ) = N [( p1 p2 ); + ] e,
, logo o intervalo de confiana ser:
P [ - Z/2 Z Z/2 ] = 1 -
P [- Z/2 Z/2 ] = 1 -
P [( f1 f2 ) - Z/2 . p1 p2
( f1 f2 ) + Z/2 . ] = 1 -
Como p1 e p2 so valores populacionais desconhecidos, eles podem ser estimados por f1 e f2, desde que os tamanhos das amostras sejam maiores do que 30, da temos:
P [( f1 f2 ) - Z/2 p1 p2
( f1 f2 ) + Z/2 ] = 1 -
Exemplo:
Um levantamento estatstico mostrou que 80 pessoas, das 200 consultadas, numa cidade, vo votar no candidato A na prxima eleio; uma outra amostra de 500 pessoas, dessa mesma cidade, mostrou que 150 delas vo votar no candidato B. Construir um IC de 93% para a diferena das propores de pessoas que vo votar em A e B.
IC para o quociente das varincias populacionais
Seja: F(1 , 2 ) = =
para duas populaes normais de varincias descontinuas, pelo Teorema de Fischer: 2n-1 = (n- 1) . S2 ou
2 = . S2
2
2
Portanto
logo o intervalo ser:
P[ F1 - /2 F F /2 ] = 1 -
ou:
Exemplo:
Construir um IC, para = 2%, para o quociente de varincias de duas populaes normais, das quais foram extradas as amostras seguintes: 41 elementos da primeira, obtendo-se S12 = 43,8 e 31 elementos da segunda, obtendo-se S22 = 29,5.
(
)
X
[
]
[
]
n
n
n
n
X
Var
X
Var
X
Var
n
X
X
X
Var
n
X
Var
n
n
2
2
2
2
2
2
2
2
1
2
2
1
2
...
1
)
(
...
)
(
)
(
1
)
...
(
1
)
(
s
s
s
s
s
=
=
+
+
+
=
+
+
+
=
+
+
+
=
E
X
i
(
)
=
m
Var
X
i
(
)
=
s
2
1
)
(
1
2
-
-
=
=
n
x
xi
S
n
i
[
]
17
.
3
)
11
.
0
1
.
2
(
...
)
11
.
0
9
.
0
(
)
11
.
0
1
.
1
(
9
1
2
2
2
2
=
+
+
+
+
+
+
=
S
E
X
(
)
=
m
X
m
Var
X
n
(
)
=
s
2
q
m
=
913
.
0
1
=
-
=
p
q
s
2
S
n
X
X
i
i
n
2
2
1
1
1
=
-
-
=
(
)
q
s
=
2
p
np
n
n
X
E
p
E
=
=
=
)
(
1
)
(
n
X
P
=
s
2
m
%
7
.
8
087
.
0
100
87
=
=
=
=
n
X
p
s
s
2
3
17
1
78
~
.
.
-
=
X
z
X
=
=
-
=
-
-
=
2
5
2
5
0
11
1
78
1
466
.
.
(
.
)
.
.
m
s
P
X
P
Z
P
Z
(
.
)
(
.
)
(
.
)
.
.
>
=
>
=
-
Recommended