Upload
alberto-peixoto-neto
View
7
Download
0
Embed Size (px)
DESCRIPTION
Análise de Regressão
Citation preview
Correlao e Regresso
Associao &Variveis QuantitativasSituao 1: Deseja-se realizar uma investigao sobre a ocorrncia de anemia e infeco em uma comunidade. Seria interessante poder estimar a concentrao de hemoglobina e a contagem de eritrcitos e leuccitos no sangue pela medida do hematcrito. Para verificar a possibilidade de se usar tal procedimento, conduzido um estudo-piloto a partir dos resultados da rotina de um laboratrio de hematologia.Como verificar se essas variveis esto associadas?
Testes de Hipteses? Estabelecem se existe associao entre duas variveis, mas... No quantificam a fora da associao; e No permitem representar a relao existente sob uma forma funcional.
Associao &Variveis Quantitativas possvel fazer um grfico das variveis de interesse e analisar a existncia de uma relao a partir da anlise desse grfico.
Plan1
ExameLeuccitoEritrcitoHemoglobinaHematcrito
(103/mm3)(106/mm3)(g/dl)(%)
16.84.5014.641
29.75.2015.647
34.34.5514.441
47.94.6514.441
57.44.4013.840
67.64.4014.040
72.84.3013.640
87.84.6013.842
95.54.9015.244
104.64.1013.039
118.05.0017.046
127.05.1716.047
137.14.2011.735
...............
13810.54.5013.439
1396.94.5014.240
14013.54.4513.640
1418.33.7011.033
1427.04.3012.738
1434.34.6714.043
1442.74.4012.739
14511.24.4013.338
1475.94.4011.937
14812.34.2410.031
Plan2
Plan3
Associao &Variveis QuantitativasDiagrama de Disperso Representao grfica que permite a visualizao do comportamento conjunto das duas variveis. grfico sobre o qual cada medida individual representada por um ponto, sendo que a posio de cada ponto determinada pelos valores observados em um indivduo, para as duas caractersticas medidas (por exemplo, hematcrito e hemoglobina). denominado, tambm, de grfico XY.
Diagrama de DispersoAnlise Parece no haver uma relao entre o valor do hematcrito e o valor do leuccito.
Diagrama de DispersoAnlise H uma relao crescente entre o valor do hematcrito e o valor de hemoglobina. Esta relao parece ser linear.
Diagrama de DispersoAnlise H uma relao crescente entre o valor do hematcrito e o valor do eritrcito. Esta relao parece ser linear.
Diagramas de DispersoA anlise no alterada, se trocamos as variveis X e Y, ou seja, a existncia ou no da relao no depende de qual varivel considerada independente. O modelo matemtico, porm, ser alterado a depender de quem X.
Associao &Variveis QuantitativasCoeficiente de correlao linear de Pearson Valor numrico que mede a intensidade da associao linear existente entre as duas variveis, medida a partir de uma srie de observaes.Karl Pearson (1857 1936)
Coeficiente de Correlao LinearMedindo a Fora da Associao
Coeficiente de Correlao LinearInterpretando o valor de rr - assume valores entre 1 e + 1 inclusive.
Coeficiente de Correlao Linear
Teste de Hipteses sob o Coeficiente de Correlao Linear
Coeficiente de Correlao Linear Teste de HiptesesExemplo 1: Vamos calcular o coeficiente de Pearson entre as variveis hemoglobina e hematcrito.H correlao entre hematcrito e hemoglobina.
Exemplo 2: Vamos calcular o coeficiente de Pearson entre as variveis leuccito e hematcrito.No h correlao entre hematcrito e leuccito.Coeficiente de Correlao Linear Teste de Hipteses
Associao &Variveis QuantitativasModelos de Regresso Modelo matemtico para a relao linear analisada. Permite a predio de uma varivel em funo de outra.
Modelos LinearesSituao 2: Uma vez verificada a existncia de uma relao entre a quantidade de hemoglobina e o nmero de hematcritos, desejamos desenvolver um modelo para estimar a medida de hemoglobina (varivel y) a partir da medida de hematcrito (varivel x).Qual a reta que melhor se ajusta a estes dados?
Modelos LinearesEquao da RetaIntercepto yaa e b - parmetros da retab
Grf1
Viso Geral
Livro de Exerccios - Dados sobre Lojas de Remessa de Carga
Objetivo:Ponto de partida para os exemplos do Excel das Sees 11.6.2 e 11.7.
Referncia:Sees 11.6.3, 11.7
Contedo do Livro de Exerccios (duas planilhas):
Planilha Viso GeralResumo deste livro de exerccios.
Planilha DadosDados sobre o nmero de clientes e vendas semanais para uma amostra
de 20 lojas de remessa de carga.
VarivelIntervaloValores
Nmero da LojaA2:A21
ClientesB2:B21
VendasC2:C21semanais, em milhares de dlares
&L&F/&A
Dados
LojaClientesVendasLojaClientesVendas ($1000)LojaClientesVendas
190711.20190711.20116797.63
292611.05292611.05128729.43
35066.8435066.84139249.46
47419.2147419.21146077.64
57899.4257899.42154526.92
688910.08688910.08167298.95
78749.4578749.45177949.33
85106.7385106.731884410.23
95297.2495297.2419101011.77
104206.12104206.12206217.41
116797.63
128729.43
139249.46
146077.64LojaClientesVendas ($1000)
154526.92116797.63
167298.95128729.43
177949.33139249.46
1884410.23146077.64
19101011.77154526.92
206217.41167298.95
177949.33
1884410.23
19101011.77
206217.41
&L&F/&A
Dados
Vendas
Nmero de clientes
Quantidade de vendas ($1000)
Diagrama de Disperso - Dados das 20 empresas
Regresso Linear SimplesMtodo dos Mnimos QuadradosO objetivo minimizar a soma do quadrado dos erros:Obtendo os valores de e que minimizam a equao acima.
Regresso Linear SimplesMtodo dos Mnimos Quadrados
Reta de Regresso & EstimativaEstimativa da Medida de Hemoglobina AnliseO valor de homoglobina mdia estimada, para um valor observado de hematcrito igual a 40%, de 13,97 g/dl.
Suponha que desejemos considerar o hematcrito como varivel dependente. Neste caso, podemos calcular outra reta de regresso, pelo mtodo dos mnimos quadrados, considerando a hemoglobina como varivel x (independente) e o hematcrito como varivel y (dependente).Reta de Regresso & EstimativaEstimativa da Medida de Hematcrito O valor de hematcrito mdio estimado, para um valor observado de hemoglobina Hb = 13,97 g/dl, de 40,54%. Note que a reta, para Ht, no a inversa da obtida para Hb.
Exemplo 1:Encontre a linha de regresso dos mnimos quadrados para os dados sobre renda e gasto com alimentao nos sete domiclios apresentados na tabela abaixo. Utilize renda como uma varivel independente e gasto com alimentao como uma varivel dependente.
Renda xGasto com Alimentao yxyx235931512254915735240121714744139114291521155752252882247842592256252126421507222
Qualidade do Ajuste na Regresso Coeficiente de DeterminaoR2 = proporo da variabilidade de y que explicada pelo modelo (reta de regresso)Se R2 = 0,90 significa que 90% da variao em y pode ser explicada pela equao obtida.
Qualidade do Ajuste na Regresso Coeficiente de DeterminaoQuando fazemos uma regresso linear, os valores observados (x,y) esto espalhados ao redor da reta de regresso. Quanto menor for este espalhamento, melhor a reta de regresso representa o conjunto de valores observados. A varincia amostral total, como estimador do espalhamento, pode ser decomposta da seguinte forma:
Qualidade do Ajuste na Regresso Coeficiente de DeterminaoExemplo 2:Para os dados da tabela do exemplo 1, sobre rendas mensais e gastos mensais com alimentao de sete domiclios, calcule o coeficiente de determinao.b=0,2642SQxy=211,7143SQyy=60,8571