Upload
doankiet
View
215
Download
0
Embed Size (px)
Citation preview
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
LGN5830 - Biometria de Marcadores GenéticosTópico 7: Mapeamento de QTLs I
Análise dos Marcadores Individualmente
Antonio Augusto Franco Garciahttp://about.me/augusto.garcia
Departamento de GenéticaESALQ/USP
2017
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Introdução
O que são QTLs?
Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo
Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar
1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E
Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)
Mapeamento: primeiro passo em direção a estudos mais detalhados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Marcadores - dados brutosAzul: Aa; amarelo: AA
1 2 3 4 5 6 7 8 9 10 11 12 13 14
17
1422
3038
4654
6270
7886
9410
3
Mouse Data
Marcadores
Indi
vídu
os
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Mapa Genético estimado
1 2 3 4 5 6 7 8 9 10 11 12 13 14
17
1422
3038
4654
6270
7886
9410
3
Mouse Data
Marcadores
Indi
vídu
os
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Mapa Genético
2 4 6 8 10 12 14
2
4
6
8
10
12
14
Markers
Mar
kers
c1
c1
Mapa construído
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Mapa Genético
0 10 20 30 40 50
Chromosome c1
Location (cM)
Indi
vidu
al
302928272625242322212019181716151413121110
987654321 ●
●
●
●
●●
●●
●
●
●●●●
●●●
●
●
●●
●●
●
●
●●●●
●●●
●
●
●●
●●
●
●
●●●●
●●●
●
●
●●
●●
●
●
●●●●
●●●
●
●
●●●
●●
●
●
●●●●
●●●
●
●
●●●
●●●
●●
●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●
●
●●
●●●●
●●●
●
●●
●
●
●●●
●●●
●●●●
●
●
●
●
●
●●●
●●●
●●●●
●●
●
●
●●
●●
●
●
●●●●
●●●
●
●
●●
●●
●
●
●●●●
●●●
●
●
●●
●●
●
●
●●●●
●●●
●
●
●●
●●
●
●
●●●●
●●●
●
●
●●●
●●
●
●
●●●●
●●●
●
●
●●●
●●●
●●
●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●●●
●●
●●●●
●●●
●
●●
●●●
●
●
●●
●●●●
●●●
●
●●
●
●
●●●
●●●
●●●●
●
●
●
●
●
●●●
●●●
●●●●
●●
●●
●●●
●
●●●●●
●●
●
●
●●
●●●
●
●●●●●
●●
●
●
●●
●●●
●
●●●●●
●●
●
●
●●
●●●
●
●●●●●
●●
●
●
●●
●●
●
●●●●●
●●
●
●
●●
●●
●
●●●●
●
●
●
●
●●
●
●●●●
●●●
●
●
●●
●
●●●●
●●●
●
●
●●
●
●●●●
●●●
●
●
●●
●
●●●●
●●●
●
●
●●
●
●●●●
●●●
●
●
●●
●
●
●●●●
●●●
●
●
●●
●
●
●●●●
●●
●
●
●
●●●
●●●
●●●●
●●
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Dados Fenotípicos e Genotípicos
Mouse DataBW
[1,] 50 1 1 1 1 1 1 1 1 1 1 1 1 1 1[2,] 54 1 1 1 1 1 1 1 1 1 1 1 1 1 0[3,] 49 0 1 1 1 1 1 1 1 1 1 1 1 1 1[4,] 41 0 0 0 0 0 0 0 0 0 0 0 0 0 0[5,] 36 1 1 1 1 1 1 1 1 1 1 1 1 1 1
...[99,] 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[100,] 45 1 1 1 1 0 0 0 0 0 0 0 0 0 0[101,] 43 1 1 1 0 0 0 0 0 0 0 0 0 0 0[102,] 37 0 0 0 0 0 0 0 0 0 0 0 0 0 1[103,] 35 1 0 0 0 0 0 0 0 0 0 0 0 0 0
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Caráter Quantitativo
2040
6080
100
BW (peso corporal)
Caráter Quantitativo
Indi
vídu
os
Histograma
BW
Fre
quên
cia
30 40 50 60 70 80
05
1015
20
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Dados Fenotípicos e Genotípicos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
15
914
2026
3238
4450
5662
6874
8086
9298
Marcadores
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Dados Fenotípicos e GenotípicosAzul: Aa; amarelo: AA
1 2 3 4 5 6 7 8 9 10 11 12 13 14
15
914
2026
3238
4450
5662
6874
8086
9298
Marcadores
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Dados Fenotípicos e Genotípicos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
14
710
1418
2226
3034
3842
4650
5458
6266
7074
7882
8690
9498
102
Marcadores
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Classes genotípicas
Mouse data
1 2 3 4 5 6 7 8 9 10 11 12 13 14
14
710
1418
2226
3034
3842
4650
5458
6266
7074
7882
8690
9498
102
Marcadores
30
40
50
60
70
80
Genotype
BW
M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
AA AB
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Classes genotípicas
Mouse data, M1
30
40
50
60
70
80
Genotype
BW
M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
AA AB
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Modelo Linear, Retrocruzamento
yj = µ+ βxj + εj
j = 1, 2, . . . , n
yj = valor fenotípico do indivíduo j
µ = intercepto
xj =
{1 se o indivíduo j tem genótipoMi/Mi
0 se o indivíduo j tem genótipoMi/mi
β = coeficiente de regressão linear (efeitos genéticos)
εj ∼ N(0, σ2)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Mouse - M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0
Note que β = tan(α) = µ1−µ0
1 = µ1 − µ0
Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0
Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Mouse - M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0
Note que β = tan(α) = µ1−µ0
1 = µ1 − µ0
Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0
Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Mouse - M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0
Note que β = tan(α) = µ1−µ0
1 = µ1 − µ0
Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0
Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Mouse - M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0
Note que β = tan(α) = µ1−µ0
1 = µ1 − µ0
Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0
Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistema de Equações
Feijão
yi = g + eiy1 = 4 = g + e1y2 = 5 = g + e2y3 = 2 = g + e3y4 = 3 = g + e4
ei: variável aleatóriaDistribuição de ProbabilidadesE(ei), V ar(ei)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistema de Equações
Feijão
yi = g + eiy1 = 4 = g + e1y2 = 5 = g + e2y3 = 2 = g + e3y4 = 3 = g + e4
ei: variável aleatóriaDistribuição de ProbabilidadesE(ei), V ar(ei)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistema de Equações
Feijão
yi = g + eiy1 = 4 = g + e1y2 = 5 = g + e2y3 = 2 = g + e3y4 = 3 = g + e4
ei: variável aleatóriaDistribuição de ProbabilidadesE(ei), V ar(ei)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Distribuição de Probabilidades do Erro
Distribuição Normal
0.0
0.2
0.4
0.0 2.5 5.0 7.5 10.0g
ei ∼ N(µ, σ2)
Sem viés: ei ∼ N(0, σ2)
Viés? Pode ser algum efeito que não mensuramos!
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Distribuição de Probabilidades do Erro
Distribuição Normal
0.0
0.2
0.4
0.0 2.5 5.0 7.5 10.0g
ei ∼ N(µ, σ2)
Sem viés: ei ∼ N(0, σ2)
Viés? Pode ser algum efeito que não mensuramos!
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Distribuição de Probabilidades do Erro
Distribuição Normal
0.0
0.2
0.4
0.0 2.5 5.0 7.5 10.0g
ei ∼ N(µ, σ2)
Sem viés: ei ∼ N(0, σ2)
Viés? Pode ser algum efeito que não mensuramos!
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Distribuição de Probabilidades do Erro
Distribuição Normal
0.0
0.2
0.4
0.0 2.5 5.0 7.5 10.0g
ei ∼ N(µ, σ2)
Sem viés: ei ∼ N(0, σ2)
Viés? Pode ser algum efeito que não mensuramos!
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Efeito não incluído no modelo
Feijão, problema na irrigação
yi = g + eiy1 = 4 + 1 = g + e1y2 = 5 + 1 = g + e2y3 = 2 + 0 = g + e3y4 = 3 + 0 = g + e4
Claramente, o erro não é centrado em 0 (e sim em 1/2)g será superestimado se assumirmos ei ∼ N(0, σ2)Violação de suposição
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Efeito não incluído no modelo
Feijão, problema na irrigação
yi = g + eiy1 = 4 + 1 = g + e1y2 = 5 + 1 = g + e2y3 = 2 + 0 = g + e3y4 = 3 + 0 = g + e4
Claramente, o erro não é centrado em 0 (e sim em 1/2)g será superestimado se assumirmos ei ∼ N(0, σ2)Violação de suposição
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Efeito não incluído no modelo
Feijão, problema na irrigação
yi = g + eiy1 = 4 + 1 = g + e1y2 = 5 + 1 = g + e2y3 = 2 + 0 = g + e3y4 = 3 + 0 = g + e4
Claramente, o erro não é centrado em 0 (e sim em 1/2)g será superestimado se assumirmos ei ∼ N(0, σ2)Violação de suposição
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Álgebra
Soma
Am,n +Bm,n =
[1 34 2
]+
[2 40 3
]=
[3 74 5
]Subtração
Am,n −Bm,n =
[1 34 2
]−
[2 40 3
]=
[−1 −14 −1
]Transposição
A⊤ =
[1 43 2
]; B⊤ =
[2 04 3
]
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Álgebra
Soma
Am,n +Bm,n =
[1 34 2
]+
[2 40 3
]=
[3 74 5
]Subtração
Am,n −Bm,n =
[1 34 2
]−
[2 40 3
]=
[−1 −14 −1
]Transposição
A⊤ =
[1 43 2
]; B⊤ =
[2 04 3
]
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Álgebra
Soma
Am,n +Bm,n =
[1 34 2
]+
[2 40 3
]=
[3 74 5
]Subtração
Am,n −Bm,n =
[1 34 2
]−
[2 40 3
]=
[−1 −14 −1
]Transposição
A⊤ =
[1 43 2
]; B⊤ =
[2 04 3
]
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Algumas Operações
Multiplicação[1 34 2
] [2 40 3
]=
[1(2) + 3(0) 1(4) + 3(3)4(2) + 2(0) 4(4) + 2(3)
]=
[2 138 22
][1 34 2
] [23
]=
[1(2) + 3(3)4(2) + 2(3)
]=
[1114
]
x =
[12
]; x⊤x =
[1 2
] [12
]= 1(1) + 2(2) = 12 + 22 = 5
x⊤x: Soma de Quadrados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Algumas Operações
Multiplicação[1 34 2
] [2 40 3
]=
[1(2) + 3(0) 1(4) + 3(3)4(2) + 2(0) 4(4) + 2(3)
]=
[2 138 22
][1 34 2
] [23
]=
[1(2) + 3(3)4(2) + 2(3)
]=
[1114
]
x =
[12
]; x⊤x =
[1 2
] [12
]= 1(1) + 2(2) = 12 + 22 = 5
x⊤x: Soma de Quadrados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Algumas Operações
Multiplicação[1 34 2
] [2 40 3
]=
[1(2) + 3(0) 1(4) + 3(3)4(2) + 2(0) 4(4) + 2(3)
]=
[2 138 22
][1 34 2
] [23
]=
[1(2) + 3(3)4(2) + 2(3)
]=
[1114
]
x =
[12
]; x⊤x =
[1 2
] [12
]= 1(1) + 2(2) = 12 + 22 = 5
x⊤x: Soma de Quadrados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
Notação: A−1
Buscar matrizA−1 tal queAA−1 = I (matriz identidade)
Não é trivial
Só é possível para matrizes de posto completo (não singulares)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
Notação: A−1
Buscar matrizA−1 tal queAA−1 = I (matriz identidade)
Não é trivial
Só é possível para matrizes de posto completo (não singulares)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
Notação: A−1
Buscar matrizA−1 tal queAA−1 = I (matriz identidade)
Não é trivial
Só é possível para matrizes de posto completo (não singulares)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
Notação: A−1
Buscar matrizA−1 tal queAA−1 = I (matriz identidade)
Não é trivial
Só é possível para matrizes de posto completo (não singulares)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
R
> A <- matrix(c(1,4,3,2),2)> A
[,1] [,2][1,] 1 3[2,] 4 2> solve(A)
[,1] [,2][1,] -0.2 0.3[2,] 0.4 -0.1> A %*% solve(A)
[,1] [,2][1,] 1 -5.551115e-17[2,] 0 1.000000e+00
> B <- matrix(c(2,1,3,-4),2)> B
[,1] [,2][1,] 2 3[2,] 1 -4> solve(B)
[,1] [,2][1,] 0.36363636 0.2727273[2,] 0.09090909 -0.1818182> B %*% solve(B)
[,1] [,2][1,] 1 0[2,] 0 1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
R
> C <- matrix(c(4,2,8,4),2)> C
[,1] [,2][1,] 4 8[2,] 2 4> solve(C)Erro em solve.default(C) :Lapack routine dgesv: system is exactly singular: U[2,2] = 0
> det(C)[1] 0> det(A)[1] -10
Pergunta: Matriz C : duas equações e duas incógnitas?
Resp.: Não, única equação: sistema inconsistente ou indeterminado
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
R
> C <- matrix(c(4,2,8,4),2)> C
[,1] [,2][1,] 4 8[2,] 2 4> solve(C)Erro em solve.default(C) :Lapack routine dgesv: system is exactly singular: U[2,2] = 0
> det(C)[1] 0> det(A)[1] -10
Pergunta: Matriz C : duas equações e duas incógnitas?
Resp.: Não, única equação: sistema inconsistente ou indeterminado
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
R
> C <- matrix(c(4,2,8,4),2)> C
[,1] [,2][1,] 4 8[2,] 2 4> solve(C)Erro em solve.default(C) :Lapack routine dgesv: system is exactly singular: U[2,2] = 0
> det(C)[1] 0> det(A)[1] -10
Pergunta: Matriz C : duas equações e duas incógnitas?
Resp.: Não, única equação: sistema inconsistente ou indeterminado
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Sistema de Equações
Solução única deAx = b: x0 = A−1b
> (A <- matrix(c(2,1,3,-4),2))[,1] [,2]
[1,] 2 3[2,] 1 -4> (b <- matrix(c(13,-11),2))
[,1][1,] 13[2,] -11> (x0 <- solve(A) %*% b)
[,1][1,] 1.727273[2,] 3.181818> (x0 <- solve(A,b))
[,1][1,] 1.727273[2,] 3.181818
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Modelo Estatístico
y1 = 4 = gy2 = 5 = gy3 = 2 = gy4 = 3 = g
y = Xθ4523
=
1111
[g]
Obviamente, o sistema é inconsistente
Não há solução possível para g
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Modelo Estatístico
y1 = 4 = gy2 = 5 = gy3 = 2 = gy4 = 3 = g
y = Xθ4523
=
1111
[g]
Obviamente, o sistema é inconsistente
Não há solução possível para g
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Quadrados Mínimos
Equações Normais
X⊤Xθ = X⊤y
θ0 = (X⊤X)−1(X⊤y)
Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)
Ajustes
y = Xθ0
e = y− y
Sob normalidade, estimativas de quadrados mínimos também sãoMLEs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Quadrados Mínimos
Equações Normais
X⊤Xθ = X⊤y
θ0 = (X⊤X)−1(X⊤y)
Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)
Ajustes
y = Xθ0
e = y− y
Sob normalidade, estimativas de quadrados mínimos também sãoMLEs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Quadrados Mínimos
Equações Normais
X⊤Xθ = X⊤y
θ0 = (X⊤X)−1(X⊤y)
Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)
Ajustes
y = Xθ0
e = y− y
Sob normalidade, estimativas de quadrados mínimos também sãoMLEs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Quadrados Mínimos
Equações Normais
X⊤Xθ = X⊤y
θ0 = (X⊤X)−1(X⊤y)
Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)
Ajustes
y = Xθ0
e = y− y
Sob normalidade, estimativas de quadrados mínimos também sãoMLEs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Quadrados Mínimos
Equações Normais
X⊤Xθ = X⊤y
θ0 = (X⊤X)−1(X⊤y)
Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)
Ajustes
y = Xθ0
e = y− y
Sob normalidade, estimativas de quadrados mínimos também sãoMLEs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Resultados
Feijão (cont.)
X⊤X =[1 1 1 1
] 1111
= 4
X⊤y =[1 1 1 1
] 4523
= 14
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Resultados
Feijão (cont.)
θ0 =1
4[14] =
7
2
y =
1111
[72
]=
72727272
e = y− y =
4
5
2
3
−
72727272
=
1232
−32
−12
Erro centrado, óbvio (por construção!)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Análise de Variância
Decomposição da variância de y
Somas de Quadrados
SQtot = y⊤y
SQres = e⊤e
SQpar = θo⊤X⊤y
Graus de liberdade: n, n− r[X] e r[X], respectivamenter[X]: “rank” de X (número de linhas/colunas linearmenteindependentes)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Análise de Variância
Feijão (cont.)
SQtot = y⊤y = 54
SQres = e⊤e = 5
SQpar = θo⊤X⊤y = 49
Para este modelo, SQpar é também chamada de “correção”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Extensão
Feijão, genotipado com ummarcador
g1 = 1,Mm; g2 = 2,MM4 = g + βg2 = g + β(2)5 = g + βg2 = g + β(2)2 = g + βg1 = g + β(1)3 = g + βg1 = g + β(1)
y = Xθ + e 4523
=
1 21 21 11 1
[gβ
]+ e
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Extensão
Feijão, genotipado com ummarcador
g1 = 1,Mm; g2 = 2,MM4 = g + βg2 = g + β(2)5 = g + βg2 = g + β(2)2 = g + βg1 = g + β(1)3 = g + βg1 = g + β(1)
y = Xθ + e 4523
=
1 21 21 11 1
[gβ
]+ e
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Análise Estatística
X⊤Xθ = X⊤y
> (y <- matrix(c(4,5,2,3),4))[,1]
[1,] 4[2,] 5[3,] 2[4,] 3> (X <- matrix(c(1,1,1,1,2,2,1,1),4))
[,1] [,2][1,] 1 2[2,] 1 2[3,] 1 1[4,] 1 1> (XtX <- crossprod(X,X))
[,1] [,2][1,] 4 6[2,] 6 10> (Xty <- crossprod(X,y))
[,1][1,] 14[2,] 23
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Análise Estatística
θ0 = (X⊤X)−1(X⊤y)
> (teta.zero <- solve(XtX,Xty))[,1]
[1,] 0.5[2,] 2.0
(Interprete os resultados)
y, e
> (y.hat <- X %*% teta.zero)[,1]
[1,] 4.5[2,] 4.5[3,] 2.5[4,] 2.5> (res <- y - y.hat)
[,1][1,] -0.5[2,] 0.5[3,] -0.5[4,] 0.5
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Análise Estatística
SQtot = y⊤y, SQres = e⊤e, SQpar = θo⊤X⊤y> (SQ.tot <- crossprod(y,y))
[,1][1,] 54> (SQ.par <- crossprod(teta.zero,Xty))
[,1][1,] 53> (SQ.res <- crossprod(res))
[,1][1,] 1
SQpar = SQg + SQβ
53 = 49 + 4 (49: modelo anterior)SQtot = SQpar + SQres = SQg + SQβ + SQres
54 = 49 + 4 + 1
Reordenando: 54− 49 = 4 + 1SQtot.corr = SQreg + SQres
R()
Inclusão de novo parâmetro: redução na SQres
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Testes de Hipóteses
Ho : β = 0 vsHa : β = 0
Sob normalidade,QMreg
QMres∼ F[1,GLres]
Mapeamento:
LRT = −2logL(g)
L(g, β)
Verossimilhança:
L(g) =
n∏i=1
1√2πσ2
e−(ei−0)2
2σ2
L(g, β) =n∏
i=1
1√2πσ2
e−(ei−0)2
2σ2
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Testes de Hipóteses
Ho : β = 0 vsHa : β = 0
Sob normalidade,QMreg
QMres∼ F[1,GLres]
Mapeamento:
LRT = −2logL(g)
L(g, β)
Verossimilhança:
L(g) =n∏
i=1
1√2πσ2
e−(ei−0)2
2σ2
L(g, β) =
n∏i=1
1√2πσ2
e−(ei−0)2
2σ2
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Testes de Hipóteses
Ho : β = 0 vsHa : β = 0
Sob normalidade,QMreg
QMres∼ F[1,GLres]
Mapeamento:
LRT = −2logL(g)
L(g, β)
Verossimilhança:
L(g) =
n∏i=1
1√2πσ2
e−(ei−0)2
2σ2
L(g, β) =n∏
i=1
1√2πσ2
e−(ei−0)2
2σ2
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Testes de Hipóteses
Ho : β = 0 vsHa : β = 0
Sob normalidade,QMreg
QMres∼ F[1,GLres]
Mapeamento:
LRT = −2logL(g)
L(g, β)
Verossimilhança:
L(g) =
n∏i=1
1√2πσ2
e−(ei−0)2
2σ2
L(g, β) =n∏
i=1
1√2πσ2
e−(ei−0)2
2σ2
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Conclusão
ModelosNotem o caráter geral da teoria apresentadaExemplos:
yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk
Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares
(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Conclusão
ModelosNotem o caráter geral da teoria apresentadaExemplos:
yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk
Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares
(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Conclusão
ModelosNotem o caráter geral da teoria apresentadaExemplos:
yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk
Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares
(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Conclusão
ModelosNotem o caráter geral da teoria apresentadaExemplos:
yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk
Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares
(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Conclusão
ModelosNotem o caráter geral da teoria apresentadaExemplos:
yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk
Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares
(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Conclusão
ModelosNotem o caráter geral da teoria apresentadaExemplos:
yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk
Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares
(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Estimação e Testes
Conclusão
ModelosNotem o caráter geral da teoria apresentadaExemplos:
yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk
Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares
(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Resultados
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Resultados
Análise no R
mouse.data <- read.csv("http://dl.dropbox.com/u/1968009/mouse.csv")mouse.data[1:10,]
plot(mouse.data[,2]~mouse.data[,3])
modelo <- lm(mouse.data[,2]~mouse.data[,3])
summary(modelo)
class(modelo)names(modelo)coefficients(modelo)
resumo <- summary(modelo)class(resumo)names(resumo)resumo$fstatisticresumo$coefficientsresumo$coefficients[2,1]resumo$coefficients[2,4]resumo$r.squared
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Resultados
Efeito do Marcador
Mouse data
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
30
40
50
60
70
80
0 1M1
BW
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Resultados
Regressão Linear
Mouse data
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
30
40
50
60
70
80
0.00 0.25 0.50 0.75 1.00M1
BW
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Resultados
Teste F
Mouse data
●
●
●
●
●
●
●
●
●
●
●
●
●
●
0 10 20 30 40 50
10
15
20
25
30
Análise de cada marcador − teste F
Mapa
Est
atís
tica
F
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Resultados
p-valores
Mouse data
●
●
●
●
●
●
●
●
●
●
●
●
●
●
0 10 20 30 40 50
10
15
20
25
30
Análise de cada marcador − teste F
Mapa
Est
atís
tica
F
●
●
●
●
●
●
●
●
●
●●
●●
●
0 10 20 30 40 50
2
3
4
5
6
Análise de cada marcador − p−valores
Mapa
−lo
g 10(p
−va
lor)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Referências
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Referências
Principais Referências
G. StrangIntroduction to Linear Algebra, 3rd ed.Wellesley-Cambridge Press, 2003, 578 p..
J. J. FarawayLinear Models with RChapman & Hall, 2009, 240 p.
M. Lynch, B. WalshGenetics and Analysis of Quantitative Traits, 1 ed.Sinauer Associates, Inc., 1998.
K.W. Broman, S. SenA Guide to QTL Mapping with R/qtl, 1 ed.New York, Springer, 2009.