81
Polimorfismos de nucleotídeos únicos em espécies poliplóides Ramon Oliveira Vidal Email: [email protected] Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador: Gonçalo A.G. Pereira LGE - Laboratório de Genômica e Expressão @ramonvidal

SNPs e Polimorfismo

Embed Size (px)

Citation preview

Page 1: SNPs e Polimorfismo

Polimorfismos de nucleotídeos únicos em

espécies poliplóidesRamon Oliveira Vidal

Email: [email protected] em Genética e Biologia Molecular

Sub área: BioinformáticaOrientador: Gonçalo A.G. Pereira LG

E - L

abor

atór

io d

e G

enôm

ica

e E

xpre

ssão

@ramonvidal

Page 2: SNPs e Polimorfismo

Marcadores Moleculares◦ Marcadores por Hibridação◦ Marcadores por Amplificação

Polimorfismos X mutações SNPs

◦ Origem◦ Aplicações◦ Haplótipos◦ Genotipagem◦ Identificando os SNPs (em genomas e transcriptomas)

Sanger 454 Solexa

Taxa de evolução Identificação de SNPs em Coffea arabica

Tópicos da Apresentação

Page 3: SNPs e Polimorfismo

Fenótipo Propriedades observáveis de um indivíduo, que

se desenvolveram sob a influência de: genótipo do indivíduo fatores ambientais

Fenótipo e Genótipo

Genótipo Constituição genética de um organismo

como revelada pela análise genética e molecular, ou seja, o conjunto completo de genes, tanto dominantes e recessivos.

Page 4: SNPs e Polimorfismo

Qualquer característica morfológica ou molecular que diferencia indivíduos, e que seja facilmente detectável

Marcadores

Page 5: SNPs e Polimorfismo

É um fenótipo de fácil identificação, normalmente determinado por um único alelo.

Características fenotípicas de fácil identificação visual são utilizadas como marcadores morfológicos desde os tempos de Mendel

Marcadores Morfológicos

Page 6: SNPs e Polimorfismo

Polimorfismo detectado na seqüência de DNA Vantagens:

- Não é objeto de influências ambientais;- Praticamente ilimitado em número;

Maior desvantagem é a necessidade de técnicas e equipamentos mais complexos.

Marcadores de DNA (moleculares)

Page 7: SNPs e Polimorfismo

Reprodutibilidade; Amplamente distribuído através do genoma;

Poder de discriminação; Ausência de influências ambientais; Barato; Fácil de mensurar

Características Desejáveis aos marcadores moleculares

Page 8: SNPs e Polimorfismo

Diplóide: Constituído por duas cópias (homólogos) de cada cromossomo.

Alelo: As formas alternativas de um caráter genético encontrado em um determinado locus de um cromossomo.

Homozigotos: Um organismo diplóide com alelos idênticos de um determinado gene em ambos os cromossomos homólogos.

Heterozigotos :Um organismo diplóide com alelos diferentes de um determinado gene em ambos os cromossomos homólogos.

Alguns conceitos básicos

Page 9: SNPs e Polimorfismo

Diplóide

Haplóide

Alelos

homozigoze

heterozigoze

Page 10: SNPs e Polimorfismo

Hibridação◦ RFLP – (Restriction Fragment Length Polymorphism)◦ Minissatélites – VNTR –(Variable Number of Tandem

Repeats)

Amplificação de DNA◦ RAPD – (Random Amplified Polymorphic DNA)◦ SCAR (Sequence Characterized Amplified Regions)

ou ASA (Amplified Specific Amplicon)◦ Microssatélites –SSR (Simple Sequence Repeats)◦ AFLP (Amplified Fragment Length Polymorphism)

Tipos de marcadores

Page 11: SNPs e Polimorfismo

RFLP – Restriction Fragment Length Polymorphism

Page 12: SNPs e Polimorfismo

RFLP – Restriction Fragment Length Polymorphism

Page 13: SNPs e Polimorfismo

RAPD - Random Amplified Polymorphic DNA

Polimorfismo de DNA entre indivíduos pode ser devido a:• Ausência do sítio do

primer.• Surgimento de um novo

sítio.• Ao comprimento da

região amplificada entre sítios de primer

Page 14: SNPs e Polimorfismo

Significa Seqüências Simples Repetidas, a qual consiste de pequenas seqüências de nucleotídeos (1 a 4) repetidas em tandem.

Essas seqüências são distribuídas ao acaso no genoma e é um dos marcadores mais utilizados atualmente

Microssatélites – SSR (Simple Sequence Repeats)

Page 15: SNPs e Polimorfismo

Primers específicos (20 a 30 pb). Diferentes números de elementos simples

repetidos. Cada segmento amplificado de tamanho

diferente representa um alelo diferente do mesmo loco

Microssatélites – SSR (Simple Sequence Repeats)

Page 16: SNPs e Polimorfismo

Genótipos na eletroforese

Page 17: SNPs e Polimorfismo

Mutações genéticas◦ Alteração na seqüência de nucleotídeos de uma molécula de

DNA. ◦ O termo "mutação“ é geralmente usado para referir-se a

alterações na seqüência de DNA que não estão presentes na maioria dos indivíduos de uma espécie

Polimorfismos genéticos◦ Diferença na seqüência de DNA entre indivíduos, grupos ou

populações. ◦ Incluem SNPs, seqüências repetitivas, inserções, deleções e

recombinações. Podem dar origem a olhos ou olhos castanhos, cabelo liso ou cabelos

crespo◦ Resultado de processos naturais ou induzidos por agentes

externos (como vírus ou radiação).

Polimorfismos genéticos X Mutações genéticas

Page 18: SNPs e Polimorfismo

Polimorfismos genéticos X Mutações genéticas

Polimorfismos são alterações no DNA que se mantém nas gerações futuras◦ Polimorfismo: variação >1%◦ Mutação: variação <1%

C T T A G C T T

C T T A G T T T

Polimorfismo

C T T A G C T T

C T T A G T T T

Mutação

94%

6%

99.9%

0.1%

Page 19: SNPs e Polimorfismo

TAAAAAT

TAACAAT

TAAAAAT TAAAAAT TAACAAT TAACAAT TAACAAT

TAAAAAT TAACAAT

TAAAAAT

• Polimorfismos foram mutações que se propagaram ao longo de gerações

Polimorfismos genéticos X Mutações genéticas

Page 20: SNPs e Polimorfismo

Single Nucleotide Polymorphism, ou SNP ("snip"):

◦ pequena mudança, ou variação, que pode ocorrer em um único nucleotídeo numa sequência de DNA em uma porção significativa (mais de 1%) de uma população.

SNPs

Page 21: SNPs e Polimorfismo

SNPs são as mais frequêntes formas de variações genéticas◦90% das variações genéticas humanas vêm dos SNPs

SNPs tem se tornado marcadores de preferência pela sua grande abundância e pelo desenvolvimento de tecnologias de genotipagem em larga escala.

Single Nucleotide Polymorphism

Page 22: SNPs e Polimorfismo

SNPs em menor quantidade em genes do que em regiões não-codificantes

Menor quantidade de SNPs nos cromossomos sexuais (humano). Dentro de um único cromossomo, SNPs podem se concentrar em

uma região específica, geralmente implicando uma região de interesse ou de pesquisa.

Em média, ocorrem a cada 300~600 nucleotídeos (humano). Genes com maior pressão para modificação tem maior frequência

de SNP (resistência, adaptação, interação parasita-hospedeiro, etc)

Distribuição dos SNPs

Page 23: SNPs e Polimorfismo

Intra espécie◦Diversidade entre os indivíduos de uma

mesma espécie◦Reflete os SNPs entre os alelos (espécies

diplóides) Inter espécies

◦Diversidade entre espécies diferentes

SNPs intra/inter específicos

Page 24: SNPs e Polimorfismo

Não-codificantes Codificantes

Sinônimas Não-sinônimas

conservativas Não-conservativas

Classificação dos SNPTransições

Purina<->PurinaPirimidina<->Pirimidina

TransversõesPurina<->Pirimidina

Page 25: SNPs e Polimorfismo

Genotipagem ◦ Detecção de genótipos de individuos. ◦ Pode ser realizada observando os SNPs.

Haplótipo (genótipo haplóide) ◦ Alelo encontrado em um único cromossomo que

apresenta o mesmo padrão de SNPs. ◦ Blocos haplótipos e tendem a ser herdados

juntos.◦ Podem servir como marcadores de doença

genética. ◦ A análise de haplótipos é útil na identificação

de eventos de recombinação.

Page 26: SNPs e Polimorfismo

Blocos de haplótipos Dentro de um bloco haplótipo, acontece

pouca ou nenhuma recombinação Os SNPs dentro de um bloco haplótipo são

passados juntos nas gerações futuras

Page 27: SNPs e Polimorfismo

haplótipos Um haplótipo é um conjunto de SNP no

mesmo cromossomo

SNP1 SNP2 SNP3

-A C T T A G C T T-

-A A T T T G C T C-

-A C T T T G C T C-

Haplotype 2

Haplotype 3

C A T

A T C

C T CHaplotype 1

SNP1 SNP2 SNP3

Page 28: SNPs e Polimorfismo

Zonas de recombinação e Blocos de haplótipos

Recombinationhotspots

Chromosome

Haplotypeblocks

C1 C2 C1S1

S2

S3

S4

S5

S1

S2

S3

S4

S5

SNP loci

Haplotype patterns : Major allele

: Minor allele

SNP loci

C2

I1 I2

Page 29: SNPs e Polimorfismo

SNPs estão relacionados com a diversidade de genótipos de humanos◦ podem ser mapeados relacionando-os a

diversidade de fenótipos. Um SNP individual ou um bloco haplótipo

pode servir de indicação para◦ características agronômicas◦ doenças◦ etc

Essa relação constitui a base e a motivação para a identificação e genotipagem de SNPs.

Blocos de Haplótipos

Page 30: SNPs e Polimorfismo

O genoma de cada indivíduo contém distintos padrões de SNPs

Pessoas podem ser agrupadas de acordo com esse perfil

Perfil de SNPs são importantes na identificação de respostas a terapias◦ Existe uma correlação entre certos perfis de

SNPs e respostas específicas a tratamentos

Genotipagem e utilizando SNPs como marcadores

Page 31: SNPs e Polimorfismo

Genoma/transcriptoma◦Sanger◦454◦Solexa/Solid/...

Alinhamento de sequências Identificação de Discrepâncias

Identificação de SNPs através da análise de sequencias

Page 32: SNPs e Polimorfismo

Encontrando SNPs: Mineração de SNPs baseados no sequenciamento

(Sanger tradicional)

Sequenciamento De DNA

mRNA

cDNALibrary

ESTOverlap

Genomic

BACLibrary

RRSLibrary

BACOverlap

ShotgunOverlap

Page 33: SNPs e Polimorfismo

Fragment DNA

DNA from multiple individuals

Sequence and Reassemble (known sequence) Assembly with other overlapping

GTTACGCCAATACAGGATCCAGGAGATTACCGTTACGCCAATACAGCATCCAGGAGATTACC

mismatches = SNPs

Encontrando SNPs: Mineração de SNPs baseados no sequenciamento

Page 34: SNPs e Polimorfismo

Base-calling Contig assembly

Sequence viewingPolymorphism tagging

Relatório de polimorfismosGenotipagem individual

Polymorphism detection

PolyPhred

Consed

Analysis

Sequenciamento Phred PhrapAmplificação do DNA5’ 3’

Vários indivíduos

Page 35: SNPs e Polimorfismo

SNP Discovery - Sanger sequencing (EST)

Page 36: SNPs e Polimorfismo

SNP Discovery - Diploids (heterozygous loci)

Page 37: SNPs e Polimorfismo

Sequenciamentos de Nova geração para a

identificação de SNPs

Page 38: SNPs e Polimorfismo

Método Sanger foi o único utilizado por 30 anos

Sanger processa em paralelo 96 sequencias enquanto NGS processa milhões de sequencias a um custo 6X menor.

Problemas:◦ Fidelidade dos dados◦ Tamanho dos reads◦ Custo da infraestrutura◦ Manipular grandes volumes de dados

Sanger vs NGS

Page 39: SNPs e Polimorfismo

Problemas do tamanho da sequência

Sequencias curtas não mapeiam unicamente em um lugar no genoma.

Solução #1: Reads longos. Solução #2: Reads pareados.

ACTTAAGGCTGACTAGC TCGTACCGATATGCTG

Page 40: SNPs e Polimorfismo

Sequenciamentos de Nova Geração

Page 41: SNPs e Polimorfismo
Page 42: SNPs e Polimorfismo

Necessário ter uma montagem de referência Mapeamento dos reads na referencia Coberturas médias necessárias:

◦ Solexa - 100X, 454 - 10X Análise estatística para validar discrepâncias com base na

redundância dos dados Muitos Softwares disponíveis Desenvolvimento de algorítmos para aumentar velocidade

de processamento

Ferramentas para descoberta de SNPs em reads curtos

Page 43: SNPs e Polimorfismo

http://seqanswers.com/wiki/Special:BrowseData

Page 44: SNPs e Polimorfismo

SNP Discovery: Goal

sequencing errors SNP

Page 45: SNPs e Polimorfismo
Page 46: SNPs e Polimorfismo
Page 47: SNPs e Polimorfismo

SNP Discovery

AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA

strain 1

strain 2

strain 3

haploid

individual 1

individual 3

individual 2

diploid

AACGTTCGCATAAACGTTCGCATA

AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA

AACGTTAGCATAAACGTTAGCATAAACGTTCGCATAAACGTTCGCATA

AACGTTCGCATAAACGTTCGCATAAACGTTCGCATAAACGTTCGCATA

AACGTTAGCATAAACGTTAGCATA

Page 48: SNPs e Polimorfismo

Para inferir uma taxa de evolução a um gene são estimados o KA e o KS

KA - é a relação entre substituições não sinônimas e todos os possíveis sitios não sinônimos

KS – é a relação entre substituições sinônimas e todos os possíveis sítios sinônimos

Taxa de Evolução – kaks ou dn/ds

Page 49: SNPs e Polimorfismo

Exemplo:

Prolina:◦CCT◦CCA◦CCG◦CCC

Um sítio sinônimo e dois não sinônimos

Page 50: SNPs e Polimorfismo

A taxa KA/KS é uma medida clássica da evolução de maneira global num gene

KA/KS << 1 indica que uma substancial proporção de mudanças de aminoácidos devem ter sido eliminadas por seleção de purificação.

KA/KS > 1 indica seleção adaptativa ou positiva

KA/KS (dn/ds)

Page 51: SNPs e Polimorfismo

NG: Nei, M. and Gojobori, T. (1986) - Faster LWL: Li, W.H., et al. (1985) LPB: Li, W.H. (1993) and Pamilo, P. and

Bianchi, N.O. (1993) MLWL (Modified LWL), MLPB (Modified LPB):

Tzeng, Y.H., et al. (2004) YN: Yang, Z. and Nielsen, R. (2000) MYN (Modified YN): Zhang, Z., et al. (2006) GY: Goldman, N. and Yang, Z. (1994) MS (Model Selection), MA (Model Averaging)

KaKs_calculator - Métodos

Page 52: SNPs e Polimorfismo

A taxa de KAKS em humanos e chimpanzes é de 0,23.

Assumindo que mutações sinônimas são neutras, esse resultado implica que 77% das alterações de aminoácidos em genes hominideos são suficientemente deletérias e são eliminadas por seleção natural. Como mutações sinônimas não são totalmente neutras, a proporção de alterações de aminoácido neutras com consequências deletérias deve ser maior

Page 53: SNPs e Polimorfismo

Identificação de SNPs e haplótipos na poliplóide Coffea arábica

Page 54: SNPs e Polimorfismo

Objetivos principais Identificar e caracterizar SNPs em

sequências de EST Identificar os haplótipos com base nos

padrões de SNPs Identificar kaks

Foram utilizados dados de duas espécies de café:◦ Coffea arabica,◦ Coffea canephora

Page 55: SNPs e Polimorfismo

Coffea canephora Espécie diplóide Polinização cruzada: Alógama. Alta variabilidade C. canephora é melhor adaptada ao clima

equatorial úmido e quente Cultivada em baixas e médias altitudes Qualidade de bebida inferior Mais resistente a diversas condições do

que Coffea arabica, em particular a doenças e pragas.

Page 56: SNPs e Polimorfismo

Coffea arabica Allopoliploide (tetraplóide) Autógama Baixa variabilidade Originada de um cruzamento recente

(1mya) entre Coffea eugenoides e Coffea canephora

Espécie mais cultivada. Ocupa 75% das plantações mundiais de café.

Qualidade da bebida excelente.

Page 57: SNPs e Polimorfismo

Poliploidia

Page 58: SNPs e Polimorfismo

SoftwaresCAP3 para montagem dos ESTQualitySNP KaKs_calculatorScripts PERL

Page 59: SNPs e Polimorfismo

A montagem 95% similaridade por 100bp

◦Previnir agrupamento de parálogos Remover clusters com menos de 4 ESTs

Remover clusters com mais de 500 ESTs◦Evitar contigs mal formados

Page 60: SNPs e Polimorfismo

QualitySNP Analisar informações do CAP3 (Arquivo ACE) Detecção de SNPs

◦ Filtros◦ Reconstrução de haplótipos

Detecção de polimorfismos sinônimos e não sinônimos com o FASTY

Construir Banco de dados com os dados gerados.

Page 61: SNPs e Polimorfismo

Filtro 1 – Detectar SNPs potenciais Detecta todos os SNPs bi, tri e tetra

alélicos Cada alelo é representado com mais de

uma sequencia. ◦ Excluindo SNPs singlets

Classificação dos SNPs como intra ou inter espécies

Page 62: SNPs e Polimorfismo

Filtro 2 – Reconstrução dos haplótipos Agrupa sequências que representam um

mesmo alelo Tem os mesmos nucleotídeos nos sítios

polimorficos. Utiliza métodos matemáticos para

minimizar falsas reconstruções de haplótipos

Exclui haplótipos formados por apenas uma sequencia

Page 63: SNPs e Polimorfismo

Filtro 3 – Busca SNPs com alto score de confiabildade É calculado de acordo com a ocorrencia do

SNP em cada alelo com relação às regiões de alta e baixa qualidade

O score de confiabilidade é o menor valor Descartados valores abaixo de 2

Page 64: SNPs e Polimorfismo
Page 65: SNPs e Polimorfismo
Page 66: SNPs e Polimorfismo

Identificação de SNPs não-sinônimos Fasty

◦ Produz menores alinhamentos em sequencias de baixa qualidade

Detecção da ORF Correção de frameshifts Detecção de sSNP/nsSNP e SNPs ou INDELs

em regiões UTR Kaks Calculator

Page 67: SNPs e Polimorfismo

The database

Page 68: SNPs e Polimorfismo

Identificação dos ancestrais haplótipos Padrões diferentes de expressão dos

homeologos Contribuição de cada ancestral de arabica

no transcriptoma relacionando ao fenótipo Genes com maior pressão seletiva para

mudança Genes com maior pressão seletiva para

estabilização Artigo submetido e em revisão

Resultados

Page 69: SNPs e Polimorfismo

LGE - BioinformáticaGenômica, Transcriptômica, Biologia Sintética,

Biologia de Sistemashttp://www.lge.ibi.unicamp.br

Page 70: SNPs e Polimorfismo

Projetos

Page 71: SNPs e Polimorfismo

Projetos

Page 72: SNPs e Polimorfismo

Projetos

Page 73: SNPs e Polimorfismo

Projetos

Page 74: SNPs e Polimorfismo

Projetos

Page 75: SNPs e Polimorfismo

Projetos

Page 76: SNPs e Polimorfismo

Projetos

Page 77: SNPs e Polimorfismo

Projetos

Page 78: SNPs e Polimorfismo

Projetos

Page 79: SNPs e Polimorfismo

Projetos

Page 80: SNPs e Polimorfismo

O LGE

Page 81: SNPs e Polimorfismo