Upload
isaura
View
52
Download
0
Embed Size (px)
DESCRIPTION
Evoluzione Molecolare. Studia le velocità e il tipo di sostituzioni che avvengono nel materiale genetico e nei suoi prodotti. EVOLUZIONE MOLECOLARE. DIMENSIONE TEMPO. pura descrizione. meccanismi evolutivi. DINAMICA. CINEMATICA. OBIETTIVI. individuazione delle costrizioni funzionali - PowerPoint PPT Presentation
Citation preview
Studia le velocità e il tipo di sostituzioni che
avvengono nel materiale genetico e nei suoi prodotti.
Evoluzione Molecolare
DIMENSIONE
TEMPO
CINEMATICA DINAMICA
OBIETTIVI
individuazione delle costrizioni funzionali
comprensione dei processi evolutivi
studi filogenetici, relazioni tassonomiche
pura descrizione meccanismi evolutivi
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
Geni
Genomi
Organismi
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
Livelli di analisi
inter taxa
inter phyla
inter specie
intra specie
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
Scelta delle sequenze
geni ortologhi
geni paraloghi
altre regioni (non codificanti, regolatorie)
genomi completi
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
speciazione
duplicazione genica
specie 1
specie 2
gene β 1
gene α 1 gene α 2 gene β 2
speciazione
ort
olo
gia
e p
ara
log
ia
Evoluzione della famiglia genica della beta-globina umana
Evoluzione della famiglia genica della beta-globina umana
5’ 3’
1 2
Embrionale Fetale Pseudogene Adulta
0
100
200Myaduplicazione genica
MutazioniMutazioni
sostituzioni nucleotidiche
delezioni
inserzioni
inversioni
A
G
C
T
- transizioni
- transversioni
Zuckerkandl and Pauling (1962)
IPOTESI DELL’ OROLOGIO MOLECOLAREIPOTESI DELL’ OROLOGIO MOLECOLARE
tempo
sostituzioni/sito
OROLOGIO MOLECOLAREOROLOGIO MOLECOLARE
Alcuni geni (o gruppi di geni) possono evolvere sotto distinte pressioni evolutive dettate da costrizioni funzionali peculiari di un particolare lineage
Geni provenienti da compartimenti distinti (es. mitocondrio, nucleo) possono evolvere secondo differenti pressioni evolutive
I geni possono mostrare un “bias” composizionale in alcuni lineage
A C T G A A C G T A A C G C
A C T G A A C G T A A C G C
A C T G A A C G T A A C G C
T AT
G G
T A
Confronto delle sequenze attuali
sostituzione singolasostituzione multipla
sostituzione convergente
sostituzioni coincidenti
A a T G g A C G T A a C G C
t C T G g A C G T A A C G C
Sequenza ancestraleSequenza ancestrale
tempo
Sequenze discendenti
Tipi di sostituzioni nucleotidicheTipi di sostituzioni nucleotidiche
sostituzione singola1 cambio, 1 differenza
A C
A C
A
T A
A CA
C TG C
A C
A
A G
C C
A C
A
A C
T T
A T
A
C TA C
A A
A CA
C A
sostituzione multipla2 cambi, 1 differenza
sostituzione coincidente2 cambi, 1 differenza
sostituzione parallela2 cambi, 0 differenze
sostituzione convergente3 cambi, 0 differenze
retro-sostituzione2 cambi, 0 differenze
Modelli
deterministici: basati sulla osservazione dei
caratteri
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
stocastici (probabilistici
dipendenti dal tempo): basati sulla misura
delle diversità
p53a.msf MSF: 422 Type: P September 20, 1995 11:41 Check: 5970 ..
Name: mouse Len: 422 Check: 3385 Weight: 1.00 Name: rat Len: 422 Check: 877 Weight: 1.00 Name: hamster Len: 422 Check: 2423 Weight: 1.00 Name: g_monkey Len: 422 Check: 6876 Weight: 1.00 Name: r_monkey Len: 422 Check: 7388 Weight: 1.00 Name: human Len: 422 Check: 6515 Weight: 1.00 Name: cow Len: 422 Check: 4340 Weight: 1.00 Name: sheep Len: 422 Check: 9625 Weight: 1.00 Name: cat Len: 422 Check: 496 Weight: 1.00 Name: chicken Len: 422 Check: 6526 Weight: 1.00 Name: xenopus Len: 422 Check: 9659 Weight: 1.00 Name: trout Len: 422 Check: 7860 Weight: 1.00
351 400 mouse GEYFTLKIRG RKRFEMFREL NEALELKDA. HATEESGDSR AHSSYLKTKK rat GEYFTLKIRG RERFEMFREL NEALELKDA. RAAEESGDSR AHSSYPKTKK hamster GEYFTLKIRG QERFKMFQEL NEALELKDA. QALKASEDSG AHSSYLKSKKg_monkey GEYFTLQIRG RERFEMFREL NEALELKDA. QAGKEPAGSR AHSSHLKSKKr_monkey GEYFTLQIRG RERFEMFREL NEALELKDA. QAGKEPAGSR AHSSHLKSKK human GEYFTLQIRG RERFEMFREL NEALELKDA. QAGKEPGGSR AHSSHLKSKK cow GEYFTLQIRG FKRYEMFREL NDALELKDA. LDGREPGESR AHSSHLKSKK sheep GEYFTLQIRG RKRFEMFREL NEALELMDA. QAGREPGESR AHSSHLKSKK cat GEYFTLQIRG RERFEMFREL NEALELKDA. QSGKEPGGSR AHSSHLKAKK chicken NEIFYLQVRG RRRYEMLKEI NEALQL.... ....AEGGSA PRPSKGRRVK xenopus EEIFTLRIKG RSRYEMIKKL NDALELQESL DQQKVTIKCR KCRDEIKPKK trout DEIYTLQIRG KEKYEMLKKF NDSLELSELV PVADADKYRQ KCLTKRVAKR
1 50 mouse MTAMEESQSD ISLELPLSQ. ETFSGLWKLL PPEDILP... ..SPHCMDDL rat ...MEDSQSD MSIELPLSQ. ETFSCLWKLL PPDDILPTTA TGSPNSMEDL hamster ...MEEPQSD LSIELPLSQ. ETFSDLWKLL PPNNVLSTLP ..SSDSIEELg_monkey ...MEEPQSD PSIEPPLSQ. ETFSDLWKLL PENNVLSPLP ...SQAVDDLr_monkey ...MEEPQSD PSIEPPLSQ. ETFSDLWKLL PENNVLSPLP ...SQAVDDL human ...MEEPQSD PSVEPPLSQ. ETFSDLWKLL PENNVLSPLP ...SQAMDDL cow ...MEESQAE LNVEPPLSQ. ETFSDLWNLL PENNLLSSEL ...SAPVDDL sheep ...MEESQAE LGVEPPLSQ. ETFSDLWNLL PENNLLSSEL ...SAPVDDL cat ...MQEPPLE LTIEPPLSQ. ETFSELWNLL PENNVLSSEL ...SSAMNE. chicken ...MAEE... ..MEPLLEPT EVFMDLWSML PY........ .....SMQQ. xenopus ...M.EPSSE TGMDPPLSQ. ETFEDLWSLL PD..PLQTVT ....CRLDNL trout ...MAD.LAE .NVSLPLSQ. ESFEDLWKM. ..NLNLVAVQ .......PPE
////////////////////////////////////////////////////////////////
401 422 mouse ..GQSTSRHK KTMVKKVGPD SD rat ..GQSTSRHK KPMIKKVGPD SD hamster ..GQSASRLK KLMIKREGPD SDg_monkey ..GQSTSRHK KFMFKTEGPD SDr_monkey ..GQSTSRHK KFMFKTEGPD SD human ..GQSTSRHK KLMFKTEGPD SD cow ..RPSPSCHK KPMLKREGPD SD sheep ..GPSPSCHK KPMLKREGPD SD cat ..GQSTSRHK KPMLKREGLD SD chicken VEgPQPSCGK KLLQK....G SD xenopus ........GK KLLVKDEQPD SE trout DFGVGPKKRK KLLVKEEKSD SD
Modelli StocasticiModelli Stocastici
Markov
Jukes Cantor
Kimura
ˆ d 3
4 ln 1 43 p
Jukes Cantor t t + 1
qt1-
1-
B
C
1-qt 1-
1-
t t + 1
B
C
tt qq 211
2
tt qq 13/2113/2
Kimura
d ̂ QQP 2121ln21
dove P e Q rappresentano rispettivamente la frequenza osservata delle transizioni e delle transversioni
Proprietà
Nessuna assunzione “a priori” sulla matrice delle distanze ma semplice verifica della condizione di stazionarietà
Misura accurata delle fluttuazioni statistiche(Simulazione con il metodo del Bootstrap)(Simulazione con il metodo del Bootstrap)
C. Saccone, C. Lanave, G. Pesole and G. PreparataMethods in Enzymology (1990). Vol. 183, pp. 570 - 583
Modello Stazionario di Markov
=
i,j = A, C, G, T
Modello Stazionario di Markov
test
di
sta
zion
ari
età
CCAA
GG TT
Algoritmo Modello stocastico basato su una Modello stocastico basato su una catena di Markov che attraverso catena di Markov che attraverso l’equazione differenziale di l’equazione differenziale di Kolmogorov:Kolmogorov:
ddT
Pik(T) = 44
r = iPir (T)Rrk
calcola la matrice delle velocità 4x4 calcola la matrice delle velocità 4x4 R, indipendente dal tempo, che R, indipendente dal tempo, che descrive il processo di sostituzione descrive il processo di sostituzione nucleotidicanucleotidica
C. Saccone, C. Lanave, G. Pesole and G. PreparataMethods in Enzymology (1990). Vol. 183, pp. 570 - 583
Modello Stazionario di Markov
Alberi filogeneticiAlberi filogenetici
Albero <==> GrafoTopologia: nodi + ramiUn albero descrive le relazioni fra
ancestore e discendentiI nodi sono le unità tassonomicheNodo ancestrale e Nodi Intermedi (UT
o TU)Nodi Terminali (UTO o OTU): specie,
geni, popolazioni o individui
Alberi con radice o rooted
’ ancestore ==> percorso univoco
da ancestore a OTU
Alberi senza radice o unrooted
La radice è localizzata all’ interno di
un ramo che congiunge le specie in
esame con l’outgroup
Alberi filogeneticiAlberi filogenetici
UOMO MUCCA TOPO
Esempio di albero Rooted (con radice)Esempio di albero Rooted (con radice)
Alberi con radice o rooted:
Alberi quantitativi
La lunghezza dei rami è
direttamente proporzionale
ai tempi di divergenza fra le
UT
» Orologio Molecolare
Alberi filogeneticiAlberi filogenetici
A
B
C
D
E1
2
3
Esempio di albero Unrooted (senza radice)Esempio di albero Unrooted (senza radice)
1-3: Nodi dell’alberoA-E: OTU
Alberi senza radice o
unrooted: Alberi qualitativi
Descrivono
semplicemente le relazioni
evolutive fra le UT
Alberi filogeneticiAlberi filogenetici
Alberi basati sullo stato dei caratteri
- Massima Parsimonia
Alberi basati sulla misura delle distanze
- UPGMA
- Massima Verosimiglianza
- Neighbor - Joining
Alberi filogeneticiAlberi filogenetici
Metodi basati sulla Misura delle distanze
- UPGMA (albero con radice applicabile solo se rispettato l’orologio molecolare)
» Lunghezza dei rami proporzionale ai tempi di divergenza
- Neighbor Joining (albero senza radice quando non è rispettato l’orologio molecolare)
» Differente velocità nei diversi rami
Alberi filogeneticiAlberi filogenetici
T2
T1
A B C
T1=KAC + KBC
4r
T2=KAB
2r
Tempo di divergenza fra due specie = tempo impiegato nel processo di speciazione, ovvero tempo dell’isolamento riproduttivo
Metodi DeterministiciMetodi Deterministici Massima Parsimonia
Sito
Sequenza1234
Sito 2
Sito 3
Sito 5
Sito7
Sito 9
Alberi fenetici (fenogrammi): descrivono le relazioni fra le specie sulla base delle diversità o somiglianze morfologiche, molecolari e anatomiche
Alberi cladistici (cladogrammi): descrivono le relazioni di discendenza tra un gruppo di specie
Se l’orologio molecolare è rispettatoAlberi cladistici<==> Alberi fenetici
Alberi filogeneticiAlberi filogenetici
Alberi con radice o rooted
NR= (2n-3)!/2 (n-2) (n-2)!
Alberi senza radice o unrooted
NV= (2n-5)!/2 (n-3) (n-3)!
Alberi filogeneticiAlberi filogenetici
I dati per la costruzione degli alberi filogenetici: un solo gene puo essere sufficiente?
Quasi maiQuasi mai
Soluzione: – Analizzare piu’ di un gene
– Effettuare una stima della significatività statistica degli alberi ottenuti
Alberi filogeneticiAlberi filogenetici
Perche’ ?
– Per ricostruire la storia evolutiva delle specie o delle popolazioni in esame
– Tempo di divergenza fra 2 specie = tempo impiegato nel processo di speciazione ovvero dell’isolamento riproduttivo
Alberi filogeneticiAlberi filogenetici
I dati per la costruzione degli alberi filogenetici: un solo gene può essere sufficiente?
Quasi maiQuasi mai
Perche’? – Paralogia e ortologia dei geni– Evoluzione concertata (famiglie geniche) – Pressione mutazionale direzionata – Trasferimento orizzontale di un gene (dai batteri alle piante)– Polimorfismo – Fluttuazioni statistiche
Alberi filogeneticiAlberi filogenetici
Congruenza
metodologie
tipologie di dati
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
Congruenzametodologica
approcci molecolari
approcci molecolari/non molecolari
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
molecolari
nucleari
mitocondriali
morfologici
resti fossili
Congruenzasul tipo di dati
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
Genomi completi
Regioni regolatorie/codificanti
Congruenza
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
Limiti
sequenziamento
analisi
EVOLUZIONE MOLECOLAREEVOLUZIONE MOLECOLARE
Assenza (o scarsa presenza) di sequenze relative a specie rilevanti per gli studi filogenetici
Studi incentrati su specie ampiamente studiate
Sequenziamento: limitiSequenziamento: limiti
Analisi: limiti Analisi: limiti
Omoplasia: “rumori di fondo” causati da sostituzioni multiple, processi di sostituzione condizionati (perdita della condizione di stazionarietà), processi selettivi, ecc.
Geni diversi possono seguire differenti storie evolutive nello stesso gruppo di specie
Mancanza di riconoscimento di geni paraloghi nel campione in esame
“A gene tree can be accepted or rejected only in its entirety as an estimate of the species tree, and it is not legitimate to dissect out pieces or a cladogram as support for a favored hypothesis while rejecting the phylogenetic implication of the rest of the tree.”Ruvolo and Koh, Mol. Phyl. Evol 5: 439-440 (1996)
bootstrap bootstrap
+---------HUMAN +100.0 ! ! +----RHESUS ! +100.0 +-91.0 +----G MONKEY ! ! ! ! +----COW ! ! +100.0 ! +-40.0 +----SHEEP +100.0 ! ! ! +---------CAT ! ! ! ! +----MOUSE +-43.0 ! +100.0 ! ! +------69.0 +----RAT ! ! ! +-66.0 ! +---------HAMSTER ! ! ! ! ! +------------------------CHICKEN ! ! ! +-----------------------------XENOPUS ! +----------------------------------TROUT