La variabilità genetica a livello...

Preview:

Citation preview

La variabilità genetica a livello molecolare

Singole sost. nucleotidiche

Piccole inserzioni/delezioni

Microsatelliti

Minisatelliti

Altri VNTR

Inserzioni di elementi retrotrasponibili

Varianti strutturali microscopiche e submicroscopiche

Variabilità nel numero di cromosomi

Variabilità nel numero di ploidia

Generalmente non

polimorfici

(frequenza < 0.01%)

La variabilità genetica a livello molecolare

Dove si trovano le mutazioni?

Alcune mutazioni sono distribuite in

modo casuale nei cromosomi, altre

presentano una distribuzione non

omogenea

La variabilità genetica a livello molecolare

Tasso di mutazione

I differenti tipi di mutazione

differiscono circa il loro tasso di

mutazione per diversi ordini di

grandezza

DNA a sequenze ripetute

•sequenze distribuite a intervalli

regolari (ripetizioni intersperse),

•sequenze raggruppate insieme

(ripetizioni in Tandem)

Polimorfismi del DNA

Mutazioni di singole paia di basi

Inserzioni/delezioni

SNPs (polimorfismi di singoli nucleotidi)

gli SNPs comprendono gli RSP:

RSP (restriction site polymorphism) chegenerano RFLP (restriction fragment length polymorphism)

Polimorfismi del DNA

• VNTRs (variable number of tandem repeat) (MINIsatelliti)

• STRs (short tandem repeat) (MICROsatelliti)

Tipi di polimorfismo studiati nel DNA

1. SNP

2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010)2014: Almeno 67 milioni di SNPs nel genoma umano (Ensemble Rel. 75)

1. SNPs

SNPs

Transizioni

Tranversioni

Le transizioni sono 2 volte più

frequenti delle transversioni

E’ la forma di variazione del DNA più comune.

Confrontando due cromosomi umani omologhi, si osserverà una SNP

ogni mille basi

Confrontando una popolazione di cromosomi omologhi, si osserverà uno

SNP ogni 200 basi.

Le SNPs sono 10 volte più frequenti delle ins/del

Le mutazioni vengono distinte in base ai loro effetti sulla

lettura della tripletta che codifica un aminoacido:

Mutazioni missenso: cambiamento aminoacido;

Mutazioni nonsenso: cambiamento da codone che

specifica per aminoacido a codone di stop;

Mutazione neutra: cambiamento di un codone il cui

aminoacido non altera la funzionalità proteica;

Mutazione silente: cambiamento codone, ma non

dell’aminoacido (degenerazione del codice);

Mutazione frameshift: origina da inserzioni o delezioni:

alterazione schema di lettura del DNA.

Il dinucleotide CpG è un hotspot di mutazione

La maggior parte delle SNPs è neutra, ma in alcuni casi si producono effetti sull’espressione dei geni

Sequence Variation and SNP

DistributionSequence variation (quantity of SNPs) can be measured

in nucleotide diversity:

– the number of base differences between two genomes over the

total number of bases compared.

SNP Distribution is not uniform for any of the three

categories:

– Over a complete genome (1/3 in coding, 2/3 in non-coding).

– Over all the chromosomes (fewer SNPs in sex chromosomes).

– Over a single chromosome (SNPs often concentrated around a

specific location).

Tipi di polimorfismi studiati nel DNA

1. SNP: Costruzione di aplotipi

SNPs: aplotipo1. SNP: Restrizione

Come evidenziare il polimorfismo?

RFLP= restriction fragment length polymorphism

Enzimi di Restrizione

Sono endonucleasi di tipo II (classe delle idrolasi) in grado di tagliare

i legami fosfodiesterei del DNA per dare frammenti specifici.

L’attività endonucleasica e la funzione di metilazione del DNA sono

separate. Non hanno bisogno di ATP.

Endonucleasi di tipo I e III: sono

enzimi bifunzionali e necessitano di

ATP come coenzima.

Tipo I: taglio casuale

Tipo III: taglio in siti

specifici (24-26 coppie

di basi a valle del sito di

riconoscimento).

A volte la mutazione patogena puo’ abolire o creare direttamente un sito

di restrizione specifico (RFLP)

Mutazione che determina l’anemia falciforme, che distrugge un sito MstII e genera un RFLP specifico per la malattia

MstII: CCTNAGG

Lewin, IL GENE VIII, Zanichelli

editore S.p.A. Copyright © 2006

sito di restrizione

Gli enzimi di restrizione possono generare diversi tipi di estremità: coesive (sticky ends) e piatte (blunt ends)

1 2 3 4 5 6 7 8 9 10 1112131415 M

0.7 kb

0.4 kb

0.75 kb

1.25 kb

1.1 kb

0.4kb 0.7kb

BamHI* (Bacillus amyloliquefaciens)

Separazione su gel di agarosio dei frammenti originati dalla

digestione enzimatica del prodotto di PCR del DNA

proveniente da 15 diversi individui

I soggetti 1, 2, 6-10, 12,

14 e 15 sono omozigoti

per la presenza del sito

I soggetti 3, 5 e 11

sono eterozigoti per la

presenza/assenza del

sito

I soggetti 4 e 13 sono

omozigoti per

l’assenza del sito

Se le SNPs non si trovano su un sito di restrizione si

possono esaminare con:

•Sequenziamento

•HPLC (Denaturing high-performance liquid

chromatography)

•Microarray

SNPs: sequenziamento

1. SNP: Sequenziamento

Elettroferogramma

generato da un

sequenziatore automatico

N

Sito di

eterozigosi

C/G

individuo

omozigote

individuo

eterozigote

Rilevazione delle mutazioni

mediante DHPLC

Essa si basa sulla differente velocità

di migrazione, in un mezzo simile ad

un gel quale è la colonna HPLC, per

gli eteroduplex e omoduplex. Questi

duplex si formano quando un

frammento amplificato di DNA

mutato ed uno non mutato vengono

denaturati termicamente e lasciati

ricombinare (mismatch).

Una qualsiasi variazione tra la

molecola originale (wild type) e

quella

mutata porta alla formazione di un

eteroduplex (combinazione di due

catene di DNA a singola catena non

perfettamente corrispondenti,

caratterizzata dalla presenza di una

"bolla" dove c'è la mutazione).

L'eteroduplex si comporta cromatograficamente

in modo differente (solitamente più veloce)

La presenza di una mutazione si evidenzia sotto

forma di picchi ulteriori rispetto al "wild"; il grande

vantaggio per il ricercatore è che - pur non

caratterizzando la mutazione (cioè non viene

definito come è stata modificata la sequenza) - la

DHPLC è in grado di rivelarne la presenza

all'interno del frammento analizzato

Gli eteroduplex migrano

più lentamente rispetto

agli omoduplex

Tessuto della prostata,

normaleTessuto della prostata,

tumorale

Un microarray è un supporto solido

(vetro, silice o plastica) sul quale

sono stati posizionati diverse

migliaia di cDNA (sonde) in spot

separati. Ciascuno spot rappresenta

un gene, in quanto contiene

numerose copie di un cDNA

corrispondente a tale gene.

I microarrays(comunemente conosciuto come gene chip, chip

a DNA, biochip o matrici ad alta densità

In questo esempio i cDNA

sono stati posizionati su di un

vetrino, simile ai normali

vetrini usati per l’istologia.

I microarray sfruttano una tecnica di ibridazione inversa,

che consiste nel fissare tutti i segmenti di DNA (detti

probe o sonda) su un supporto e nel marcare invece

l'acido nucleico che vogliamo identificare (detto target). È

una tecnica che è stata sviluppata negli anni '90 e oggi

permette l'analisi dell'espressione genica monitorando in

una sola volta gli RNA prodotti da migliaia di geni.

DNA microarray: una collezione di microscopiche sonde (probe)

Ordinate

Miniaturizzate

Immobilizzate su una superficie solida (attualmente vetro)

I probe possono essere attaccati al substrato mediante:

-Legame diretto, fisico o chimico

-Legame indiretto, mediante molecole linker

•Risoluzione di 0.7 Kb

•1.8 milioni SNPs e oligonucleotidi che coprono regioni povere di SNPs combinati insieme

Affymetrix Genome-Wide Human SNP Array 6.0

Intensità di segnale rilevata da uno scanner e i dati elaborati da un software

PROTOCOLLO

Affimetrix 6.0

E’ possibile avere 500,000 probe in uno spazio di 1.28 cm2

Ogni singolo probe è costituito da milioni di oligonucleotidi identici

Il nuovo Affymetrix Genome-Wide Human SNP Array 6.0 caratterizza 1.8 milioni

di marcatori genetici, inclusi più di 906,600 single nucleotide polymorphisms

(SNPs) e più di 946,000 probes (sonde) per l’individuazione di copy number

variation (CNV). L’alto valore di rendimento dello SNP array 6.0 permette ai

ricercatori di progettare studi di associazione con un grande numero di campioni

Il recente progredire delle tecnologie array ha aperto la possibilità di genotipizzare

“economicamente” e rapidamente un intero gruppo di popolazione campione.

La disponibilità di milioni di SNPs fornisce una mappa di alta densità lungo tutto il

genoma, la quale può raggiungere adeguato potere per investigare varianti

genomiche associate con malattie multifattoriali.

I microarry rappresentano un sistema di analisi che velocizza considerevolmente

l’esplorazione genomica permettendo, infatti, di esaminare contemporaneamente

l’espressione di migliaia di geni o un ampio numero di polimorfismi genetici. Il

tutto con costi relativamente contenuti se rapportati al numero di geni o

polimorfismi analizzabili per esperimento.

Array di oligonucleotidi ad alta densitàIbridizzazione

La scannerizzazione del

chip ci fornisce

un’immagine in cui il

grado di ibridizzazione

viene evidenziato da una

diversa intensità di

emissione nel rosso. La

rilevazione dell’immagine

infatti è possibile grazie al

legame alla biotina di un

composto fluorescente

(streptavidina-ficoeritrina)

Array di oligonucleotidi ad alta densitàIbridizzazione

A differenza degli

array a DNA

spottato, il sistema

Affimetrix prevede

l’ibridizzazione di un

singolo campione

su ogni genechip

il microarray viene esposto ad una

sorgente di luce laser.

Gli spettri di emissione vengono

quindi raccolti da uno scanner e le

immagini monocromatiche indicanti i

livelli diversi di espressione genica

vengono pseudocolorate da un

software di acquisizione d’immagine.

De Risi J.L. et al Science 1997; 278:680-686.

Heller R.A. et al PNAS 1997; 94:2150-2155.

Principali applicazioni dei microarray

cDNA microarray: per misurare i livelli di espressione di determinati

geni

microarray SNP (“Single Nucleotide Polymorphism”) e array di

mutazione: per la genotipizzazione e identificazione di polimorfismi

(SNPs) in una popolazione.

microarray CGH (“Comparative Genomic Hybridization”): per

osservare perdite o guadagni di materiale genomico o un cambiamento

nel numero di copie di un gene particolare coinvolto in una malattia.

International HapMap Project

•Progetto iniziato nel 2002

•Si propone di “catalogare” le varianti comuni

del DNA umano in una Mappa degli Aplotipi

•Analizzati 270 soggetti provenienti da

differenti gruppi etnici

obiettivo 1SNPs ogni 5Kb

Per un totale di 3.8 milioni di SNPs

http://hapmap.ncbi.nlm.nih.gov/

Perché?

Oltre il 99,5% del genoma di Homo sapiens è identico in ogni

individuo. Perciò solo la restante parte contiene tutte le diversità

genomiche, alcune delle quali possono influenzare il rischio di

sviluppare malattie.

Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns of variation. Science.

CEPH panel

Illumina Bead Chip 650K (642,690)

N = 938genetic ancestry of each individual

individuals from the same population show similar ancestry proportions – population

structuring robust (confirmed also by PCA)

Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns of variation. Science.

maximum-likelihood tree

sub-saharan africa

middle east

europe

south/central asia

east asia

america

oceania

main result: confirmation of the Out of Africa

Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns of variation. Science.

Alcuni risultati

PCA: I e II componente

In nero

Ogliastra,

In rosso

Trexenta

e Sulcis

Copy Number Variations (CNVs)

Segmenti di DNA con estensione maggiore di 1 Kb presenti nel genoma con un

numero variabile di copie.

Contribuiscono:

• alle differenze fenotipiche tra gli individui

• alla patogenesi di malattie, sia mendeliane che multigeniche

Essendo noi diploidi (meta' del genoma ci viene dal padre e

meta' dalla madre), di ogni tratto di DNA o di ogni gene

abbiamo sempre un numero di copie pari a 2. Se ne abbiamo

3, 4, 5 (1, 2 3 copie in piu', rispettivamente), o 1 o zero, allora

abbiamo, per quel locus, una variazione del numero di copie.

Questa variabilita' insospettata della popolazione umana e'

stata giudicata come uno dei "breakthrough" (notizia bomba)

del 2007 da parte di Science.

Copy Number Variation (CNV)

Si è stimato che circa 360 MB di DNA sono soggette a copy number variation. Circa il 12% dell’intero genoma aploide

Essendo state trovate in individui normali, molte

di queste sembrano neutre. Pian piano, però, ha

preso corpo una lunga lista di malattie o

predisposizioni a malattie, tumori compresi.

Ma il punto più interessante, ovviamente, e'

quello evolutivo, sempre perchè "niente in

biologia ha senso se non alla luce

dell'evoluzione".

Esempio amilasi.

Trovato tra i geni presenti in numero di copie variabili

nella popolazione. Il gene per l’amilasi e’ presente

nella saliva dove inizia la digestione dell’amido.

L'amido era sicuramente presente nella dieta di

cacciatori/raccoglitori in zone aride. I ricercatori sono

andati a vedere se il numero di copie fosse da

correlare appunto alle abitudini alimentari nelle varie

popolazioni. Quale era l’ipotesi? Che le duplicazioni

avessero rappresentato un vantaggio per le

popolazioni di cacciatori/raccoglitori, con diete in cui

l'amido era ben presente. L’ipotesi era corretta!

Le duplicazioni insorgono a caso. E' il vantaggio

selettivo che le propaga poi nella popolazione, poiché i

portatori hanno maggiore probabilità di arrivare all'età

adulta e quindi di fare figli. La loro fitness e' più alta. E

per sottolineare come il vantaggio sia sempre relativo

ad un dato ambiente, veniamo ai nostri giorni. Ora il

vantaggio forse si e' ribaltato! Se il cibo, abbondante,

viene sfruttato fino in fondo, c'e' il rischio di ingrassare,

e quindi... la fitness si abbassa.

CNVs polimorfiche

Frank et al., 2007PosizionaleMTUS1

(esone4)SiNoComuni

Cancro al seno familiare

Sebat et al., 2007b;

Szatmari et al., 2007

Sconosciut

oMultipliVari

Non

applicabileComuniAutismo

Le Maréchal et al., 2006DosaggioPRSS1PochiSiRarePancreatiteereditaria

Rovelet-Lecrux et al., 2006; Cabrejo et al., 2006

DosaggioAPPSiNoRareMorbo di

Alzheimer

Ibáñez et al., 2004; Chartier-Harlin et al., 2004; Singleton et al.,

2003

DosaggioSNCASiNoRareMorbo di Parkinson

precoce

Lachman et al., 2007PosizionaleGSK3BPochiNoComuniDisturbo bipolare

Fellermann et al., 2006DosaggioDEFB4NoSiComuniMalattia di

Crohn

Yang et al., 2004DosaggioC4A/C4BNoSiComuniSLE

Aitman et al., 2006; Fanciulli et al., 2007

DosaggioFCGR3BNoSiComuni

SLE, Poliangite

microscopica e

Granulomatosi Wegener

McKinney et al., 2007DosaggioCCL3L1NoSiComuni

Atritereumatoide e

Diabete di tipo 1

Gonzalez et al., 2005DosaggioCCL3L1NoSiComuniHIV-1/AIDS susceptibility

ReferenzaEffettoGeniSNPsDuplicazionisegmentali

CNVSindrome

Frank et al., 2007PosizionaleMTUS1

(esone4)SiNoComuni

Cancro al seno familiare

Sebat et al., 2007b;

Szatmari et al., 2007

Sconosciut

oMultipliVari

Non

applicabileComuniAutismo

Le Maréchal et al., 2006DosaggioPRSS1PochiSiRarePancreatiteereditaria

Rovelet-Lecrux et al., 2006; Cabrejo et al., 2006

DosaggioAPPSiNoRareMorbo di

Alzheimer

Ibáñez et al., 2004; Chartier-Harlin et al., 2004; Singleton et al.,

2003

DosaggioSNCASiNoRareMorbo di Parkinson

precoce

Lachman et al., 2007PosizionaleGSK3BPochiNoComuniDisturbo bipolare

Fellermann et al., 2006DosaggioDEFB4NoSiComuniMalattia di

Crohn

Yang et al., 2004DosaggioC4A/C4BNoSiComuniSLE

Aitman et al., 2006; Fanciulli et al., 2007

DosaggioFCGR3BNoSiComuni

SLE, Poliangite

microscopica e

Granulomatosi Wegener

McKinney et al., 2007DosaggioCCL3L1NoSiComuni

Atritereumatoide e

Diabete di tipo 1

Gonzalez et al., 2005DosaggioCCL3L1NoSiComuniHIV-1/AIDS susceptibility

ReferenzaEffettoGeniSNPsDuplicazionisegmentali

CNVSindrome

Beck et al., 1992Delezione/Inversione

IDSXq28X-linkedSindrome di Hunter

Small et Warren, 1998Delezione/Duplicazion

e

Emery/FLN1

Xq28X-linkedDistrofia muscolare

Emery-Dreifuss

International IP Consortium, 2000

DelezioneNEMOXq28X-linkedIncontinenza

pigmenti

Stankiewicz et Lupski, 2002

DelezioneRCP/GC

PXq28X-linkedDaltonismo

Bonifas et al., 1987; Conary et al., 1987; Ballabio et Andria, 1992

DelezioneSTSXp22.32X-linkedIttiosi

Edelmann et al., 1999a; Edelmann et al., 1999b; Shaikh et al., 2000

DelezioneTBX122q11.2Autosomica dominante

Di George/ Sindrome

velocardiofacciale

(DGS/VCFS)

Stankiewicz et Lupski, 2002

DelezioneGH117q23.3Autosomica recessiva

Nanismo pituitario

Dorschner et al., 2000DelezioneNF117q11.2Autosomica dominante

Neurofibromatosi 1 (NF1)

Chance et al., 1994; Lupski, 1998; Boerkoel et al., 1999

DelezionePMP2217p12Autosomica dominante

Neuropatia tomaculare (HNPP)

Chance et al., 1994; Lupski, 1998 ; Boerkoel et al., 1999

Duplicazione

PMP2217p12Autosomicadominante

Charcot-Marie-Tooth 1A(CMT1A)

Potocki et al., 2000Duplicazion

e?17p11.2

Autosomicadominante

Potocky-Lupski(PLS)

Chen et al., 1997; Slageret al., 2003; Bi et al., 2004; Girirajan et al., 2005

DelezioneRAI117p11.2Autosomicadominante

Smith-Magenis(SMS)

Harteveld et al., 2005Delezioneα-

globina16p13.3

Autosomicarecessiva

α-talassemia

Christian et al., 1999; Amos-Landgraf et al., 1999

DelezioneOBE1A15q11.2-

q13Autosomica dominante

Angelman(AS)

Christian et al., 1999; Amos-Landgraf et al.,

1999

DelezioneSNRPN15q11.2-

q13

Autosomica

dominante

Prader-Willi

(PWS)

Galanello et al., 2004; Harteveld et al., 2005

Delezioneβ –

globina11p15.5

Autosomica recessiva

β-talassemia

Fardella et al., 2001Duplicazion

eCYP11B

1/28q21

Autosomica dominante

Iperaldosteronismo familiare I

Pérez Jurado et al., 1998; Peoples et al., 2000

Delezione/Inversione

ELN/GTF21

7q11.23Autosomica dominante

Williams-Beuren(WBS)

Tusié-Luna et White, 1995

DelezioneCYP216p21.3Autosomica recessiva

Iperplasia adrenale congenita III

Wirth et al., 1997Inversione/Duplicazion

e

SMN5q13.2Autosomica

recessiva

Atrofia muscolare

spinale

Petrov et al., 2008DelezioneFRG14q35Autosomica

dominante

Distrofia muscolare fascio-scapolo

omerale

Saunier et al., 2000; Konrad et al., 1996

DelezioneNPHP12q13Autosomica recessiva

Nefronoftisi giovanile familiare

Tayebi et al., 2003DelezioneGBA1q21Autosomica recessiva

Sindrome di Gaucher

Nozu et al., 2007DelezioneCLCNKA

/B1p36

Autosomica dominante

Sindrome di Bartter

ReferenzeCNVGenePosizion

eEreditarietàSindrome

Beck et al., 1992Delezione/Inversione

IDSXq28X-linkedSindrome di Hunter

Small et Warren, 1998Delezione/Duplicazion

e

Emery/FLN1

Xq28X-linkedDistrofia muscolare

Emery-Dreifuss

International IP Consortium, 2000

DelezioneNEMOXq28X-linkedIncontinenza

pigmenti

Stankiewicz et Lupski, 2002

DelezioneRCP/GC

PXq28X-linkedDaltonismo

Bonifas et al., 1987; Conary et al., 1987; Ballabio et Andria, 1992

DelezioneSTSXp22.32X-linkedIttiosi

Edelmann et al., 1999a; Edelmann et al., 1999b; Shaikh et al., 2000

DelezioneTBX122q11.2Autosomica dominante

Di George/ Sindrome

velocardiofacciale

(DGS/VCFS)

Stankiewicz et Lupski, 2002

DelezioneGH117q23.3Autosomica recessiva

Nanismo pituitario

Dorschner et al., 2000DelezioneNF117q11.2Autosomica dominante

Neurofibromatosi 1 (NF1)

Chance et al., 1994; Lupski, 1998; Boerkoel et al., 1999

DelezionePMP2217p12Autosomica dominante

Neuropatia tomaculare (HNPP)

Chance et al., 1994; Lupski, 1998 ; Boerkoel et al., 1999

Duplicazione

PMP2217p12Autosomicadominante

Charcot-Marie-Tooth 1A(CMT1A)

Potocki et al., 2000Duplicazion

e?17p11.2

Autosomicadominante

Potocky-Lupski(PLS)

Chen et al., 1997; Slageret al., 2003; Bi et al., 2004; Girirajan et al., 2005

DelezioneRAI117p11.2Autosomicadominante

Smith-Magenis(SMS)

Harteveld et al., 2005Delezioneα-

globina16p13.3

Autosomicarecessiva

α-talassemia

Christian et al., 1999; Amos-Landgraf et al., 1999

DelezioneOBE1A15q11.2-

q13Autosomica dominante

Angelman(AS)

Christian et al., 1999; Amos-Landgraf et al.,

1999

DelezioneSNRPN15q11.2-

q13

Autosomica

dominante

Prader-Willi

(PWS)

Galanello et al., 2004; Harteveld et al., 2005

Delezioneβ –

globina11p15.5

Autosomica recessiva

β-talassemia

Fardella et al., 2001Duplicazion

eCYP11B

1/28q21

Autosomica dominante

Iperaldosteronismo familiare I

Pérez Jurado et al., 1998; Peoples et al., 2000

Delezione/Inversione

ELN/GTF21

7q11.23Autosomica dominante

Williams-Beuren(WBS)

Tusié-Luna et White, 1995

DelezioneCYP216p21.3Autosomica recessiva

Iperplasia adrenale congenita III

Wirth et al., 1997Inversione/Duplicazion

e

SMN5q13.2Autosomica

recessiva

Atrofia muscolare

spinale

Petrov et al., 2008DelezioneFRG14q35Autosomica

dominante

Distrofia muscolare fascio-scapolo

omerale

Saunier et al., 2000; Konrad et al., 1996

DelezioneNPHP12q13Autosomica recessiva

Nefronoftisi giovanile familiare

Tayebi et al., 2003DelezioneGBA1q21Autosomica recessiva

Sindrome di Gaucher

Nozu et al., 2007DelezioneCLCNKA

/B1p36

Autosomica dominante

Sindrome di Bartter

ReferenzeCNVGenePosizion

eEreditarietàSindrome

Beck et al., 1992Delezione/Inversione

IDSXq28X-linkedSindrome di Hunter

Small et Warren, 1998Delezione/Duplicazion

e

Emery/FLN1

Xq28X-linkedDistrofia muscolare

Emery-Dreifuss

International IP Consortium, 2000

DelezioneNEMOXq28X-linkedIncontinenza

pigmenti

Stankiewicz et Lupski, 2002

DelezioneRCP/GC

PXq28X-linkedDaltonismo

Bonifas et al., 1987; Conary et al., 1987; Ballabio et Andria, 1992

DelezioneSTSXp22.32X-linkedIttiosi

Edelmann et al., 1999a; Edelmann et al., 1999b; Shaikh et al., 2000

DelezioneTBX122q11.2Autosomica dominante

Di George/ Sindrome

velocardiofacciale(DGS/VCFS)

Stankiewicz et Lupski, 2002

DelezioneGH117q23.3Autosomica recessiva

Nanismo pituitario

Dorschner et al., 2000DelezioneNF117q11.2Autosomica

dominante

Neurofibromatosi 1

(NF1)

Chance et al., 1994; Lupski, 1998; Boerkoel et al., 1999

DelezionePMP2217p12Autosomica dominante

Neuropatia tomaculare (HNPP)

Chance et al., 1994; Lupski, 1998 ; Boerkoel et al., 1999

Duplicazione

PMP2217p12Autosomicadominante

Charcot-Marie-Tooth 1A(CMT1A)

Potocki et al., 2000Duplicazion

e?17p11.2

Autosomicadominante

Potocky-Lupski(PLS)

Chen et al., 1997; Slageret al., 2003; Bi et al., 2004; Girirajan et al., 2005

DelezioneRAI117p11.2Autosomicadominante

Smith-Magenis(SMS)

Harteveld et al., 2005Delezioneα-

globina16p13.3

Autosomicarecessiva

α-talassemia

Christian et al., 1999; Amos-Landgraf et al., 1999

DelezioneOBE1A15q11.2-

q13Autosomica dominante

Angelman(AS)

Christian et al., 1999; Amos-Landgraf et al., 1999

DelezioneSNRPN15q11.2-

q13Autosomica dominante

Prader-Willi(PWS)

Galanello et al., 2004; Harteveld et al., 2005

Delezioneβ –

globina11p15.5

Autosomica recessiva

β-talassemia

Fardella et al., 2001Duplicazion

eCYP11B

1/28q21

Autosomica dominante

Iperaldosteronismo familiare I

Pérez Jurado et al., 1998; Peoples et al., 2000

Delezione/Inversione

ELN/GTF21

7q11.23Autosomica dominante

Williams-Beuren(WBS)

Tusié-Luna et White, 1995

DelezioneCYP216p21.3Autosomica recessiva

Iperplasia adrenale congenita III

Wirth et al., 1997Inversione/Duplicazion

e

SMN5q13.2Autosomica

recessiva

Atrofia muscolare

spinale

Petrov et al., 2008DelezioneFRG14q35Autosomica

dominante

Distrofia muscolare fascio-scapolo

omerale

Saunier et al., 2000; Konrad et al., 1996

DelezioneNPHP12q13Autosomica recessiva

Nefronoftisi giovanile familiare

Tayebi et al., 2003DelezioneGBA1q21Autosomica recessiva

Sindrome di Gaucher

Nozu et al., 2007DelezioneCLCNKA

/B1p36

Autosomica dominante

Sindrome di Bartter

ReferenzeCNVGenePosizion

eEreditarietàSindrome

Beck et al., 1992Delezione/Inversione

IDSXq28X-linkedSindrome di Hunter

Small et Warren, 1998Delezione/Duplicazion

e

Emery/FLN1

Xq28X-linkedDistrofia muscolare

Emery-Dreifuss

International IP Consortium, 2000

DelezioneNEMOXq28X-linkedIncontinenza

pigmenti

Stankiewicz et Lupski, 2002

DelezioneRCP/GC

PXq28X-linkedDaltonismo

Bonifas et al., 1987; Conary et al., 1987; Ballabio et Andria, 1992

DelezioneSTSXp22.32X-linkedIttiosi

Edelmann et al., 1999a; Edelmann et al., 1999b; Shaikh et al., 2000

DelezioneTBX122q11.2Autosomica dominante

Di George/ Sindrome

velocardiofacciale(DGS/VCFS)

Stankiewicz et Lupski, 2002

DelezioneGH117q23.3Autosomica recessiva

Nanismo pituitario

Dorschner et al., 2000DelezioneNF117q11.2Autosomica

dominante

Neurofibromatosi 1

(NF1)

Chance et al., 1994; Lupski, 1998; Boerkoel et al., 1999

DelezionePMP2217p12Autosomica dominante

Neuropatia tomaculare (HNPP)

Chance et al., 1994; Lupski, 1998 ; Boerkoel et al., 1999

Duplicazione

PMP2217p12Autosomicadominante

Charcot-Marie-Tooth 1A(CMT1A)

Potocki et al., 2000Duplicazion

e?17p11.2

Autosomicadominante

Potocky-Lupski(PLS)

Chen et al., 1997; Slageret al., 2003; Bi et al., 2004; Girirajan et al., 2005

DelezioneRAI117p11.2Autosomicadominante

Smith-Magenis(SMS)

Harteveld et al., 2005Delezioneα-

globina16p13.3

Autosomicarecessiva

α-talassemia

Christian et al., 1999; Amos-Landgraf et al., 1999

DelezioneOBE1A15q11.2-

q13Autosomica dominante

Angelman(AS)

Christian et al., 1999; Amos-Landgraf et al., 1999

DelezioneSNRPN15q11.2-

q13Autosomica dominante

Prader-Willi(PWS)

Galanello et al., 2004; Harteveld et al., 2005

Delezioneβ –

globina11p15.5

Autosomica recessiva

β-talassemia

Fardella et al., 2001Duplicazion

eCYP11B

1/28q21

Autosomica dominante

Iperaldosteronismo familiare I

Pérez Jurado et al., 1998; Peoples et al., 2000

Delezione/Inversione

ELN/GTF21

7q11.23Autosomica dominante

Williams-Beuren(WBS)

Tusié-Luna et White, 1995

DelezioneCYP216p21.3Autosomica recessiva

Iperplasia adrenale congenita III

Wirth et al., 1997Inversione/Duplicazion

e

SMN5q13.2Autosomica

recessiva

Atrofia muscolare

spinale

Petrov et al., 2008DelezioneFRG14q35Autosomica

dominante

Distrofia muscolare fascio-scapolo

omerale

Saunier et al., 2000; Konrad et al., 1996

DelezioneNPHP12q13Autosomica recessiva

Nefronoftisi giovanile familiare

Tayebi et al., 2003DelezioneGBA1q21Autosomica recessiva

Sindrome di Gaucher

Nozu et al., 2007DelezioneCLCNKA

/B1p36

Autosomica dominante

Sindrome di Bartter

ReferenzeCNVGenePosizion

eEreditarietàSindrome

Jakobsson et al., 2008. Genotype, haplotype and copy-number variation in worldwide human populations. Nature.

SNPs

CNVs

Polimorfismi del DNA: minisatelliti e microsatelliti

Allele A TACCAAGGTACACACACGGTACCATGG

Allele B TACCAAGGTACACACACACGGTACCATGG

Allele C TACCAAGGTACACACACACACGGTACCATGG

Allele D TACCAAGGTACACACACACACACGGTACCATGG

Allele A TACCAAGGTACGGACGGACGGACGGGGTACCATGG

Allele B TACCAAGGTACGGACGGACGGACGGACGGGGTACCATGG

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: STR & VNTR

STRs (Short Tandem Repeats) e VNTR (Variable Number of Tandem Repeat)

Marcatori genetici molto utilizzati nel campo della genetica di popolazione e nel campo forense.

Gli STRs vengono classificati in base alla

lunghezza dell’unità ripetuta

dinucleotidi

trinucleotidi

Tetra, penta e esanucleotidi

I trinucleotidi, localizzati spesso negli esoni, posso essere la

causa di patologie

Scegliendo opportunamente 5 STR, la probabilità che essi risultino uguali in individui non imparentati è < 1/1012.

Il kit per il riconoscimento di individui (identifiler) usato in medicina forense è costituito da 15 STR tetranucleotidi:

HUMTH01, D21S22, D18S51, HUMVFA31, HUMFIBRA, D8S1179, HUMTPOX, HUMCSF1PO, D16S539, D7S820, D13S317, D5S818, D3S1358,

D19S433, D2S1338

Nomenclatura degli STR

Se il marcatore è parte di un gene, il nome del gene è usato per la designazione (TH01)

Se il marcatore si trova al di fuori di un gene, esso viene designato in base alla posizione cromosomica (D16S539):

D: DNA

16: cromosoma 16

S: sito

539: 539mo locus descritto sul cromosoma 16

Test di paternità

Frequenza e localizzazione VNTR e STR

Rappresentano il 5-10% del genoma eucariotico

Le classi più rappresentate sono le ripetizioni monomeriche e

dinucleotidi

Ad eccezione dei trinucleotidi sono localizzati in regioni non

codificanti del DNA

I VNTR si trovano prevalentemente nelle regioni sottostanti il

telomero;

Gli STR sono distribuiti in modo relativamente uniforme

all’interno del genoma; anche se gli esanucleotidi si sono stati

ritrovati più frequentemente nelle regioni telomeriche.

La variabilità genetica a livello molecolare2. microsatelliti o short tandem repeats (STRs)

I microsatelliti sono distribuiti in modo omogeneo nel genoma umano

La variabilità genetica a livello molecolare2. microsatelliti o short tandem repeats (STRs)

I microsatelliti possono essere perfetti, interrotti o composti e vengono ulteriormente

classificati in base alla lunghezza del motivo ripetuto (dinucleotide repeats,

trinucleotide repeats ecc..)

perfetti

interrotti

composti

Ruolo DNA satellite

DNA spazzatura?????

Partecipazione alla ricombinazione meiotica?

Ruolo nel ripiegamento della cromatina?

Siti di legame per specifiche proteine nucleari?

Origine del DNA satellite

•Scambio ineguale durate il crossing over meiotico

•Slittamento di due filamenti (stand slippage) durate la replicazione

Perché i microsatelliti sono così polimorfici?

L’elevato tasso di mutazione nei microsatelliti è dovuto a

scivolamento della polimerasi in replicazione

La variabilità genetica a livello molecolare2. microsatelliti o short tandem repeats (STRs)

•Tasso di mutazione molto elevato

•La mutazione avviene generalmente per

aumento o diminuzione di una singola

unità ripetitiva

•Mutazioni per aumento più frequenti di

mutazioni per diminuzione

•Il tasso di mutazione per ciascun

microsatellite è correlato con la lunghezza

dell’allele

Rosenberg et al., 2008. Genetic structure of human populations. Science.

test the correspondence of predefined groups with those inferred from individual multilocus genotypes

clustering method that identifies subgroups that have distinctive allele frequencies

CEPH panel; multiplex for 377 STRs

Rosenberg et al., 2008. Genetic structure of human populations. Science.

individuals from the same predefined population nearly always shared similar membership coefficient

world-level boundaries between major clusters mostly correspond to major physical barriers (oceans, Himalaya, Sahara)

Rosenberg et al., 2008. Genetic structure of human populations. Science.

STRUCTURE

efficiently detects isolated and homogeneous groups

Karitiana,

Brasile

Surui,

BrasileMaya,

Messico

Melanesia

Australia

Nuova

GuineaRep. Centro

Africana

Zaire

Gabon

Cina

CambogiaGiappone

Nord Italia

Nord Europa

Sardegna

Sicilia

Baschi

Corsica

Switzerland

Siracusa

Palermo

Ragusa

AgrigentoCaltanissetta

Messina

Catania

Egypt

Andalusia

Morocco

Catalonia

Basques

Poland

Alia

Hungary

Germany

Lombardy

TuscanyPortugal

Da: Genetic Analysis of a

Sicilian population using 15

STRs.

Calò C.M., Garofano L., Mameli

A., Pizzamiglio M., Vona G.

Human Biology, 75: 163-178;

2003

Stutter o Shadow Bands

Un problema da affrontare nell’analisi dei microsatelliti è la formazione, durante il processo di amplificazione, di prodotti aspecifici chiamati“stutter o shadowbands”

La formazione dei prodotti aspecifici è legata alla processività della Taq Polimerasi(Lawyer F. et al.PCR Methods Appl.,1993 May; 2 (4): 275-

287) piuttosto che alla struttura secondaria del DNA

Infatti l’utilizzo di una DNA polimerasi termostabile con un’alta processività può ridurre notevolmente la formazione di prodotti aspecifici

ELETTOFORETOGRAMMA

Stutter o Shadow Bands

Nel caso delle ripetizioni dinucleotidiche,la stutter band prevalente è di 2 bp più piccola rispetto al picco principale,con in più la formazione di statter bands di 4 e 6bp più piccole anche visibili(Murray V. et al. Nucleic AcidsRes,1993,21:2395-2398)

Questo comporta che per ciascun allele si abbia un pattern con più bande il che rende complicata l’interpretazione dei dati, in modo particolare per campioni di DNA che sono una miscela di due o più individui

La tendenza, adesso, è di utilizzare marcatori tri- o tetra-nucleotidici che danno risultati più evidenti

Sequenze ripetute sparse

•SINE (short interpersed repeated sequences): 100-500 bp

•LINE (long interspersed repeated sequences)

Conosciute come retrotrasposoni.

Trasposoni: frammenti di DNA che si spostano all’interno del

genoma.

Si distinguono 2 classi: LTR (con sequenze lunghe ripetute

terminali) e non LTR, tra queste ultime individuiamo:

DNA ripetitivo intersperso

Le singole unità ripetute non sono raggruppate ma sparse in più punti del genoma. Gli esempi più comuni sono le sequenze SINEs (Short Interspersed Nuclear Element) e LINEs (Long Interspersed Nuclear Element)

LINEsSono associate prevalentemente a DNA genomico ricco in A/Tperché tendono a posizionarsi in regioni del cromosoma povere di geni allo scopo di imporre il minimo impatto mutazionale al genoma.

SINEsSono associate prevalentemente a DNA genomico ricco in G/C. Perché? Sembra che tali sequenze svolgano una qualche funzione positiva per il genoma: esse sarebbero espresse in condizioni di stress ed i risultanti RNA legherebbero una particolare protein chinasi PKR e bloccherebbero la sua capacità di inattivare la traduzione.

Più frequenti nei Primati e quindi nell’uomo.

Famiglia SINE:

Polimorfismo di inserzione/delezione Alu

Si trovano negli introni e nelle regioni non tradotte

Presentano un’organizzazione dimerica: 2 sequenze

omologhe separate da una regione ricca di Adenina.

E 2 unità sono omologhe al gene 7 SL RNA da cui derivano

La mobilizzazione delle Alu all’interno del genoma è chiamata retrotrascrizione: movimento di materiale genetico da una posizione cromosomica ad un’altra, tramite un intermediario, la polimerasi III del RNA

Replicazione Alu: una copia rimane nel luogo originale (matrice) mentre l’altra si inserirà nella nuova posizione. Questo processo potrebbe rappresentare l’espansione degli elementi Alu nel genoma umano, ma i fattori che controllano la retrotrascrizione non sono ancora ben chiari.

Il fatto che le Alu, pur essendo localizzate in regioni non codificanti, sono state mantenute dalla selezione naturale, suggerisce l’ipotesi di una loro attività funzionale.

La famiglia degli elementi Alu sono suddivisi in un certo numero di sottofamiglie, caratterizzate da una serie gerarchica di mutazioni, questo ci permette di individuare sottofamiglie di differenti età.

Alu più antiche: PS (primate specific)

AS (antropoid specific)

CS (catarrine specific)

HS (human spcefic)

Le Alu più giovani sono rappresentate dalla sottofamiglia Y (Ya e Yb)

Identificazione e tipizzazione di polimorfismi Alu

•Identificazione: ricerca in database di

elementi Alu giovani (famiglia Alu Y),

che hanno una più elevata probabilità di

essere stati trasposti durante

l’evoluzione umana e quindi di essere

polimorfici.

•Tipizzazione: tramite PCR, con primers

che fiancheggiano il sito di inserzione

ed elettroforesi su gel d’agarosio.

•Sono i polimorfismi più facili da

analizzare

Tassi medi di mutazione per vari polimorfismi

(per locus per generazione)

VNTR 10-1 – 10-2

STR 10-2 – 10-4

SNPs 10-6 – 10-8

Indel (retrovirus) 10-10 – 10-11

Nella regione ipervariabile del DNA mitocondriale,

valori fino a 5 x 10-5 per sito per generazione

Tipo di marcatore Tipo di mutazione ProprietàTasso di mutazione

SNPTransizioniTrasversioni

Stato ancestrale definito da confronto

con outgroup

Eventi unici o <10-9

INDELInserzione/Delezione di elementi ripetitivi del

genoma

Stato ancestrale

notoEventi unici

MICROSATELLITI SEMPLICI

(STR)

Inserzione/Delezione di moduli omogenei

ripetuti in tandem

RicorrentiComposti da blocchi di repeats di 2-5 bp

10-3

MINISATELLITI Inserzione/Delezione di

moduli ripetuti in tandem

RicorrentiComposti da blocchi di repeats >10 bp

10-2

MARCATORI DEL DNA

evoluzione lenta

evoluzione rapida

In qualsiasi tipo di applicazione dovrete scegliere tra diversi tipi di marcatori.

Per fare questo bisogna tener conto di una serie di caratteristiche dei diversi

marcatori, che possono essere più o meno importanti a seconda dei casi:

• distribuzione sul genoma

• tasso di mutazione

• grado di eterozigosità

• tempi tecnici dell’esperimento

• costi dell’attrezzatura

• costi dell’esperimento

• precisione del metodo

Caratteristiche biologiche

Caratteristiche tecniche

• distribuzione nel genoma: sufficiente che i geni non siano in LD per una più

facile trattazione statistica: OK tutti i marcatori

• tasso di mutazione: non rilevante

OK tutti i marcatori

• grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore

l’informazione. OK minisatelliti, STRs

• ereditarietà mendeliana: importante per una più facile trattazione statistica

• tempi tecnici dell’esperimento

• costi dell’attrezzatura

• costi dell’esperimento

• precisione del metodo

• tipizzazione mediante PCR: fondamentale: spesso quantità di DNA minime

• possibilità di automazione su larga scala: non rilevante

• distribuzione nel genoma: sufficiente che i geni non siano in LD per una più

facile trattazione statistica: OK tutti i marcatori

• tasso di mutazione: non fondamentale ma da tenere in considerazione

OK tutti i marcatori

• grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore

l’informazione: OK minisatelliti, STR

• ereditarietà mendeliana: importante per una più facile trattazione statistica

OK STR, SNPs

• tempi tecnici dell’esperimento

• costi dell’attrezzatura

• costi dell’esperimento

• precisione del metodo

• tipizzazione mediante PCR: non rilevante se non in relazione ai costi

• possibilità di automazione su larga scala: non rilevante

• distribuzione nel genoma: fondamentale, omogeneamente distribuiti e

comuni nel genoma: OK STRs e SNPs

• tasso di mutazione: molto importante, OK SNPs

• grado di eterozigosità: importante

OK STRs e parte degli SNPs (quelli con H elevata)

• tempi tecnici dell’esperimento

• costi dell’attrezzatura

• costi dell’esperimento

• precisione del metodo

• possibilità di automazione su larga scala: OK SNPs

• distribuzione nel genoma: non rilevante

• tasso di mutazione: fondamentale, deve essere contenuto

OK SNPs, NO STRs

• grado di eterozigosità: non rilevante

• tempi tecnici dell’esperimento

• costi dell’attrezzatura

• costi dell’esperimento

• precisione del metodo

• tipizzazione mediante PCR: non rilevante se non in relazione ai costi

• distribuzione nel genoma: non rilevante

• tasso di mutazione: dipende dal contesto, possono essere usati SNPs, Alu,

STRs, ma in modo diverso

• grado di eterozigosità: +/- importante a seconda dei casi

• tempi tecnici dell’esperimento

• costi dell’attrezzatura

• costi dell’esperimento

• precisione del metodo: fondamentale

Utilizzo degli SNPs in ambito forense

Svantaggio: biallalici (poco polimorfici)

Vantaggio: necessitano di amplificati di dimensioni minori

di 100 bp (utile per DNA degradato)

Numero SNPS per ottenere risultati significativi: 25-45

Correlazione di alcuni SNPs con caratteri fenotipici

SLC24A5, TYR e SL45A2 sembrano correlati con la

pigmentazione cutanea

MC1R correla con il colore rosso dei capelli

Recommended