5
1 GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie Mediche Infettivologia ed Epidemiologia - Università di Pisa branca della biologia molecolare che si occupa dello studio del genoma degli organismi studio della struttura, contenuto, funzione ed evoluzione del genoma Genomica comparativa approccio che consente l’identificazione di variazioni genetiche tra gli organismi che possono spiegare differenze nella fisiologia, biochimica e virulenza GENOMICA …….The genome comprises 4,411,529 base pairs, contains around 4,000 genes, and has a very high guanine + cytosine content that is reflected in the biased amino-acid content of the proteins. M. tuberculosis differs radically from other bacteria in that a very large portion of its coding capacity is devoted to the production of enzymes involved in lipogenesis and lipolysis, and to two new families of glycine-rich proteins with a repetitive structure that may represent a source of antigenic variation. Nature 393, 537-544, 1998 Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence S. T. Cole, et al. Circular map of the chromosome of M. tuberculosis H37Rv G + C content, with <65% G + C in yellow, and >65% G + C in red. Scale in Mb, with 0 representing the origin of replication. Positions of stable RNA genes (tRNAs are blue, others are pink) and the direct repeat region (pink cube); coding sequence by strand (clockwise, dark green; anti-clockwise, light green); repetitive DNA (insertion sequences, orange; 13E12 REP family, dark pink; prophage, blue); PPE family members (green); PE family members (purple, excluding PGRS); PGRS sequences (dark red) + 82 geni ... Here the complete re-annotation of the genome sequence of Mycobacterium tuberculosis strain H37Rv is presented almost 4 years after the first submission. Eighty-two new protein- coding sequences (CDS) have been included and 22 of these have a predicted function. .. The functional classification of 643 CDS has been changed based principally on recent sequence comparisons and new experimental data from the literature. More than 300 gene names and over 1000 targeted citations have been added and the lengths of 60 genes have been modified. Presently, it is possible to assign a function to 2058 proteins (52% of the 3995 proteins predicted) and only 376 putative proteins share no homology with known proteins and thus could be unique to M. tuberculosis. Microbiology 148, 2967-2973, 2002 Re-annotation of the genome sequence of Mycobacterium tuberculosis H37Rv J. C. Camus, et al. Nature 393, 537-544, 1998 Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence S. T. Cole, et al. CARATTERISTICHE DEL GENOMA DI M. TUBERCULOSIS H37Rv 4.411.532 bp G+C 65.6% 4.000 geni codificanti proteine 50 geni codificanti RNA stabile Oltre il 51% dei geni è derivato dalla duplicazione genica Il 3.4% del genoma è composto da sequenze di inserzione e profagi 52% funzione definita 48% funzione ipotetica o sconosciuta

GENOMICA GENOMICA DEL BACILLO TUBERCOLAREmyco09.pbworks.com/f/rindi09-Genomica.pdf · GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie

  • Upload
    dangnhu

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: GENOMICA GENOMICA DEL BACILLO TUBERCOLAREmyco09.pbworks.com/f/rindi09-Genomica.pdf · GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie

1

GENOMICA DEL BACILLO TUBERCOLARE

Laura Rindi

Dipartimento di Patologia Sperimentale, Biotecnologie MedicheInfettivologia ed Epidemiologia - Università di Pisa

� branca della biologia molecolare che si occupa dello studio del genoma degli organismi

� studio della struttura, contenuto, funzione ed evoluzione del genoma

� Genomica comparativa → approccio che consente l’identificazione di variazioni genetiche tra gli organismi che possono spiegare differenze nella fisiologia, biochimica e virulenza

GENOMICA

…….The genome comprises 4,411,529 base pairs, contains around 4,000 genes, and hasa very high guanine + cytosine content thatis reflected in the biased amino-acid content of the proteins. M. tuberculosisdiffers radically from other bacteria in that a very large portion of its codingcapacity is devoted to the production of enzymes involved in lipogenesis and lipolysis, and to two new families of glycine-richproteins with a repetitive structure thatmay represent a source of antigenicvariation.

Nature 393, 537-544, 1998

Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence

S. T. Cole, et al.

Circular map of the chromosome of M. tuberculosis H37Rv

G + C content, with <65% G + C in yellow, and >65% G + C in red.

Scale in Mb, with 0 representing the origin of replication.Positions of stable RNA genes (tRNAs are

blue, others are pink) and the direct repeat region (pink cube);

coding sequence by strand (clockwise, dark green; anti-clockwise, light green);

repetitive DNA (insertion sequences, orange; 13E12 REP family, dark pink; prophage, blue);

PPE family members (green);

PE family members (purple, excluding PGRS);

PGRS sequences (dark red)

+ 82 geni

... Here the complete re-annotation of the genome sequence of Mycobacterium tuberculosisstrain H37Rv is presented almost 4 years after the first submission. Eighty-two new protein-coding sequences (CDS) have been included and 22 of these have a predicted function. .. The functional classification of 643 CDS has been changed based principally on recent sequencecomparisons and new experimental data from the literature. More than 300 gene names and over 1000 targeted citations have been added and the lengths of 60 genes have been modified. Presently, it is possible to assign a function to 2058 proteins (52% of the 3995 proteinspredicted) and only 376 putative proteins share no homology with known proteins and thus couldbe unique to M. tuberculosis.

Microbiology 148, 2967-2973, 2002

Re-annotation of the genome sequence of Mycobacteriumtuberculosis H37Rv

J. C. Camus, et al.

Nature 393, 537-544, 1998

Deciphering the biology of Mycobacteriumtuberculosis from the complete genome sequence

S. T. Cole, et al.

CARATTERISTICHE DEL GENOMA DI M. TUBERCULOSIS H37Rv

� 4.411.532 bp

� G+C 65.6%

� ∼∼∼∼ 4.000 geni codificanti proteine

� 50 geni codificanti RNA stabile

� Oltre il 51% dei geni è derivato dalla duplicazione genica

� Il 3.4% del genoma è composto da sequenze di inserzione e profagi

52% funzione definita

48% funzione ipotetica o sconosciuta

Page 2: GENOMICA GENOMICA DEL BACILLO TUBERCOLAREmyco09.pbworks.com/f/rindi09-Genomica.pdf · GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie

2

CLASSIFICAZIONE FUNZIONALE DEI GENI DI M. TUBERCULOSIS H37Rv

99Virulence, detoxification, adaptation0

1051Conserved hypothetical proteins10

189Regulatory proteins9

272Proteins of unknown function8

894Intermediary metabolism and respiration7

170PE and PPE proteins6

149Insertion sequences and phages5

50Stable RNAs4

708Cell wall and cell processes3

229Information pathways2

233Lipid metabolism1

NUMERO

DI GENIFUNZIONECLASSE

METABOLISMO LIPIDICO

∼8% del genoma è dedicato al metabolismo lipidico(oltre 200 enzimi rispetto ai 50 di E.coli)

Lipid metabolism.Degradation of host-cell lipids is vital in the intracellular life of M. tuberculosis. Host-cell membranesprovide precursors for many metabolic processes, as well as potential precursors of mycobacterial cell-wall constituents, through the actions of a broad family of b-oxidative enzymes encoded by multiple copies in the genome. These enzymes produce acetyl CoA, which can be converted into many differentmetabolites and fuel for the bacteria through the actions of the enzymes of the citric acid cycle and the glyoxylate shunt of this cycle.

PROTEINE PE E PPE

∼7% dei geni codifica per due nuove famiglie di proteine ricche in glicina

Ruolo immunologico

SEQUENZE DI DNA RIPETUTE

�Duplicazioni di geni/famiglie di geni

�Sequenze di inserzione

�Sequenze non codificanti disperse

Sequenze di DNA ripetute: SEQUENZE DI INSERZIONE

� Le sequenze di inserzione (IS) sono piccoli segmenti di DNA (<2.5kb) in grado di inserirsi in siti multipli del genoma.

� Il genoma di M. tuberculosis H37Rv contiene 56 copie di elementi IS appartenenti ad almeno 9 famiglie.

transposasi

IS1556ignota

IS1555, IS1557 (2), IS1557’, IS1561’, IS1606’’ISL3

IS1535, IS1536, IS1537, IS1538, IS1539, IS1602, IS1605’’IS1535

IS1081 (6), IS1552’, IS1553, IS1554IS256

IS1547 (2), IS1558, IS1558’, IS1607, IS1608’ (2)IS110

IS1603IS30

IS1532, IS1533, IS1534IS21

IS1560, IS1560’, IS-like (2)IS5

IS6110 (16), IS1540, IS1604IS3

MEMBRI IN M. TUBERCULOSISFAMIGLIA IS

� Ad eccezione di IS6110, che traspone “frequentemente”, gli elementi IS sono stabili in H37Rv e in altri isolati.

Sequenze di DNA ripetute: SEQUENZE NON CODIFICANTI DISPERSE

� MIRU : mycobacterialinterspersed repetitive unit.

41 loci

dimensioni 40-100 bp

� Locus DR : direct repeat.

Sequenze ripetute di 36 bpseparate da sequenze non ripetute (spacers) di 36-41 bp

Page 3: GENOMICA GENOMICA DEL BACILLO TUBERCOLAREmyco09.pbworks.com/f/rindi09-Genomica.pdf · GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie

3

http://genolist.pasteur.fr/TubercuList

Genome Res. Epub2008-04-15

656636 Kb5550 orfs

Mycobacterium marinum M, ATCC BAA-535

Unpublished2008-03-01

645067 Kb5041 orfs

Mycobacterium abscessus CIP 104536

Unpublished2007-06-07

65.64424 Kb4050 orfs

Mycobacterium tuberculosis F11 (ExPEC)

PLoS ONE 3, e23752007-06-01

65.64419 Kb4132 orfs

Mycobacterium tuberculosis H37Ra

Unpublished2007-04-12

675619 Kb5723 orfs

Mycobacterium flavenscens (gilvum) PYR-GCK

Unpublished2007-02-27

686048 Kb5899 orfs

Mycobacterium sp JLS

Unpublished2007-01-08

65.64374 Kb4033 orfs

Mycobacterium bovis BCG Pasteur 1173P2

Unpublished2006-12-27

67.86491 Kb6092 orfs

Mycobacterium vanbaalenii PYR-1

Unpublished2006-12-20

68.45737 Kb6133 orfs

Mycobacterium sp KMS

Genome Res 17, 192-2002006-12-01

65.55631 Kb4291 orfs

Mycobacterium ulcerans Agy99

Unpublished2006-11-20

695475 Kb5339 orfs

Mycobacterium avium 104

Unpublished2006-11-20

67.46988 Kb6978 orfs

Mycobacterium smegmatis MC2 155

Unpublished2006-06-09

685705 Kb5752 orfs

Mycobacterium sp MCS

PNAS 102, 12344-92004-01-30

69.34829 Kb4415 orfs

Mycobacterium avium paratuberculosis K-10

PNAS 100, 7877-78822003-06-24

65.64345 Kb4012 orfs

Mycobacterium bovis AF2122/97(spoligotype 9)

J Bacteriol 184, 5479-902001-10-02

65.64403 Kb4346 orfs

Mycobacterium tuberculosis CDC1551 (Oshkosh)

Nature 409, 1007-10112001-02-22

57.83268 Kb2749 orfs

Mycobacterium leprae TN

Nature 393,537-5441998-06-11

65.64411 Kb4060 orfs

Mycobacterium tuberculosis H37Rv (lab strain)

PUBLICATIONGC CONTENTSIZEORGANISM

34 ceppi micobattericicompletamente sequenziati

47 ceppi del complesso tubercolare in corso di sequenziamento

http://www.genomesonline.org/gold.cgi

M. tuberculosis complex

AF2122/97H37RvCDC1551H37Ra

M. tuberculosis M. africanum M. canettii M. microti M. bovis M. bovis BCG BCG-Pasteur

4.41 Mb

4.32 Mb 4.31Mb

in corso in corso in corso

Tutti i micobatteri appartenenti al complesso tubercolare condividono il 99.9% di identità a livello nucleotidico, ma differiscono ampiamente in termini di

spettro d’ospite e di patogenicità

PLASTICITA’DEL GENOMA

polimorfismi di singoli nucleotidi

eventi di inserzione e delezione

J. Bacteriol, 184, 5479-90, 2002

Whole-Genome Comparison of Mycobacterium tuberculosisClinical and Laboratory Strains

R. D. Fleischmann et al.

PNAS, 100, 7877-82, 2003

The complete genome sequenceof Mycobacterium bovis

T. Garnier et al.

10863-inserzioni

11772-delezioni

23481135-polimorfismi singoli

Rispetto a Mtb H37Rv:

3.9514.2493.995Geni codificanti per proteine

65.665.665.6G+C, %

4.345.4924.403.8364.411.532Dimensioni del genoma, bp

M. bovis AF2122/97M. tuberculosis CDC1551M. tuberculosis H37RvCaratteristiche

� Il genoma di M. bovis AF2122/97 (identico per oltre il 99.5% a quello di M tuberculosisH37Rv) rispetto a quelli dei due ceppi tubercolari è più piccolo di 70 kb e contiene circa 60

geni in meno.

� Il 55% delle inserzioni e delezioni tra i due ceppi tubercolari riguardano geni, soprattutto

quelli codificanti per le proteine PE e PPE.

� La variabilità tra M. bovis e Mtb riguarda prevalentemente componenti della parete

cellulare e proteine di secrezione.

Regioni genomiche che differiscono tra M. tuberculosis H37Rv e M. bovis BCG Pasteur

(phiRv2)

(phiRv1)

(fosfolipasi C)

(invasina)

(Esat-6, CFP-10)

Scheme of the proposed evolutionary pathway of

the tubercle bacilli illustrating successive loss of DNA in certain lineages (gray boxes). The scheme

is based on the presence or absence of conserved

deleted regions and on sequence polymorphisms in five selected genes. Note that the distances

between certain branches may not correspond to

actual phylogenetic differences calculated by othermethods. Blue arrows indicate that strains are

characterized by katG463. CTG (Leu), gyrA95 ACC

(Thr), typical for group 1 organisms. Green arrowsindicate that strains belong to group 2 characterized

by katG463 CGG (Arg), gyrA95 ACC (Thr). The red

arrow indicates that strains belong to group3, characterized by katG463 CGG (Arg), gyrA95 AGC

(Ser), as defined by Sreevatsan et al.

Brosch et al. 2002 PNAS 99:3684-9.

Page 4: GENOMICA GENOMICA DEL BACILLO TUBERCOLAREmyco09.pbworks.com/f/rindi09-Genomica.pdf · GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie

4

EvoluzioneEvoluzione del del complessocomplesso tubercolaretubercolare

M. bovis

M. tuberculosis

X

bacillo progenitore

M. bovis M. tuberculosis

EvoluzioneEvoluzione del del complessocomplesso tubercolaretubercolare

oxyR n285 G→→→→A

M. africanum

RD 7

RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9

M. tub.katG 463 CTG→→→→CGG

M. microti

M. bovis

RDcan

RDmic

RDseal

seal

oryx

goat

“classical”RD 1

BCG Tokyo

gyrA 95AGC→→→→ACC

pncAc57CAC→→→→GAC

RD 4

RD 2

BCG Pasteur

RD 14

TbD 1

“modern”

“ancestral”

RD9 +

TbD1 -mmpL6 551AAC→→→→AAG

eg. Beijing cluster

eg. Haarlem cluster

eg. H37Rv

IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare

oxyR n285 G→→→→A

M. africanum

RD 7

RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9M. tub.katG 463 CTG→→→→CGG

M. microti

M. bovis

RDcan

RDmic

RDseal

seal-isolates

oryx-isolates

goat-isolates

“classical”RD 1

BCG Tokyo

gyrA 95AGC→→→→ACC

pncAc57CAC→→→→GAC

RD 4

RD 2

BCG Pasteur

RD 14

TbD 1

“m

od

ern

“ancestral”

RD9 -

mmpL6 551AAC→→→→AAG

IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare

oxyR n285 G→→→→A

M. africanum

RD 7

RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9M. tub.katG 463 CTG→→→→CGG

M. microti

M. bovis

RDcan

RDmic

RDseal

“classical”RD 1

BCG Tokyo

gyrA 95AGC→→→→ACC

pncA 57CAC→→→→GAC

RD 4

RD 2

BCG Pasteur

RD 14

TbD 1

“m

od

ern

“ancestral”

RD9 -

mmpL6 551AAC→→→→AAG

mmpL6 551 AAG

seal-isolates

oryx-isolates

goat-isolates

IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare

oxyR n285 G→→→→A

M. africanum

RD 7

RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9M. tub.katG 463 CTG→→→→CGG

M. microti

M. bovis

RDcan

RDmic

RDseal

seal

oryx

goat

“classical”RD 1

BCG Tokyo

gyrA 95AGC→→→→ACC

pncA 57CAC→→→→GAC

RD 4

RD 2

BCG Pasteur

RD 14

TbD 1

“m

od

ern

“ancestral”

RD9 -

mmpL6 551AAC→→→→AAG

RD4 -

IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare

Page 5: GENOMICA GENOMICA DEL BACILLO TUBERCOLAREmyco09.pbworks.com/f/rindi09-Genomica.pdf · GENOMICA DEL BACILLO TUBERCOLARE Laura Rindi Dipartimento di Patologia Sperimentale, Biotecnologie

5

oxyR n285 G→→→→A

M. africanum

RD 7

RD 8

RD 10

RD 12

RD 13

M. canettii

RD 9M. tub.katG 463 CTG→→→→CGG

M. microti

M. bovis

RDcan

RDmic

RDseal

seal

oryx

goat

“classical”RD 1

BCG

gyrA 95AGC→→→→ACC

pncA 57CAC→→→→GAC

RD 4

RD 2

RD 14

TbD 1

“m

od

ern

“ancestral”

RD9 -

mmpL6 551AAC→→→→AAG

RD1 -

IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare

The composite MtbC PCR typing panel. Illustrated

are the typical MtbC PCR

panel typing results for a

single representative of each MtbC subspecies as

well as MOTT (M. avium

subsp. avium is shown).

Lanes:

1, 16S rRNA; 2, Rv0577;

3, IS1561';

4, Rv1510 (RD4);

5, Rv1970 (RD7); 6, Rv3877/8 (RD1);

7, Rv3120 (RD12).

J. Clin. Microbiol. 41, 1637-1650, 2003

PCR-Based Method To Differentiate the Subspecies of the Mycobacterium tuberculosis Complex on the Basis of GenomicDeletions

R. C. Huard, et al.

EVOLUZIONE DI MYCOBACTERIUM TUBERCULOSIS

Gagneux S. et.al. PNAS 2006;103:2869-2873

ERA POSTERA POST--GENOMICAGENOMICA

CARATTERIZZAZIONE GENOMICA

GENOMICA COMPARATIVA

� Identificazione di fattori di virulenza (confronto genoma Mtb/BCG) e di antigeni (proteine PE/PPE) →comprensione dei meccanismi di patogenicità e sviluppo di nuovi vaccini

� Allestimento di test diagnostici rapidi (identificazione delle specie del complesso tubercolare; diagnosi immunologica di infezione latente)

� Identificazione di molecole essenziali, potenziali bersagli per nuovi farmaci

� Studi evoluzionistici e di epidemiologia molecolare

Sviluppo di migliori strategie di controllo dell’infezione tubercolare