View
229
Download
6
Embed Size (px)
Codage et expression de linformation gntique
Pascale Giraudet
www.univ-tln.fr/~giraudet
Sminaire GRIM 4 mars 2003
Plan de lexpos
Introduction : quest-ce que linformation gntique ?
Codage et transmission de linformation gntique
Expression de linformation gntique
Gntique et informatique
Quest-ce que linformation gntique ?
Chaque individu prsente des caractres propresCertains sont acquis (musculature, )Dautres hrditaires (couleur des yeux, groupe sanguin, ) transmis dune gnration lautre
information gntique
Introduction : quest-ce que linformation gntique ?Codage et transmission de linformation gntiqueLocalisation de linformation gntiqueSupport de linformation gntiqueCodage de linformation gntique sur lADNTransmission de linformation gntiqueExpression de linformation gntiqueGntique et informatique
Exprience de Gurdon (1960)
Noyau cellule grenouille Buf nucl grenouille A
> obtention dun clone de la grenouille B
I.1) Localisation de linformation gntique
I.2) Support de linformation gntique
Cellule
G: *1000
N = 1013
Chromosome
G: *10 000
N = 2*23
ADN
G: *107
L 2 m
I.2) Support de linformation gntique
Paires de bases
G: *107
N 3 * 109
Watson et Crick,
1953
I.2) Support de linformation gntique
Bases puriques (R)
Bases pyrimidiques (Y)
(A)
(G)
(T)
(C)
-> ADN Succession de 3 * 109 lettres dun alphabet quaternaire
I.3) Codage de linformation gntique sur lADN
Succession presque linaire de 3*109 lettres dun alphabet molculaire quaternaire (A,C,G,T)Seule non-linarit : ADN port par 2n chromosomes (n=23 chez lhomme)
Le brin complmentaire napporte aucun complment dinformation (stabilit chimique) Il existe de lADN hors du noyau : ADN mitochondrial (104 paires de bases)
I.4) Transmission de linformation gntique
Transmission conforme : la rplication lors de la division cellulaireBrassage gntique lors de la reproduction sexue
Cellule du pre
2n chromosomes
Cellule de la mre
2n chromosomes
Gamte du pre
n chromosomes
Gamte du pre
n chromosomes
Gamte de la mre
n chromosomes
Gamte de la mre
n chromosomes
Cellule oeuf
n+n chromosomes
Gnration N
Gnration N+1
miose
fcondation
I.4) Transmission de linformation gntique
Erreurs de copie : les mutationsSubstitution alatoire dune lettre par une autre lettre de lalphabetInsertion alatoire dune lettre (ou dun groupe de lettres)Suppression alatoire dune lettre (ou dun groupe de lettres)Slection des mutants
ACCTGC
ACTTGC
ACCTGC
ACCATGC
ACCTGC
AGC
IntroductionCodage et transmission de linformation gntiqueExpression de linformation gntiquePrincipes de lexpression : les protinesDe lADN la protineTranscriptionTraduction et code gntiqueRgulations de lexpression gntiqueGntique et informatique
II.1) Principes de lexpression : les protines
ADN
Protines
scrtes
Protines constitutives
Enzymes
(protines)
Mtabolisme
Physiologie
Dveloppement
Production
De glucides
Production
De lipides
Gnotype
Protines
Phnotype
Les protines, molcules de passage du gnotype (information gntique) au phnotype (ensemble des caractres)La gntique sintresse lexpression de linformation gntique jusqu la production des protinesLtude du rle des protines dans lexpression du phnotype est du domaine de la biochimie, de la biologie cellulaire, du dveloppement, de la physiologie
II.1) Principes de lexpression : les protines
II.1) Principes de lexpression : les protines
II.2) De lADN la protine
Transcription
Traduction
ADN
ARN m
Protine
II.3) Transcription
pissage
II.4) Traduction et code gntique
Bilan
Notion de gneUn gne une protine (excision des introns)Un gne : du codon dpart au codon STOPEnsemble des gnes zone exprime de lADN35 000 gnes chez lHumain1,5 % de lADN -> quoi sert le reste ??Similitude entre les gnes des tres vivants40 % de nos gnes commun avec une plante80 % avec un Mammifre98,5 % avec un Chimpanz99,9 % avec un autre HumainLinarit apparente de lexpression gntiqueCodage quasi-linaire de linformation gntique sur lADNTranscription : bijection de {A, T, C, G} sur {A, U, C, G}Traduction : surjection de {A, U, C, G}3 sur {Phe, Leu, Ile, Met, Val, Ser, Pro, Thr, Ala, Tyr, His, Gln, Asn, Lys, Asp, Glu, Cys, Trp, Arg, Gly}
Bilan
Pourtant variabilit de lexpressionDans lespace :Toutes les cellules nont pas la mme formeToutes les cellules nont pas la mme fonctionDans le temps :Activit cellulaire dpendant du stade de dveloppementSelon lenvironnement : Activit cellulaire dpendant de son environnement chimiqueRorganisation de linformation gntique lors de son expression par rgulations multiples
II.5) Rgulations de lexpression gntique
gne
pr-ARNm
ARNm
ARNm
protine
protine modifie
protine active
protine dgrade
transcription
pissage
traduction
noyau
Organisation structurale de lADN
Facteurs de rgulation de la transcription
Epissage alternatif
Maturation, transport, adressage des ARNm
Dure de vie des ARNm
Contrle de la traduction des ARNm
Modifications post-traductionnelles
Adressage, et rgulation de lactivit
Contrle de la dgradation protique
II.5) Rgulations de lexpression gntique
gne
pr-ARNm
ARNm
ARNm
protine
protine modifie
protine active
protine dgrade
transcription
pissage
traduction
noyau
Facteurs de rgulation de la transcription
Produits de lactivit protique
Environnement
Epissage alternatif
Un exemple de la rgulation de la transcription
chez les Procaryotes : lopron tryptophane
Gnes codants pour les enzymes ncessaires la synthse du tryptophane
Un exemple eucaryote : les gnes homotiques
Epissage alternatif
Introduction : quest-ce que linformation gntique ?Codage et transmission de linformation gntiqueExpression de linformation gntiqueGntique et informatiqueApports de linformatique la gntiqueLinspiration gntique en informatique
III.1) Apports de linformatique la gntique
Analyse de squences de basesIdentification de motifsLocalisation de motifs connusDtection de rgularits, priodicitsComparaison de squencesRecherche des similaritsRecherche des mutationsCalcul de taux de divergencelaboration de modles dvolutionlaboration darbres phylogntiquesModlisation de la structure 3d de protines
Analyse de squences de basesIdentification de motifsLocalisation de motifs connusDtection de rgularits, priodicitsComparaison de squencesRecherche des similaritsRecherche des mutationsCalcul de taux de divergencelaboration de modles dvolutionlaboration darbres phylogntiquesModlisation de la structure 3d de protines
III.1) Apports de linformatique la gntique
POS: 1 2 3 TOTAL
A 24% 31% 23% 26%
C 25% 21% 26% 24%
G 34% 22% 24% 27%
T 18% 26% 27% 24%
Phe TTT 1.7 Ser TCT 1.6 Tyr TAT 1.2 Cys TGT 0.8
Phe TTC 2.0 Ser TCC 0.5 Tyr TAC 1.7 Cys TGC 1.3
Leu TTA 0.9 Ser TCA 0.9 *** TAA 1.2 *** TGA 0.9
Leu TTG 0.6 Ser TCG 0.7 *** TAG 0.2 Trp TGG 1.4
Leu CTT 1.4 Pro CCT 0.9 His CAT 1.3 Arg CGT 3.8
Leu CTC 1.0 Pro CCC 0.3 His CAC 1.4 Arg CGC 1.9
Leu CTA 0.4 Pro CCA 1.0 Gln CAA 1.4 Arg CGA 1.1
Leu CTG 4.0 Pro CCG 2.2 Gln CAG 2.1 Arg CGG 0.7
Ile ATT 2.3 Thr ACT 1.0 Asn AAT 1.0 Ser AGT 0.4
Ile ATC 2.3 Thr ACC 1.5 Asn AAC 2.5 Ser AGC 1.8
Ile ATA 0.3 Thr ACA 0.9 Lys AAA 3.9Arg AGA 0.8
Met ATG 1.9 Thr ACG 0.8 Lys AAG 1.7 Arg AGG 0.3
Val GTT 2.7 Ala GCT 1.9 Asp GAT 2.5 Gly GGT 2.6
Val GTC 1.1 Ala GCC 1.5 Asp GAC 2.5 Gly GGC 2.8
Val GTA 1.5 Ala GCA 2.1 Glu GAA 4.7 Gly GGA 0.9
Val GTG 1.9 Ala GCG 2.8 Glu GAG 1.9 Gly GGG 0.7
Frquence (%) des bases sur le mme gne
de 2594 codons
Frquence des bases
sur un gne de 7784 pb
IDENTIFICATION DE MOTIFS (PROGICIEL SQX, SITE INFOBIOGEN)
http://www.infobiogen.fr/doc/SQXdoc/
http://www.infobiogen.fr/doc/SQXdoc/freqces.html
DTECTION DE PRIODICITS (LAB INFO DE lIGM)
Proba dapparition de GTC n bases aprs CGC en phase de lecture -> priodicit 0 [3]Proba dapparition de TCG n bases aprs ATC en phase de lecture -> priodicit 1 [3]Proba dapparition de CGT n bases aprs CCC en phase de lecture -> priodicit 2 [3]
Proba 1
n
Proba 3
Proba 2
n
n
Classement des trinuclotides en fonction de leur phase d'apparition prfrentielle
Proprits de ces 3 classes de trinuclotides d'un point de vue thorie des codes:
ces 3 classes de trinuclotides s'changent par permutation circulaire, ce sont, toutes les trois, des codes circulaires maximaux, ces 3 codes possdent une proprit de complmentarit: auto-complmentarit pour T0, et change de T1 et T2 par complmentarit, codes non triviaux ( codes obtenus par des techniques classiques de gnration).
http://www-igm.univ-mlv.fr/LabInfo/rapport/igm_new005.html
Hypothse biologique : gnes primitifs = mots du langage To ?
Phase de lecture reprable automatiquement -> ne ncessite pas de codon initiateurAuto-complmentarit -> codage simultan et en