Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
Cristallographie en Biologie
William SHEPARDBeamline PROXIMA 2A
Ecole Cristallographie et Grands Equipements, Synchrotron SOLEIL, 20-21 Octobre 2016
• Acides nucléiques (ADN, ARN) : contiennent de l’information génétique
Les molécules constituantes de la vie
• Protéines: les principaux acteurs des cellules les enzymes catalysent des reactions biochimiques essentielles au
métabolisme; les protéines peuvent avoir un rôle structurel et méchanique, par
exemple l’actine et la myosine présentes dans les muscles d’autres protéines ont un rôle de signalisation cellulaire, réponse
immunitaire, …
• Glucides: les principaux intermédiaires biologiques de stockage et de consommation d'énergie
• Lipides: les principaux composants des membranes, ils ont aussi la fonction de stockage d’énergie
Structure des protéines
• Les protéines se différencient par lenombre et la séquence des acidesaminés qui composent la chaînepolypeptidique
Les 20 acides aminés
Structure primaire
Structure secondaireStructure tertiaire
Structure quaternaire
Les Quatre Niveaux de Structure des protéines
La plupart des protéines adoptent unestructure tridimensionnelle unique
Les protéines peuvent interagir avecd’autres protéines, ADN, ARN,glucides, lipides, …
Structure des protéines
• La structure 3D d’une protéine peut fournir d’importantes informations surla fonction de la protéine et son mécanisme d’action
Pourquoi la Bio-cristallographie?
La Bio-cristallographie: Histoire
• 1937: M. Perutz commence un projet en ayant pour objectif la déterminationde la première structure cristalline d’une protéine, l’hémoglobine
• 1953: M.Perutz et collègues décrivent l’application de la méthode deremplacement isomorphe multiple (MIR) pour la détermination de structurescristallines de protéines
• 1953: J. Watson et F. Crick décrivent la structure en double hélice de l'ADN,grâce à la technique de diffraction des rayons X (à partir du travail de RosalindElsie Franklin)
• 1958-60: M. Perutz et J. Kendrew résoudrent les premières structurestridimensionnelles des protéines, la myoglobine et l’hémoglobine
• 1962: Prix Nobel de Chimie à J. Kendrew et M. Perutz pour leurs études desstructures des protéines globulaires
• 1962: Prix Nobel de Médecine à J. Watson et F. Crick pour la découverte de lastructure de l’ADN
• La méthode expérimentale la plus utilisée pour déterminer la structure 3D des macromolécules biologiques à l’échelle atomique
La Bio-cristallographie
Prix Nobel de Chimie 2009Venkatraman Ramakrishnan, Thomas A. Steitz, Ada E. Yonath
"for studies of the structure and function of the ribosome"
• Composé de protéines et d'ARN (chez lalevure, 79 protéines et ~ 5600 nucléotidespour une masse de ~ 4 MDa)
• Fonction: synthétiser des protéines endécodant l'information contenue dans l'ARNmessager
Cristaux de protéine
Diffraction des rayons X Détermination de la structure, modélisation, affinement
Analyse de la structure
La Bio-cristallographie : Un schéma de travail
Faisceau incident
Faisceaux diffractés
h = h k lI(h) = k |F(h)|2
cristal
goniomètre
)]i(exp[2 )( V )( cell rh.rrhF dπρcellV∫= )](i )i(exp[-2|)F(| V
1 )( cell∑ +=
hhh.rhr φπρ
Molécules de protéine
Une expérience MX F(h) = |F(h)| eiφ(h)
Intensités mesuréesI(h) = k|F(h)|2
phases φ(h)?
TF
o Quelques centaines à plusieurs milliers d’atomeso Composées principalement par C N O H (S, P, …)o Flexibles
La Bio-cristallographie versusla cristallographie des “petites molecules”
Cristaux
Données de diffraction
Détermination de la structure
Affinement de la structure
Macromolécules biologiques
o Grande mailleo Grande quantité de solvanto Mosaïques: désordre interneo Souvent petit en taille (microns)
o Grand nombre de réflexionso «Faible» intensité o «Basse» résolution
o Méthodes directes rarement applicableso Remplacement Moléculaireo Méthodes basées sur l’incorporation des atomes
lourds
o Faible rapport données/paramètres à affinero Application de restrictions géométriques o Validation du modèle
Les macromolécules biologiques
• Protéines: polymère de plusieurs dizaines a plusieurs centaines de résidus
• Structure flexible!
Les cristaux de protéine
• Dimensions: quelques microns a quelques centaines demicrons
• Paramètres de maille: des dizaines à des centainesd’angstroms
• Contenu de solvant : 30-75 %
• « Mosaicity » (mesure angulaire de l’ordre à longuedistance de la maille dans un cristal) : < 0.2° à > 1 °
• Empilement cristallin: contactfaible entre les molécules
P6522
Systèmecristallin
Groupe ponctuel
Groupes d’espace
Triclinique 1 P1
Monoclinique 2 P2 P21 C2
Orthorhombique 222 C222 P222 P212121 P21212 P2221 C2221 F222 I222 I212121
Quadratrique 4422
P4 P41 P42 P43 I4 I41
P422 P4212 P4122 P41212 P4222 P42212 P43212 P4322 I422 I4122
Trigonal 332
P3 P31 P32 R3P312 P321 P3121 P3112 P3221 P3212 R32
Hexagonal 6622
P6 P65 P64 P63 P62 P61
P622 P6122 P6222 P6322 P6422 P6522
Cubique 23432
P23 F23 I23 P213 I213P432 P4132 P4232 P4332 F432 F4132 I432 I4132
Les cristaux de protéine
• 65 groupes de espace possibles: PAS de centre d’inversion ou de plan de réflexion
Les données de diffraction
Faisceaux diffractés
• Montage du cristal sur le goniomètre à l’aide d’une boucle
• Cristal est maintenu sous un flux d’azote gazeux à 100K pendant la collecte
Les données de diffraction
• 1ère analyse Qualité des données? Résolution?
3.6 Å
Les données de diffraction
• 1ère analyse Qualité des données? Résolution?
Les données de diffraction : Stratégie de collecte
• Stratégie de collecte Combien de dégrées?
Complétude, redondance, … Intervalle de rotation par image? Temps d’exposition? Atténuation?
Endommagement par radiation-X …
Distance du détecteur?
Les données de diffraction : Recherche des taches
Les données de diffraction : Indexation
Les données de diffraction : Prediction
Les données de diffraction : Integrationh k l I σ(I)1 1 0 1371.61 5.89-1 2 0 1196.70 4.910 2 0 231.03 1.131 2 0 3.78 0.252 2 0 878.37 3.54-2 3 0 452.47 2.12-1 3 0 399.54 1.950 3 0 21.25 0.431 3 0 239.55 1.192 3 0 137.99 0.953 3 0 740.31 3.25-3 4 0 193.56 1.49-2 4 0 2642.03 10.99-1 4 0 646.72 2.820 4 0 77.68 0.701 4 0 1267.94 4.692 4 0 79.31 0.863 4 0 1181.46 5.274 4 0 716.08 3.52-4 5 0 2995.81 11.94-3 5 0 512.31 2.76-2 5 0 1109.98 4.95-1 5 0 134.64 1.110 5 0 1216.81 4.811 5 0 153.06 1.152 5 0 1519.94 6.033 5 0 146.59 1.314 5 0 226.60 1.775 5 0 177.13 1.58
• Un jeu de données: des dizaines demilliers à des centaines de milliers deréflexions
I (h k l), σ (I)
• Intégration et application des facteursde correction aux intensités desréflexions
La fonction densité électronique ρ(r) ne peut pas être déterminée directement à partir des données expérimentales
)]i(exp[-2 )(exp(|)F(| V1 )(
cell∑=h
h.rhhr πiφρ
La détermination de la structure: Le Problème des Phases
Im
Re
|F(h)|ϕ(h)?
F(h) = |F(h)| eiφ(h)
Intensités mesuréesI(h) = k|F(h)|2
phases φ(h)?
La détermination de la structure
• Méthodes directes
o Relations de phase entre facteurs de structure (normalisés)
• Remplacement Moléculaire
• Méthodes basées sur l’incorporation des atomes lourds
o Application: o données a haute résolution (< 1.2 Å), o petites protéines (~1000 atomes)
• Principes:
les protéines homologues présentent un repliment similaire
utilisation d’une structure 3D connue comme modèle initial pour ladétérmination de la nouvelle structure
• Les coordonnées des atomes du modèle se rapportent à un système de référencedonné, c’est à dire, la maille cristalline
• Problème: description de la structure connue (modèle) dans la maille cristallinede la molécule dont la structure est inconnue
Remplacement Moléculaire
?
2 etapes: rotation + translation
rnouvelle = Rrmodèle + t
∫ +=−∗=cellvol
dP.
)()()()()( rurrrru ρρρρ
Nous trouvons les pics de la fonction de Patterson quand les vecteurs ucorrespondent a des vecteurs interatomiques
Fonction d'autocorrélation de la densité électronique
y
x
1
23
u
v
12
21
23
3213
31
Une structure 2D de troisatomes et les pics dePatterson correspondants
Fonction de Patterson
FT[ρ(r)* ρ(-r)] = FT[ρ(r)] FT[ρ(-r)]
FT[P(u)] = [A(h) + iB(h)][A(h) – iB(h)] = |F(h)|2
P(u) = FT-1[|F(h)|2] =
=
∑ ++=hkl
lwkvhuhklFV
uvwP )](2cos[)(2)( 2 π
hhuh diF )2exp()( 2 ⋅−∫ π
)2exp()(1 2 huhh
⋅−∑ iFV
π
Fonction de Patterson
• Contient de l’information structural (vecteurs interatomiques)
• Peut être calculée à partir des données expérimentales
• Problème: description de la structure connue (modèle) dans la maille cristalline de la molécule dont la structure est inconnue
• Comment placer la molecule modèle dans la nouvelle maille?
o Superposition des fonctions de Patterson
Carte de Patterson du modèle calculée à partir des coordonées
Carte de Patterson de la structure inconnue calculée à partir des données
Remplacement Moléculaire
?
2 etapes:
rotation + translation
rnouvelle = Rrmodèle + t
crist
alca
rte
de P
atte
rson
• Pour N atomes dans la maille, la carte dePatterson présentent N2-N pics
Remplacement Moléculaire
])()([hkl calc
2calc
2 2
hkl obs2
obs2 2 2/1
calc2
calc2
obs2
hklobs
2
)hkl(F)hkl(F)hkl(F)hkl(F
))hkl(F)hkl(F())hkl(F)hkl(F(C
∑∑ −−
∑ −×−=
• Solution: contraste entre le facteur decorrélation calculé à partir d’uneorientation/position donnée et lesautres
• Pour chaque orientation/position, desfacteurs de corrélation sont calculés
Possibles sources de problème:
• basse similarité de sequence (“preparation” du modèle)
• empilement cristallin très compact
• molécules “alongées”
• flexibilité entre domaines
. . .
Remplacement Moléculaire
Remplacement Isomorphe et Diffraction Anomale
• Méthodes basées sur l’incorporation des atomes lourds dans le cristal (dérivés d’atomes lourds)
• L’incorporation des atomes lourds va provoquer unchangement du facteur de structure qui va être utilisépour la résolution du problème des phases
Im
Re
|FP|αP?
Remplacement Isomorphe et Diffraction Anomale
Im
Re
|FP|αP?
• 1ère étape: détermination de la position desatomes lourds
• Méthodes basées sur l’incorporation des atomes lourds dans le cristal (dérivés d’atoms lourds)
• L’incorporation des atomes lourds va provoquer unchangement du facteur de structure qui va être utilisépour la résolution du problème des phases
Remplacement Isomorphe et Diffraction Anomale
• Multiple Isomorphous Replacement(MIR) : enregistrement des données d’uncristal natif et de deux ou plus dérivésd’atomes lourds
• Multiple Wavelength AnomalousDiffraction (MAD): enregistrement desdonnées d’un cristal dérivé à deslongueurs d’onde choisies
).i2exp(f)(F jN
1jj hrh π∑
==
• Facteur de structure: description de la diffusion par la maille du cristal
• Diffusion “normale”
Le facteur de diffusion atomique fj décrit la diffusion par un atome isoléconsiderant des életrons libres
fj est réel et independant de la longueur d’onde du rayonnement incident
Diffraction Anomale à Multiples Longueurs d’Onde (MAD)
• Electron non-libre: résonanceentre le rayonnement incident etl’onde électromagnétique dudipôle oscillant
• A certaines énergies durayonnement incident (proched’un seuil d’absorption) ladiffusion “anomale” se produit
noyaux
électron -
+δ+
δ+
δ-
δ-
électron non-libre dipôle oscillant
Diffraction Anomale à Multiples Longueurs d’Onde (MAD)
• Facteur de diffusion atomique: fj = f0 + ∆f(λ) + if’’(λ) = f’(λ) + if”(λ)
Im
Re
F˚(h)
λƒ'(h)λƒ"(h)
F(h)
F˚(-h)
F(-h)λƒ"(-h)
λƒ'(-h)
• La loi de Friedel est toujours valide, si il y a un seul element
I (h) = I(-h)
fj est complexe et depend de la longueur d’onde du rayonnement incident
The Breakdown of Friedel’s Law
Mais avec la diffusion anomale
(λƒ")|F(+h)| ≠ |F(-h)|
|FT(+h)|circle
Im
Re
|FT(-h)|circleFP(-h)
FP(+h)
FA(+h)
FA(-h)
La loi de Friedel n’est plus valable
I (h) ≠ I(-h)
Loi de Friedel|F(+h)| = |F(-h)|
Diffraction Anomale à Multiples Longueurs d’Onde (MAD)
-15
-10
-5
0
5
10
15
12600 12650 12700 12750 12800
ƒ'
Energy (eV)
ƒ"
Elec
trons
MAD
optimised SIRAS
high ƒ" remote
low ƒ" remote
min ƒ'max ƒ"
ƒ" maximised at "whiteline"
(0.9840Å) (0.9801Å) (0.9763Å) (0.9724Å) (0.9686Å)
Se K-edge of SeO4
2-
• Longueurs d’onde de la collecte choisies pour maximiser: Différences anomales: F(h)+, F(h)-
Différences dispersives: F(h)λ1, F(h)λ2
fj = f’(λ) + if”(λ)
Construction et affinement du modèle
• Détermination de la structurecristalline: calcul d’une carte dedensité électronique
)]i(exp[-2 )(exp(|)F(| V1 )(
cell∑=h
h.rhhr πiφρ
Construction et affinement du modèle
• Détermination de la structurecristalline: calcul d’une carte dedensité électronique
)]i(exp[-2 )(exp(|)F(| V1 )(
cell∑=h
h.rhhr πiφρ
Construction et affinement du modèle
Carte de densité électronique initiale ρ(r)
Fo, αc0 → ρ1 (r)
Construction et affinement du modèle
Modèle initial (coordonnées atomiques)
Carte de densité électronique initiale ρ(r)
Fo, αc0 → ρ1 (r)
Affinement du modèle, calcul de nouvelles phases
F1, αc1 → ρ2 (r)
CRYST1 55.490 55.490 115.220 90.00 90.00 90.00 P 43 ATOM 1 O GLY A 14 22.936 17.256 42.286 1.00 38.76ATOM 2 N GLY A 14 24.991 16.909 40.481 1.00 41.17ATOM 3 CA GLY A 14 23.796 17.660 40.098 1.00 39.33ATOM 4 C GLY A 14 22.679 17.528 41.111 1.00 37.45ATOM 5 N VAL A 15 21.433 17.718 40.675 1.00 28.46ATOM 6 CA VAL A 15 20.261 17.642 41.555 1.00 24.14ATOM 7 C VAL A 15 19.320 16.530 41.094 1.00 26.85ATOM 8 O VAL A 15 18.962 16.479 39.915 1.00 25.35ATOM 9 CB VAL A 15 19.506 19.004 41.696 1.00 24.54ATOM 10 CG1 VAL A 15 18.372 18.906 42.716 1.00 22.66ATOM 11 CG2 VAL A 15 20.451 20.146 42.077 1.00 23.79
x y z
Facteur de Debye-Waller, Facteur B B(Å2) u(Å)50.0 0.8040.0 0.7130.0 0.6225.0 0.56
Construction et affinement du modèle• Affinement classique: 4 paramètres par atome (x, y, z, B)• Faible rapport: données (nombre de réflexions uniques) / paramètres à affiner
𝑓𝑓𝑗𝑗 = 𝑓𝑓𝑗𝑗0 𝑒𝑒𝑒𝑒𝑒𝑒 −𝐵𝐵𝑖𝑖𝑖𝑖𝑖𝑖𝑠𝑠𝑒𝑒𝑠𝑠𝜃𝜃
λ
2
; 𝐵𝐵𝑖𝑖𝑖𝑖𝑖𝑖 = 8𝜋𝜋2 𝑢𝑢2
Construction et affinement du modèle• Restrictions géométriques: paramètres stéréochimiques sont utilisés pour
augmenter le rapport données / paramètres à affiner• Fonctions de restriction: distance/angles de liaison, planarité, interactions non
covalantes, …
• Moindres carrés
• Maximum devraisemblance
Construction et affinement du modèle
• Les facteurs B isotropes ne décrivent pas convenablement le modèle
• La description anisotrope introduit 6 paramètres par atome
• TLS (Translation/Libration/Screw) : la chaine polypeptidique est divisée ensegments; mouvement anisotrope des groupes d’atomes corrélés
• Introduction de 20 paramètres en plus par groupe dans l’affinement;amélioration significative de la qualité du modèle
Biso Baniso TLS
Construction et affinement du modèle
1.5 Å 2.8 Å
• La question de la résolution des données
Construction et affinement du modèle
1.5 Å 2.8 Å
• La question de la résolution des données niveau de détail de la carte nombre de réflexions uniques utilisées pour l’affinement
(8x plus de réflexions dans un jeu a 2 Å que dans un jeu à 4 Å)
• Paramètres géométriques et accordavec données expérimentales
• Minimisation du facteur résiduel
∑∑ −
=obs
calcobsfactor
FFF
R
Construction et affinement du modèle
Espace réel: ajustement dumodèle à la densité électronique
Carte de densité électronique ρ(r)
Fo, αc0 → ρ1 (r)
Espace réciproque: affinement des paramètres du modèle, calcul de nouvelles phases
∑∑ −
=obs
calcobsfree
FFF
R
• Géometrie des liaisons covalentes• Planarité• Angles dièdres• Interactions non covalentes• Ponts dissulfures
Diagramme de Ramachandran
Validation du modèle
Validation du modèle
Déposition des coordonées du modèle et facteurs de structureProtein Data Bank http://www.rcsb.org/pdb/home/home.do
Human ASMT Structure
SAM
Hg
Pt N-term
C-term
ASMT SAM & NAS complex
Dimerization domain
SAM-dependantmethyltransferase
domain
SAM-NAS site (2)
H255D256
R252M303
NAS SAM
Methylation Mechanism?
ASMT Active Site & Homology
Human ASMT Variants
Variant D210G (Activity < 10%)
ASMT splice mutant: IVS5+2T→C
Cristaux de protéine
Diffraction des rayons X Détermination de la structure, modélisation, affinement
Analyse de la structure
La Bio-cristallographie