Cristallographie en Biologie - CGE-2016-Pariscge2016.impmc.upmc.fr/ppt/Shepard-BioCrystallography.pdf · 2016. 10. 21. · La Bio-cristallographie. versus. la cristallographie des

Cristallographie en Biologie

William SHEPARDBeamline PROXIMA 2A

[email protected]

Ecole Cristallographie et Grands Equipements, Synchrotron SOLEIL, 20-21 Octobre 2016

• Acides nucléiques (ADN, ARN) : contiennent de l’information génétique

Les molécules constituantes de la vie

• Protéines: les principaux acteurs des cellules les enzymes catalysent des reactions biochimiques essentielles au

métabolisme; les protéines peuvent avoir un rôle structurel et méchanique, par

exemple l’actine et la myosine présentes dans les muscles d’autres protéines ont un rôle de signalisation cellulaire, réponse

immunitaire, …

• Glucides: les principaux intermédiaires biologiques de stockage et de consommation d'énergie

• Lipides: les principaux composants des membranes, ils ont aussi la fonction de stockage d’énergie

Structure des protéines

• Les protéines se différencient par lenombre et la séquence des acidesaminés qui composent la chaînepolypeptidique

Les 20 acides aminés

Structure primaire

Structure secondaireStructure tertiaire

Structure quaternaire

Les Quatre Niveaux de Structure des protéines

La plupart des protéines adoptent unestructure tridimensionnelle unique

Les protéines peuvent interagir avecd’autres protéines, ADN, ARN,glucides, lipides, …

Structure des protéines

• La structure 3D d’une protéine peut fournir d’importantes informations surla fonction de la protéine et son mécanisme d’action

Pourquoi la Bio-cristallographie?

La Bio-cristallographie: Histoire

• 1937: M. Perutz commence un projet en ayant pour objectif la déterminationde la première structure cristalline d’une protéine, l’hémoglobine

• 1953: M.Perutz et collègues décrivent l’application de la méthode deremplacement isomorphe multiple (MIR) pour la détermination de structurescristallines de protéines

• 1953: J. Watson et F. Crick décrivent la structure en double hélice de l'ADN,grâce à la technique de diffraction des rayons X (à partir du travail de RosalindElsie Franklin)

• 1958-60: M. Perutz et J. Kendrew résoudrent les premières structurestridimensionnelles des protéines, la myoglobine et l’hémoglobine

• 1962: Prix Nobel de Chimie à J. Kendrew et M. Perutz pour leurs études desstructures des protéines globulaires

• 1962: Prix Nobel de Médecine à J. Watson et F. Crick pour la découverte de lastructure de l’ADN

• La méthode expérimentale la plus utilisée pour déterminer la structure 3D des macromolécules biologiques à l’échelle atomique

La Bio-cristallographie

Prix Nobel de Chimie 2009Venkatraman Ramakrishnan, Thomas A. Steitz, Ada E. Yonath

"for studies of the structure and function of the ribosome"

• Composé de protéines et d'ARN (chez lalevure, 79 protéines et ~ 5600 nucléotidespour une masse de ~ 4 MDa)

• Fonction: synthétiser des protéines endécodant l'information contenue dans l'ARNmessager

Présentateur

Commentaires de présentation

Yeast ribosome: 79 proteins and about 5600 nucleotides ribosome, the large protein-RNA complex that synthesizes proteins using genetic instructions encoded in the mRNA template. A few years ago, we determined the complete atomic structure of the 30S subunit and its complexes with several antibiotics, initiation factor IF1, and cognate and near-cognate tRNA anticodon stem-loops complexed with mRNA in the A site. More recently, we have determined the high-resolution structure of the entire ribosome complexed with mRNA and tRNA. These studies have shed light on antibiotic function, and the mechanism of tRNA and mRNA recognition and decoding by the ribosome. Figure: Elongation After the ribosome gets set up, it begins to read along the mRNA strand, building a protein one amino acid at a time. In the structure shown here on the left (2wrn and 2wro), a new tRNA is being delivered by the protein EF-Tu (shown in purple). In the center structure (2wdk and 2wdl), three tRNA molecules are bound inside the ribosome. The left tRNA (the A site) has the amino acid that will be added, the central tRNA (the P site) holds the growing protein chain, and the right tRNA (the E site) is finished with its job and is ready to be ejected. After the protein chain is transferred from the middle tRNA to the A-site tRNA, the protein EF-G helps to push everything one step forward, as shown in the structure on the right (2wri and 2wrj).

Cristaux de protéine

Diffraction des rayons X Détermination de la structure, modélisation, affinement

Analyse de la structure

La Bio-cristallographie : Un schéma de travail

Faisceau incident

Faisceaux diffractés

h = h k lI(h) = k |F(h)|2

cristal

goniomètre

)]i(exp[2 )( V )( cell rh.rrhF dπρcellV∫= )](i )i(exp[-2|)F(| V

1 )( cell∑ +=

hhh.rhr φπρ

Molécules de protéine

Une expérience MX F(h) = |F(h)| eiφ(h)

Intensités mesuréesI(h) = k|F(h)|2

phases φ(h)?

TF

Présentateur


La fonction densité électronique (r) ne peut pas être déterminée directement à partir des données expérimentales

o Quelques centaines à plusieurs milliers d’atomeso Composées principalement par C N O H (S, P, …)o Flexibles

La Bio-cristallographie versusla cristallographie des “petites molecules”

Cristaux

Données de diffraction

Détermination de la structure

Affinement de la structure

Macromolécules biologiques

o Grande mailleo Grande quantité de solvanto Mosaïques: désordre interneo Souvent petit en taille (microns)

o Grand nombre de réflexionso «Faible» intensité o «Basse» résolution

o Méthodes directes rarement applicableso Remplacement Moléculaireo Méthodes basées sur l’incorporation des atomes

lourds

o Faible rapport données/paramètres à affinero Application de restrictions géométriques o Validation du modèle

Les macromolécules biologiques

• Protéines: polymère de plusieurs dizaines a plusieurs centaines de résidus

• Structure flexible!

Les cristaux de protéine

• Dimensions: quelques microns a quelques centaines demicrons

• Paramètres de maille: des dizaines à des centainesd’angstroms

• Contenu de solvant : 30-75 %

• « Mosaicity » (mesure angulaire de l’ordre à longuedistance de la maille dans un cristal) : < 0.2° à > 1 °

• Empilement cristallin: contactfaible entre les molécules

P6522

Systèmecristallin

Groupe ponctuel

Groupes d’espace

Triclinique 1 P1

Monoclinique 2 P2 P21 C2

Orthorhombique 222 C222 P222 P212121 P21212 P2221 C2221 F222 I222 I212121

Quadratrique 4422

P4 P41 P42 P43 I4 I41

P422 P4212 P4122 P41212 P4222 P42212 P43212 P4322 I422 I4122

Trigonal 332

P3 P31 P32 R3P312 P321 P3121 P3112 P3221 P3212 R32

Hexagonal 6622

P6 P65 P64 P63 P62 P61

P622 P6122 P6222 P6322 P6422 P6522

Cubique 23432

P23 F23 I23 P213 I213P432 P4132 P4232 P4332 F432 F4132 I432 I4132

Les cristaux de protéine

• 65 groupes de espace possibles: PAS de centre d’inversion ou de plan de réflexion

Les données de diffraction

Faisceaux diffractés

• Montage du cristal sur le goniomètre à l’aide d’une boucle

• Cristal est maintenu sous un flux d’azote gazeux à 100K pendant la collecte

Présentateur


a very strong background visible as a diffuse dark ring at a cer- tain angle with the primary beam. This feature is due to the scattering of X-rays by disordered water molecules, which always accompany protein molecules in their crys- tals.


• 1ère analyse Qualité des données? Résolution?

3.6 Å

Présentateur




• 1ère analyse Qualité des données? Résolution?

Présentateur



Les données de diffraction : Stratégie de collecte

• Stratégie de collecte Combien de dégrées?

Complétude, redondance, … Intervalle de rotation par image? Temps d’exposition? Atténuation?

Endommagement par radiation-X …

Distance du détecteur?

Les données de diffraction : Recherche des taches

Les données de diffraction : Indexation

Les données de diffraction : Prediction

Les données de diffraction : Integrationh k l I σ(I)1 1 0 1371.61 5.89-1 2 0 1196.70 4.910 2 0 231.03 1.131 2 0 3.78 0.252 2 0 878.37 3.54-2 3 0 452.47 2.12-1 3 0 399.54 1.950 3 0 21.25 0.431 3 0 239.55 1.192 3 0 137.99 0.953 3 0 740.31 3.25-3 4 0 193.56 1.49-2 4 0 2642.03 10.99-1 4 0 646.72 2.820 4 0 77.68 0.701 4 0 1267.94 4.692 4 0 79.31 0.863 4 0 1181.46 5.274 4 0 716.08 3.52-4 5 0 2995.81 11.94-3 5 0 512.31 2.76-2 5 0 1109.98 4.95-1 5 0 134.64 1.110 5 0 1216.81 4.811 5 0 153.06 1.152 5 0 1519.94 6.033 5 0 146.59 1.314 5 0 226.60 1.775 5 0 177.13 1.58

• Un jeu de données: des dizaines demilliers à des centaines de milliers deréflexions

I (h k l), σ (I)

• Intégration et application des facteursde correction aux intensités desréflexions

La fonction densité électronique ρ(r) ne peut pas être déterminée directement à partir des données expérimentales

)]i(exp[-2 )(exp(|)F(| V1 )(

cell∑=h

h.rhhr πiφρ

La détermination de la structure: Le Problème des Phases

Im

Re

|F(h)|ϕ(h)?

F(h) = |F(h)| eiφ(h)

Intensités mesuréesI(h) = k|F(h)|2

phases φ(h)?

La détermination de la structure

• Méthodes directes

o Relations de phase entre facteurs de structure (normalisés)

• Remplacement Moléculaire

• Méthodes basées sur l’incorporation des atomes lourds

o Application: o données a haute résolution (< 1.2 Å), o petites protéines (~1000 atomes)

• Principes:

les protéines homologues présentent un repliment similaire

utilisation d’une structure 3D connue comme modèle initial pour ladétérmination de la nouvelle structure

• Les coordonnées des atomes du modèle se rapportent à un système de référencedonné, c’est à dire, la maille cristalline

• Problème: description de la structure connue (modèle) dans la maille cristallinede la molécule dont la structure est inconnue

Remplacement Moléculaire

?

2 etapes: rotation + translation

rnouvelle = Rrmodèle + t

∫ +=−∗=cellvol

dP.

)()()()()( rurrrru ρρρρ

Nous trouvons les pics de la fonction de Patterson quand les vecteurs ucorrespondent a des vecteurs interatomiques

Fonction d'autocorrélation de la densité électronique

y

x

1

23

u

v

12

21

23

3213

31

Une structure 2D de troisatomes et les pics dePatterson correspondants

Fonction de Patterson

FT[ρ(r)* ρ(-r)] = FT[ρ(r)] FT[ρ(-r)]

FT[P(u)] = [A(h) + iB(h)][A(h) – iB(h)] = |F(h)|2

P(u) = FT-1[|F(h)|2] =

=

∑ ++=hkl

lwkvhuhklFV

uvwP )](2cos[)(2)( 2 π

hhuh diF )2exp()( 2 ⋅−∫ π

)2exp()(1 2 huhh

⋅−∑ iFV

π

Fonction de Patterson

• Contient de l’information structural (vecteurs interatomiques)

• Peut être calculée à partir des données expérimentales

• Problème: description de la structure connue (modèle) dans la maille cristalline de la molécule dont la structure est inconnue

• Comment placer la molecule modèle dans la nouvelle maille?

o Superposition des fonctions de Patterson

Carte de Patterson du modèle calculée à partir des coordonées

Carte de Patterson de la structure inconnue calculée à partir des données


?

2 etapes:

rotation + translation

rnouvelle = Rrmodèle + t

crist

alca

rte

de P

atte

rson

• Pour N atomes dans la maille, la carte dePatterson présentent N2-N pics


])()([hkl calc

2calc

2 2

hkl obs2

obs2 2 2/1

calc2

calc2

obs2

hklobs

2

)hkl(F)hkl(F)hkl(F)hkl(F

))hkl(F)hkl(F())hkl(F)hkl(F(C

∑∑ −−

∑ −×−=

• Solution: contraste entre le facteur decorrélation calculé à partir d’uneorientation/position donnée et lesautres

• Pour chaque orientation/position, desfacteurs de corrélation sont calculés

Possibles sources de problème:

• basse similarité de sequence (“preparation” du modèle)

• empilement cristallin très compact

• molécules “alongées”

• flexibilité entre domaines

. . .


Remplacement Isomorphe et Diffraction Anomale

• Méthodes basées sur l’incorporation des atomes lourds dans le cristal (dérivés d’atomes lourds)

• L’incorporation des atomes lourds va provoquer unchangement du facteur de structure qui va être utilisépour la résolution du problème des phases

Im

Re

|FP|αP?


Im

Re

|FP|αP?

• 1ère étape: détermination de la position desatomes lourds

• Méthodes basées sur l’incorporation des atomes lourds dans le cristal (dérivés d’atoms lourds)

• L’incorporation des atomes lourds va provoquer unchangement du facteur de structure qui va être utilisépour la résolution du problème des phases


• Multiple Isomorphous Replacement(MIR) : enregistrement des données d’uncristal natif et de deux ou plus dérivésd’atomes lourds

• Multiple Wavelength AnomalousDiffraction (MAD): enregistrement desdonnées d’un cristal dérivé à deslongueurs d’onde choisies

).i2exp(f)(F jN

1jj hrh π∑

==

• Facteur de structure: description de la diffusion par la maille du cristal

• Diffusion “normale”

Le facteur de diffusion atomique fj décrit la diffusion par un atome isoléconsiderant des életrons libres

fj est réel et independant de la longueur d’onde du rayonnement incident

Diffraction Anomale à Multiples Longueurs d’Onde (MAD)

• Electron non-libre: résonanceentre le rayonnement incident etl’onde électromagnétique dudipôle oscillant

• A certaines énergies durayonnement incident (proched’un seuil d’absorption) ladiffusion “anomale” se produit

noyaux

électron -

+δ+

δ+

δ-

δ-

électron non-libre dipôle oscillant


• Facteur de diffusion atomique: fj = f0 + ∆f(λ) + if’’(λ) = f’(λ) + if”(λ)

Im

Re

F˚(h)

λƒ'(h)λƒ"(h)

F(h)

F˚(-h)

F(-h)λƒ"(-h)

λƒ'(-h)

• La loi de Friedel est toujours valide, si il y a un seul element

I (h) = I(-h)

fj est complexe et depend de la longueur d’onde du rayonnement incident

The Breakdown of Friedel’s Law

Mais avec la diffusion anomale

(λƒ")|F(+h)| ≠ |F(-h)|

|FT(+h)|circle

Im

Re

|FT(-h)|circleFP(-h)

FP(+h)

FA(+h)

FA(-h)

La loi de Friedel n’est plus valable

I (h) ≠ I(-h)

Loi de Friedel|F(+h)| = |F(-h)|


-15

-10

-5

0

5

10

15

12600 12650 12700 12750 12800

ƒ'

Energy (eV)

ƒ"

Elec

trons

MAD

optimised SIRAS

high ƒ" remote

low ƒ" remote

min ƒ'max ƒ"

ƒ" maximised at "whiteline"

(0.9840Å) (0.9801Å) (0.9763Å) (0.9724Å) (0.9686Å)

Se K-edge of SeO4

2-

• Longueurs d’onde de la collecte choisies pour maximiser: Différences anomales: F(h)+, F(h)-

Différences dispersives: F(h)λ1, F(h)λ2

fj = f’(λ) + if”(λ)

Construction et affinement du modèle

• Détermination de la structurecristalline: calcul d’une carte dedensité électronique

)]i(exp[-2 )(exp(|)F(| V1 )(

cell∑=h

h.rhhr πiφρ


• Détermination de la structurecristalline: calcul d’une carte dedensité électronique

)]i(exp[-2 )(exp(|)F(| V1 )(

cell∑=h

h.rhhr πiφρ


Carte de densité électronique initiale ρ(r)

Fo, αc0 → ρ1 (r)


Modèle initial (coordonnées atomiques)

Carte de densité électronique initiale ρ(r)

Fo, αc0 → ρ1 (r)

Affinement du modèle, calcul de nouvelles phases

F1, αc1 → ρ2 (r)

CRYST1 55.490 55.490 115.220 90.00 90.00 90.00 P 43 ATOM 1 O GLY A 14 22.936 17.256 42.286 1.00 38.76ATOM 2 N GLY A 14 24.991 16.909 40.481 1.00 41.17ATOM 3 CA GLY A 14 23.796 17.660 40.098 1.00 39.33ATOM 4 C GLY A 14 22.679 17.528 41.111 1.00 37.45ATOM 5 N VAL A 15 21.433 17.718 40.675 1.00 28.46ATOM 6 CA VAL A 15 20.261 17.642 41.555 1.00 24.14ATOM 7 C VAL A 15 19.320 16.530 41.094 1.00 26.85ATOM 8 O VAL A 15 18.962 16.479 39.915 1.00 25.35ATOM 9 CB VAL A 15 19.506 19.004 41.696 1.00 24.54ATOM 10 CG1 VAL A 15 18.372 18.906 42.716 1.00 22.66ATOM 11 CG2 VAL A 15 20.451 20.146 42.077 1.00 23.79

x y z

Facteur de Debye-Waller, Facteur B B(Å2) u(Å)50.0 0.8040.0 0.7130.0 0.6225.0 0.56

Construction et affinement du modèle• Affinement classique: 4 paramètres par atome (x, y, z, B)• Faible rapport: données (nombre de réflexions uniques) / paramètres à affiner

𝑓𝑓𝑗𝑗 = 𝑓𝑓𝑗𝑗0 𝑒𝑒𝑒𝑒𝑒𝑒 −𝐵𝐵𝑖𝑖𝑖𝑖𝑖𝑖𝑠𝑠𝑒𝑒𝑠𝑠𝜃𝜃

λ

2

; 𝐵𝐵𝑖𝑖𝑖𝑖𝑖𝑖 = 8𝜋𝜋2 𝑢𝑢2

Construction et affinement du modèle• Restrictions géométriques: paramètres stéréochimiques sont utilisés pour

augmenter le rapport données / paramètres à affiner• Fonctions de restriction: distance/angles de liaison, planarité, interactions non

covalantes, …

• Moindres carrés

• Maximum devraisemblance

Présentateur


Maximum de vraisemblance: les termes de la fonction sont décrits comme distributions de probabilités fonctions « cibles » ; Meilleur description des erreurs par les variances de la distribution


• Les facteurs B isotropes ne décrivent pas convenablement le modèle

• La description anisotrope introduit 6 paramètres par atome

• TLS (Translation/Libration/Screw) : la chaine polypeptidique est divisée ensegments; mouvement anisotrope des groupes d’atomes corrélés

• Introduction de 20 paramètres en plus par groupe dans l’affinement;amélioration significative de la qualité du modèle

Biso Baniso TLS


1.5 Å 2.8 Å

• La question de la résolution des données

Présentateur


The number of unique reflections in a dataset varies as the cube of the resolution - specifically, as 1/d3. This means there are 8 times more diffraction data points at 2Å than at 4Å. Apart from the sheer advantage of increased optical resolution, having 8x more points in your refinement alone will pretty much guarantee a much greater degree of accuracy in your structure.


1.5 Å 2.8 Å

• La question de la résolution des données niveau de détail de la carte nombre de réflexions uniques utilisées pour l’affinement

(8x plus de réflexions dans un jeu a 2 Å que dans un jeu à 4 Å)

Présentateur


The number of unique reflections in a dataset varies as the cube of the resolution - specifically, as 1/d3. This means there are 8 times more diffraction data points at 2Å than at 4Å. Apart from the sheer advantage of increased optical resolution, having 8x more points in your refinement alone will pretty much guarantee a much greater degree of accuracy in your structure.

• Paramètres géométriques et accordavec données expérimentales

• Minimisation du facteur résiduel

∑∑ −

=obs

calcobsfactor

FFF

R


Espace réel: ajustement dumodèle à la densité électronique

Carte de densité électronique ρ(r)

Fo, αc0 → ρ1 (r)

Espace réciproque: affinement des paramètres du modèle, calcul de nouvelles phases

∑∑ −

=obs

calcobsfree

FFF

R

• Géometrie des liaisons covalentes• Planarité• Angles dièdres• Interactions non covalentes• Ponts dissulfures

Diagramme de Ramachandran

Validation du modèle

Présentateur


In a polypeptide the main chain N-Calpha and Calpha-C bonds relatively are free to rotate. These rotations are represented by the torsion angles phi and psi, respectively.

Validation du modèle

Déposition des coordonées du modèle et facteurs de structureProtein Data Bank http://www.rcsb.org/pdb/home/home.do

http://www.rcsb.org/pdb/home/home.do

Human ASMT Structure

SAM

Hg

Pt N-term

C-term

ASMT SAM & NAS complex

Dimerization domain

SAM-dependantmethyltransferase

domain

SAM-NAS site (2)

H255D256

R252M303

NAS SAM

Methylation Mechanism?

ASMT Active Site & Homology

Human ASMT Variants

Variant D210G (Activity < 10%)

ASMT splice mutant: IVS5+2T→C

Cristaux de protéine

Diffraction des rayons X Détermination de la structure, modélisation, affinement

Analyse de la structure

La Bio-cristallographie

Documents

Cristallographie en Biologie - CGE-2016-Pariscge2016.impmc.upmc.fr/ppt/Shepard-BioCrystallography.pdf · 2016. 10. 21. · La Bio-cristallographie. versus. la cristallographie des