Upload
nguyenminh
View
221
Download
0
Embed Size (px)
Citation preview
1
Universitatea Politehnica Bucureşti
Facultatea de Automatică şi Calculatoare
Departamentul de Automatică şi Ingineria Sistemelor
LUCRARE DE DIPLOMӐ
Dinamica glicoproteinelor HIV
Absolvent: Conducător ştiinţific:
Ioana Ungureanu Prof. univ. dr. ing. Cătălin Buiu
Bucureşti 2013
2
Cuprins:
1.Introducere. Formularea problemei. .................................................................... 1
1.1 Generalităţi ........................................................................................................ 1
1.2 Prezentarea lucrării ........................................................................................... 2
2.Modelare şi simulare moleculară ......................................................................... 4
2.1 Generalităţi ........................................................................................................ 4
2.2 Mecanica cuantică şi mecanica moleculară ...................................................... 6
2.3 Modele bazate pe mecanica cuantică ............................................................... 7
2.3.1 Ecuaţia lui Schrödinger ............................................................................... 8
2.3.2. Aproximaţia Born- Oppenheimer ............................................................... 9
2.3.3 Aproximaţia Hartree – Fock ...................................................................... 10
2.4 Modele bazate pe mecanica moleculară ......................................................... 12
2.4.1 Ipoteza termodinamicii .............................................................................. 13
2.4.2 Aditivitatea ................................................................................................ 14
2.4.3 Transferabilitatea ...................................................................................... 15
2.5 Dinamica moleculară ....................................................................................... 15
2.5.1 Dinamica moleculară newtoniană ............................................................. 16
2.5.2 Fitări moleculare ....................................................................................... 18
3.Virusul HIV ........................................................................................................... 23
3.1 Noţiuni generale .............................................................................................. 23
3.2 Structura virusului ........................................................................................... 24
3.3 Ciclul de replicare a virusului .......................................................................... 25
4.Simulări de dinamică moleculară ....................................................................... 27
4.1 Scurtă prezentare a programelor folosite ........................................................ 27
4.2 Prezentarea structurilor necesare fitărilor ...................................................... 28
4.3 Fitare rigidă ..................................................................................................... 30
4.4 Fitare flexibilă .................................................................................................. 32
4.5 Dinamica folosind NAMD ................................................................................ 36
5.Concluzii ............................................................................................................... 48
Anexă ....................................................................................................................... 49
Bibliografie .............................................................................................................. 56
1
Capitolul 1
Introducere. Formularea problemei.
1.1 Generalităţi
Biologia este ştiinţa care se ocup ă cu studiul vieţii şi a organismelor vii. Acest
domeniu face referire la informaţii precum structura, funcţia, modalitatea de creştere
şi evoluţie a organismelor, distribuţia şi clasificarea lor. Toate subdisciplinile acestui
domeniu extrem de complex sunt unificate sub cinci axiome fundamentale: celulele
sunt unitaţile fundamentale ale vieţii, genele sunt unităţile fundamentale ale eredităţii,
speciile noi şi trăsăturile moştenite sunt produsul evoluţiei, un organism îşi reglează
mediul său intern pentru a se menţine în condiţii stabile şi, ultima, organismele vii
consumă şi transformă energie (Wikipedia 2010).
Subdisciplinile biologiei sunt definite în funcţie de scala la care sunt studiate
organismele, precum şi de metodele folosite în recunoaşterea şi urmărirea lor:
biochimia studiază chimia care stă la baza vieţii, biologia moleculară studiază
interacţiunile dintre molecule, biologia celulară studiază celula, fiziologia studiază
funcțiile mecanice, fizice și biochimice ale ţesuturilor şi ale organelor, ecologia
studiază felul în care organismele interacţionează în propriu lor mediu. În aceasta
lucrare sunt facute dese referiri la biologia moleculară şi de aceea este esenţial să
înţelegem cu se ocupă mai exact această branşă a biologiei. Mai precis, biologia
moleculară presupune înţelegerea interacţiunii dintre diferite sisteme componente ale
celulei, precum interacţiunea dintre diferite tipuri de ADN, ARN sau biosinteza
proteinelor.
Bioinformatica este o disciplină complexă, reprezentată prin cercetări din
biologia moleculară, genomică, proteomică, farmacologie, medicină. Cum cantitatea
de informaţie ce trebuie procesată şi prelucrată este foarte mare, a fost necesară
crearea unor baze de date biologice şi a unor programe ce implementează software
algoritmii necesari, precum şi metode de modelare matematică (Pavel, Vasile, and
Buiu 2011).
Studiul bioinformaticii şi a biologiei computaţionale include arii de dezvoltare
precum metode computaţionale pentru studiul organizării şi evoluţiei genelor şi a
genomului, metode tehnologice de abordare a structurii şi dinamicii moleculare,
metode de genomica comparativă evolutivă, şi metode de analiză şi predicţie a
structurilor.
2
1.2 Prezentarea lucrării
Această lucrare are ca temă prezentarea dinamicii glicoproteinelor aflate la
învelişul virusului HIV (Human Immunodeficiency Virus) şi anume glicoproteinele
gp120 şi gp41. Este importantă înţelegerea structurală şi funcţională a virsului pentru
a găsi metode de tratament şi poate chiar de eliminare a acestuia. Pentru aceasta
este nevoie de nişte cunoştinţe de bază în diverse domenii, în special în biologie,
domeniu prezentat pe larg anterior, chimie moleculară, fizică , programare etc.
Lucrarea este alcatuită din şapte părţi, ce vor fi prezentate pe scurt în cele ce
urmează.
În capitolul curent, „ Introducere. Formularea problemei”, au fost prezentate
informaţii generale, de bază, cu privire la domeniul de studiu, informaţii pe care orice
individ, indiferent dacă aprofundează sau nu acest domeniu, trebuie să le reţină.
Al doilea capitol al lucrării, şi anume „ Modelarea şi simularea moleculară”, va
prezenta diverse metode de modelare moleculară. Modelarea oferă o modalitate de
a explora caracteristicile structurale, dinamice, sau termodinamice, de a testa şi
dezvolta ipoteze, de a interpreta şi extinde datele experimentale şi, nu în ultimul
rând, de a înţelege legile care stau la baza structurii, flexibilităţii şi funcţiei
moleculare. Aici vom aprofunda noţiuni despre mecanica cuantică, mecanica
moleculară, aflând atât avantajele, cât şi dezavantajele folosirii lor. De asemenea
sunt prezentate noţiunile de bază din dinamica moleculară. O partea importantă a
acesteia este metoda MDFF. Metodele hibride computaţionale folosite pentru a
combina atât date structurale din surse diferite, cât şi rezoluţii, devin o parte esenţială
a biologiei structurale pe măsură ce acest domeniu evoluează spre studierea
ansamblurilor moleculare de dimensiuni mari. Astfel s-a dezvoltat o metodă numită
MDFF ce combină stucturile atomice de rezoluţie mare cu hărţile de microscopie crio-
electronică(crio-EM). Metoda presupune o simulare moleculară dinamică ȋn care un
potenţial bazat pe harta crio-EM este adăugat câmpului de forţe standard. Forţele
externe proporţionale cu gradientul hărţii de densitate se adaugă ȋntr-o simulare
dinamică a structurii atomice.
În al treilea capitol al lucrării, adică „Virusul HIV”, este prezentat pe larg, cu
trimiteri la literatura de specialitate, virusul HIV. Este menţionată structura,
componentele principale şi, apoi, analizate cele două glicoproteine, gp120 şi gp41,
responsabile cu transmiterea virusului în celulele sistemului imunitar. Virusul
imunodeficienţei umane de tip 1 (HIV-1) infecteaza milioane de oameni din toată
lumea, cauzând boala letala SIDA (Sindromul Imunodeficienței Dobândite). Conform
raportului unui program dezvoltat de Naţiunile Unite (UNAIDS), s-a estimat ca la
sfarşitul anului 2008 un numar de 33.4 milioane de oameni sunt infectaţi cu virusul
HIV. Din aceştia, 2.1 milioane sunt copii cu varsta sub 15 ani. De asemenea trebuie
menţionat ca ȋn 2008 s-au sesizat 2 milioane de decese datorate bolii SIDA (UNAIDS
2008) .
3
Ȋn al patrulea capitol, „Simulări de dinamică moleculară” sunt prezentate
simulări de dinamică moleculară aplicate pe gp120 şi gp41 şi rezultatele obţinute. Cu
ajutorul programului software VDM şi a codurilor ajutătoare NAMD şi Situs am
realizat partea practică. Am realizat două tipuri de fitări, fitarea rigidă şi cea flexibilă,
utilizând pachetul Situs şi o dinamică moleculară, folosind NAMD.
Al cincilea capitol „Concluzii” prezintă, pe scurt toată esenţa lucrării. Vor fi
reamintite definiţiile cele mai importante, ce stau la baza înţelegerii conceptului. După
aceasta scurtă, dar totuşi extrem de importantă revizie, vor fi prezentate toate
rezultatele finale, într-o manieră uşor de înţeles.
A şasea secţiune este pentru anexă. Am selectat, dintr-un număr mare, câteva
structuri de proteine. Unele dintre acestea au fost folosite la partea practică şi de
aceea câteva informaţii ȋn plus despre ele sunt utile.
Ultima secţiune, şi anume „Bibliografia” cuprinde toate referinţele care au fost
folosite ȋn redactarea acestei lucrări. Acestea pot fi cărţi ȋn format electronic, articole
online, sau chiar site-uri. Toate aceste documente au avut un rol extrem de
important, atât în realizarea părţii teoretice, cât şi în cea practică, oferindu-mi
cunoştinţele necesare pentru a realiza acest proiect.
4
Capitolul 2
Modelare şi simulare moleculară
2.1 Generalităţi
Modelarea moleculară a sistemelor de către calculatoare a luat amploare ȋn
ultimii ani. Tot mai mulţi oameni de ştiinţă, din diverse domenii de studiu, ȋşi arată
interesul faţă de această disciplină. Modelarea biologică a polimerilor precum
proteinele, acizii nucleici şi lipidele, este un domeniu complex, multidisciplinar:
biologii descriu cadru celular, chimiştii adaugă detaliile atomice şi moleculare,
fizicienii extind aceste viziuni la nivel electonic şi evidenţiază forţele care acţionează
asupra corpurilor, matematicienii analizează şi formulează algoritmi şi metode
numerice specifice pentru fiecare problemă ȋn parte, iar programatorii şi inginerii au
un rol extrem de important ȋn implementarea programelor de mari dimensiuni, astfel
ȋncât acestea să ruleze la viteze mari şi pe platforme extinse. Ȋn modelarea biologică,
o interpretare interdisciplinară este importantă nu numai datorită faptului că sunt
implicate mai multe aspecte, ci şi pentru că cea mai bună abordare tehnologică
porneşte mereu de la problema biologică. De asemenea conexiunile dintre teorie şi
partea practică, experimentală, sunt esenţiale: modelele computaţionale evoluează
pe măsură ce datele experimentale devin disponibile, iar teoriile biologice şi noile
experimente sunt bazate pe observaţiile tehnologice obţinute de la calculatoare.
Modelarea moleculară este ştiinţa care se ocupă cu studiul structurilor şi a
funcţiilor moleculare prin construirea unui model ce se bazează pe date reale, şi
implementarea lui tehnologică. Construirea unui model poate fi extrem de simplă,
precum realizarea şabloanelor de plastic sau a tijelor metalice, sau complexă,
precum sculpturile de lemn realizate prin intermediul laserului. Calculele sunt
realizate cu ajutorul mecanicii cuantice, mecanicii moleculare, dinamicii moleculare,
Monte Carlo, metodei de solvatare, SAR (structure/activity relationship), informaţiilor
şi bazelor de date chimice şi biologice. De asemenea, o componentă a modelării
biomoleculare este rafinarea datelor experimentale, primite de la NMR (Nuclear
Magnetic Resonance) sau cristalografia cu razele X.
Deşi modelele sunt o reprezentare simplistă a mediului celular, studiile
sistematice asupra lor pot ajuta la descoperirea de şabloane, modele şi perspective,
care altfel ar fi greu de observat. Ȋn modelare, principala ţintă este dezvoltarea şi
aplicarea modelelor corespunzătoare cu situaţia reală pe care o analizăm. Prin
urmare, aplicabilitatea acestora trebuie sa fie clar definită şi puterea de predicţie clar
demonstrată.
5
Ȋn ultimii ani, simularea moleculară dinamică a biomoleculelor a cunoscut o
dezvoltare explozivă şi a fost aplicată pe o gamă largă de probleme. Astfel s-au
evidenţiat două aspecte ce au un rol esenţial ȋn simulare:
Simulările asigură mişcarea particulelor individuale ca funcţie de timp astfel
ȋncât să se poată răspunde la ȋntrebări despre proprietăţile unui sistem mai uşor
decât prin efectuarea experimentelor;
Deşi potenţialul utilizat ȋn simulări este aproximat, el se află sub controlul
utilizatorului, astfel ȋncât eliminând sau modificând diferite date, să se poată
determina efectul lor asupra proprietăţilor examinate.
Ȋn studiul biologiei moleculare există trei tipuri de aplicaţii a metodelor de
simulare bazate pe dinamica moleculară. Prima utilizează simularea ca o metodă de
eşantionare a spaţiului de configurare. Aceasta este folosită pentru a determina sau
a ȋmbunataţi structurile obţinute cu date experimentale, precum difracţia cu razele X.
A doua utilizează simulările pentru a determina mediile de echilibru, inclusiv
proprietăţile structurale sau termodinamica sistemului. Pentru asemenea aplicaţii
este necesar ca simulările să eşantioneze corect spaţiul de configurare, precum ȋn
prima aplicaţie, cu condiţia suplimentară ca fiecare punct să fie ponderat cu factorul
Boltzmann corespunzător. A treia este folosită pentru a examina dinamica propriu-
zisă. Aici, pe lângă faptul că trebuie să eşantionam spaţiul de configurare cu
ponderea Boltzmann potrivită, mai trebuie ca aceasta să fie făcută astfel ȋncât
dezvoltarea temporală a sistemului să fie reprezentată ȋn mod corespunzător. Pentru
primele două metode, poate fi folosită atât simularea Monte Carlo, cât şi dinamica
moleculară. Ȋn schimb, la a treia aplicaţie, în care este extrem de importantă
mişcarea şi dezvoltarea ei, numai dinamica moleculară poate oferi informaţiile
necesare. Avantajul folosirii dinamicii moleculare ȋn locul metodei Monte Carlo este
acela că oferă o cale către proprietaţile dinamice ale sistemului: coeficienţii de
transport, răspunsurile temporale la perturbaţii, proprietăţile reologice
(interdependența între solicitările mecanice, răspunsul corpurilor și proprietățile
acestora) (Becker et al. 2001).
Simularea computerizată acţionează ca o legătură ȋntre partea microscopică şi
scalele de timp şi lumea macroscopică din laborator: avem presupuneri a
interacţiunilor dintre molecule şi obţinem o predicţie cat mai exactă a proprietăţilor.
Când ne referim la exactitatea predicţiilor ne referim la faptul că acurateţea lor este
limitată de restricţiile pe care le avem. După cum spuneam şi la ȋnceputul capitolului,
simularea se comportă ca şi o legătură ȋntre teorie şi experiment. Putem să testăm o
teorie prin simularea aceluiaşi model, putem testa modelul comparându-l cu
rezultatele experimentale, putem, de asemenea, să desfaşurăm pe calculator
experimente care sunt dificil sau imposibil de realizat ȋn laborator.
Ȋn cele din urmă, vrem sa facem comparaţii cu măsurările experimentale
realizate pe anumite materiale şi de aceea un model cât mai precis a interacţiunilor
moleculare este esenţial. Scopul moleculării dinamice este acela de a aduce
procesul de presupunere la minim.
6
Figura 2.1 – Simularea ca o legătură între microscopic şi macroscopic
Figura 2.2 – Simularea ca o legătură între teorie şi experiment (Allen 2004)
2.2 Mecanica cuantică şi mecanica moleculară
Pentru a calcula structura moleculară şi caracteristicile energetice ale
diferitelor elemente s-a dezvoltat un număr mare de proceduri şi modele, fiecare
axându-se pe diferite proprietăţi, şi fiecare având avantajele şi dezavantajele sale.
Acestea sunt grupate ȋn două categorii principale: modele bazate pe mecanica
cuantică şi modele bazate pe mecanica moleculară.
Modelele bazate pe mecanca cuantică au la bază ecuaţia lui Schrödinger .
Acest tip de abordare tratează moleculele ca o colecţie de nuclee şi electroni, fară să
ia ȋn consideraţie legăturile chimice. Soluţia ecuaţiei lui Schrödinger este exprimată
ȋn termeni de mişcare a electronilor, ceea ce conduce, ȋn final, la informaţii despre
7
structura moleculară, caracteristicile energetice sau chiar despre legăturile chimice.
Cu toate acestea, trebuie realizate nişte aproximaţii, ȋntrucât ecuaţia lui Schrödinger
nu poate fi rezolvată decât pentru un sistem de un electron (atomul de hidrogen).
Al doilea tip de model menţionat, este cel bazat pe mecanica moleculară. Spre
deosebire de cel bazat pe mecanica cuantică, care porneşte de la o ecuaţie, acesta
porneşte de la o privire de ansamblu asupra structurii moleculare. Moleculele nu mai
sunt văzute ca o colecţie de nuclee şi electroni, ci ca fiind alcătuite din atomi şi
legături. Poziţia atomilor este modificată astfel ȋncât să se potrivească cu o structură
de date deja cunoscută (lungimea legăturii şi unghiuri), precum şi ca să cuprindă
interacţiunile fară legătură.
Un avantaj al mecanicii moleculare este acela că e mai simplu de folosit,
ȋntrucât nu e nevoie să se rezolve ecuaţia lui Schrödinger pentru electronii ȋn
mişcare, dar totuşi e nevoie de o descriere amanunţită a legăturilor chimice precum
şi a informaţiilor precise despre structura moleculară.
Ȋn figura de mai jos putem observa cum o parte din sistem (regiunea de
reacţie) este tratată prin metode cuantice, pe când solventul ȋnconjurător şi sistemul
rămas este tratat ȋn mod clasic:
Figura 2.3 Conceptul QM/MM (Sirovich, Kohn, and Krishnaprasad 2010)
2.3 Modele bazate pe mecanica cuantică
Mecanica cuantică descrie moleculele ȋn termeni de interacţiuni ȋntre nuclee şi
electroni şi geometria moleculară ȋn termeni de aranjamente de energie minimă a
nucleelor.
Dacă ar fi posibilă rezolvarea ecuaţiei Schrödinger pentru un sistem format
din mai mulţi electroni, proprietăţile moleculare rezultate ar reproduce ȋntr-un mod cât
8
mai fidel cantităţile obţinute ȋn mod experimental. Totuşi, cum soluţia ecuaţiei este
aproximată, proprietăţile moleculare rezultate nu se mai identifică cu rezultatele
obţinute experimental. Diferite aproximaţii ale ecuaţiei vor duce la rezultate diferite.
Putem presupune că, cu cât aproximările modelului teoretic (ecuaţia Schrödinger)
sunt ȋn număr mai mic, rezultatele experimentale sunt mai aproape de realitate.
Când ne referim la găsirea unui model teoretic, căutăm de fapt un set de
aproximaţii pentru ecuaţia Schrödinger. Un asemenea model trebuie să respecte un
număr de condiţii (Hehre 2003):
Modelul trebuie să producă energie, dându-se doar tipul şi poziţia nucleelor,
numărul total de electroni şi numărul de electroni neȋmperecheaţi
Modelul nu trebuie să apeleze la „intuiţia chimică”
Amplitudinea erorii energiei calculate ar trebui să crească proporţional cu
dimensiunea moleculară, adică sa fie „ size consistent”
Ȋntre energia modelului şi energia Schrödinger ar trebui să existe o legătură
Modelul trebuie să se aplice atât pe probleme simple, cât şi pe probleme
reale, complexe
2.3.1 Ecuaţia lui Schrödinger
Ecuaţia Schrödinger este următoarea:
[
] ( ) ( )
Unde: E= energia electronică ȋn unităţi atomice, = unda care descrie
mişcarea electronilor, dependentă de coordonatele electronului, r=distanţa faţa de
nucleu, Z=sarcina electrică.
Astfel, termenii din paranteză reprezintă energia cinetică şi potenţială a unui
electron aflat la distanţa r faţă de un nucleu cu sarcină Z.
Pătratul funcţiei de undă ȋnmulţit cu un volum exprimă probabilitatea de a găsi
electronul ȋn volumul respectiv. Acesta este denumit densitatea totală de electroni şi
corespunde cu densitatea de electroni masurată ȋn experimentul de difracţie a
razelor X. Valorile mari indică poziţia atomilor, valorile medii accentuează legăturile,
iar valorile mici oferă informaţii despre forma şi dimensiunea moleculei. Un exemplu
a densităţii electronilor este reprezentată ȋn figura următoare (Wikipedia 2010):
(2.1)
9
Figura 2.4 – Densitatea de electroni calculată pentru anilină
Pentru un sistem multi-nuclear, multi-electron, ecuaţia Schrödinger va fi
generalizată conform ecuaţiei de mai jos:
Unde este o funcţie de undă multi-electron, iar reprezintă operatorul
Hamiltonian, care, ȋn unităţi atomice este dat de formula:
∑
∑
∑ ∑
∑ ∑
∑ ∑
Unde Z este sarcina nucleară, MA este masa nucleului A raportată la masa
unui electron, RAB este distanţa dintre nucleele A şi B, rij este distanţa dintre electronii
i şi j cu i<j, iar riA este distanţa dintre electronul i şi nucleul A.
2.3.2. Aproximaţia Born- Oppenheimer
Pentru a simplifica ecuaţia Schrödinger pentru sistemele moleculare şi ȋntrucât
viteza mişcării nucleelor este mică ȋn comparaţie cu viteza la care electronii se
deplasează, şi anume viteza luminii, putem presupune că nucleele nu se mişcă.
Această ipoteză se numeşte aproximaţia Born – Oppenheimer:
(2.2)
(2.3)
10
sau
∑
∑ ∑
∑ ∑
Cum viteza nucleelor am presupus-o nulă, termenii care descriu energia
cinetică nucleară dispar ȋn ecuaţia 2.5, iar potenţialul Coulomb este constant şi folosit
pentru a afla energia totală a sistemului (E).
∑ ∑
2.3.3 Aproximaţia Hartree – Fock
Ecuaţia Schrödinger electronică (2.5), rezultată ȋn urma aproximaţiei Born –
Oppenheimer, este ȋn continuare dificil de rezolvat. O noua aproximaţie menită să
simplifice calculul este aceea prin care subliniem că electronii se mişcă independent
unii de ceilalţi. Ȋn realitate, ȋnsă, electronii individuali sunt limitaţi la orbitalii moleculari,
aceştia fiind determinaţi presupunând că electronul se deplasează cu un câmp mediu
al celorlalţi electroni.
Funcţia de undă, , se va scrie cu ajutorul unui determinant, numit
determinantul Slater. Acesta este antisimetric la schimbul coordonatelor electronice.
√ |
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
|
Unde se referă la un orbital centrifug şi e produsul dintre o funcţie spaţială
sau orbitalul molecular şi o funcţie de rotaţie α sau β. Din faptul că există două
funcţii de rotaţie, putem trage concluzia că maxim doi electroni pot ocupa un orbital
molecular. Dacă ar mai exista un al treilea electron, două randuri diferite din
determinant ar fi identice, deci valoarea lui ar fi zero.
Setul de orbitali moleculari care conduc la cea mai mică energie este obţinut
printr-un proces numit SFC (self-consistent-field). Pe lângă procedura Hartree-Fock,
metoda SFC mai include proceduri funcţionale de densitate. Din procedurile SFC
rezultă ecuaţii de forma:
( ) ( ) ( )
Din ecuaţia de mai sus (2.8) rezultă că forma operatorului Fock va fi de forma:
(2.6)
(2.4)
(2.5)
(2.7)
(2.8)
11
( )
( )
Unde xi sunt coordonatele unghiulare şi spaţiale ale electronului i,
reprezintă orbitalii de rotaţie, iar este potenţialul efectiv al electonului i, care
depinde de orbitalii celorlalţi electroni.
Aproximaţia LCAO (Linear Combination of Atomic Orbitals)
Ȋn urma aplicării aproximaţiei Hartree – Fock se obţine un set de ecuaţii
diferenţiale, fiecare incluzând coordonatele unui electron. Pentru a o transforma intr-
un set de ecuaţii algebrice, vom introduce o aproximaţie ȋn plus.
Ȋn practică, orbitalii moleculari sunt exprimaţi sub formă de combinaţii liniare
ale unui set finit de funcţii prescrise ca funcţii de bază.
Ecuaţia aproximării LCAO este scrisă sub forma:
∑
Unde c reprezintă coeficienţii orbitalului molecular (necunoscuţi) şi orbitalii
atomici (sunt situaţi ȋn poziţii nucleare).
Ecuaţiile Roothaan – Hall
Dacă aplicăm ecuaţiile Schrödinger electronice asupra aproximaţiilor Hartree –
Fock şi LCAO, vom obţine ecuaţiile Roothaan – Hall:
Unde reprezintă energiile orbitale, S este matricea de suprapunere
(ȋntretăiere), F este matricea Fock şi este analoagă cu Hamiltonianul din ecuaţia
Schrödinger, iar elementele ei sunt date de formula:
Hnucleu este nucleul Hamiltonian, iar elementele lui sunt date de formula:
∫ ( ) [
∑
]
Elementele Coulomb şi de schimb sunt date de formulele:
∑ ∑ ( )
(2.10)
(2.11)
(2.9)
(2.14)
(2.13)
(2.12)
12
∑ ∑ ( )
Unde P este matricea de densitate:
∑
Produsul dintre un element al matricii de densitate şi orbitalii atomici asociaţi,
ȋnsumaţi pe toţi orbitalii, duce la calculul densitaţii electronilor despre care am vorbit
in capitolul 2.3.1.
(μν | λσ) este o integrală dublă:
( ) ∫∫ ( ) ( ) [
] ( ) ( )
Modelele Hartree – Fock sunt bine-definite şi au proprietăţi unice. Sunt „size -
consistent”, adică eroarea totală este proporţională cu dimensiunea moleculară, şi
variaţionale, adică energia calculată reprezintă o limită superioară a energiei obţinute
experimental. Nu numai energiile şi funcţiile de undă pot fi analizate prin metode
analitice, ci şi prima şi a doua derivată. Astfel, optimizarea geometrică, ce foloseşte
prima derivată, şi determinarea frecvenţelor vibraţionale, ce foloseşte a doua
derivată, sunt mult mai uşor de determinat.
2.4 Modele bazate pe mecanica moleculară
După cum am exemplificat şi ȋn subcapitolul 2.1, o abordare alternativă este
mecanica moleculară, la care se mai face referinţa şi sub denumirea de câmpuri de
forţă sau metoda energiei potenţiale. Funcţia ţintă ȋn mecanica moleculară poate fi
luată ca aproximaţia Born-Oppenheimer a energiei potenţiale ȋn ceea ce priveşte
nucleele (Ep(X), unde X este vectorul de poziţie pentru nuclee), iar electronii vor fi
variabile implicite ale potenţialului. O deosebire esenţială faţa de mecanica cuantică,
este faptul că această funcţie de potenţial trebuie evaluată empiric.
Mecanica moleculară descrie moleculele ca fiind atomi cu legături, care au
fost distorsionate de la o geometrie specifică datorită interacţiunilor fară legături van
der Waals şi Coulomb. Succesul modelelor moleculare depinde de gradul de
transferabilitate a parametrilor geometrici de la o moleculă la alta, precum şi de
dependenţa predictibilă a parametrilor de hibridizare atomică. O moleculă este
considerată un sistem mecanic ȋn care particulele sunt conectate prin arce, şi unde
forţele fizice au un rol important ȋn structura şi dinamica lor. Ca răspuns la aceste
forţe, moleculele se ȋntind, se leagă sau se rotesc ȋn jurul acestor legături.
(2.15)
(2.17)
(2.16)
13
Figura 2.5. Cele patru tipuri de interacţiuni (University of Massachusetts Lowell
2008)
Principiul de bază este acela că forţele fizice cumulative pot fi folosite să
descrie geometriile şi energiile moleculare. Structura spaţială obţinută ȋn final este
este o reglare a geometriei astfel ȋncât să minimizeze energia internă totală.
Din punct de vedere practic mecanica moleculară implică construcţia unei
energii potenţiale, ȋn funcţie de poziţiile atomice, plecând de la un număr mare de
date moleculare. Contribuţiile entropice sunt neglijate sau aproximate prin diferite
tehnici ȋn funcţie de care din aceste variante este mai utilă. Minimizarea acestei
funcţii poate fi folosită pentru a calcula zonele favorabile din spaţiul de configuraţie
multi-dimensional, iar simularea dinamică moleculară poate explica stările termice
accesibile ale sistemului.
Pentru ca folosirea dinamicii moleculare să aibă efectele dorite, trebuie să se
respecte trei principii: ipoteza termodinamicii, aditivitatea energiei potenţiale şi
transferabilitatea potenţialelor. Acestea vor fi detaliate mai pe larg ȋn subcapitolele
care urmează.
2.4.1 Ipoteza termodinamicii
Ipoteza termodinamicii presupune că majoritatea macromoleculelor sunt
conduse la structura lor naturală, cu intervenţie minimă, sau chiar deloc a
catalizatorilor, asta datorită termodinamicii. Aceasta este ȋn contradicţie cu procesele
care au nevoie de interacţiunea enzimelor pentru a micşora barierele de activare. O
stare unică este codată ȋn secvenţa proteinei, deoarece interacţiunile ȋn reţea din
lanţurile polipeptidice heterogene ghidează proteina spre o conformaţie nativă, care e
o structură de energie minimă. Plierea spontană a unei proteine nu se bazează pe
nici un ajutor extern, ci işi urmează secvenţa de instrucţiuni internă. Structura
14
naturală a proteinei este, ȋn general, stabilă la mutaţii, ceea ce duce la cresterea
energiei lor native.
2.4.2 Aditivitatea
Principiul mecanic al aditivităţii presupune că energia moleculară poate fi
exprimată ca o sumă de potenţiale derivate din forţe fizice precum van der Waals,
electrostatice, mecanice. Aceste forţe pot fi separate ȋn termeni locali si ne-locali.
Termenii locali:
( ) ∑ ( ) ∑ ( ) ∑ ( )
Unde Eleg, Edir, Etor sunt potenţialele de legătură, potenţiale de unghiuri de
legătură, respectiv diedrice, iar suma se extinde peste setul de legături bi, unghiurile
de legătură i şi unghiurile diedriece i.
Figura 2.6 Molecula ca sistem mecanic (Sirovich, Kohn, and Krishnaprasad
2010)
Termenii ne-locali:
Termenii ne-locali se pot scrie sub forma:
- ( ) ∑ ( )
(2.19)
(2.18)
15
Unde funcţiile sunt de obicei raţionale, iar energiile se compun de obicei din
contribuţii van der Waals şi Coulomb ȋntre perechile de atomi legate.
Aceasta separare dinte termenii locali şi cei ne-locali poate fi folosită ȋn
construirea algoritmilor care folosesc structuri de funcţii pentru a accelera
convergenţa. Pe lângă aceasta, separarea este baza protocoalelor „multi-step”
pentru dinamica moleculară ce ȋmbunatăţesc forţele locale şi ne-locale la diferite
frecvenţe. Ea este necesară ȋntrucât termenii locali se schimbă rapid, pe când cei ne-
locali se schimbă mai lent.
2.4.3 Transferabilitatea
Principiul transferabilităţii presupune că potenţialele pot fi dezvoltate pentru a
cuprinde toate datele experimentale pentru structurile reprezentative, apoi pot fi
aplicate pentru a prezice moleculele compuse din acelaşi subgrup chimic. Aceasta
poate fi realizată ȋntrucât distanţele de legătură şi unghiurile de legătură tind să aibă
valori similare pentru diferite tipuri de molecule ȋn condiţii normale. Totuşi ȋn condiţii
speciale, când asupra lor acţionează diferite forţe, aceste valori tind să ia valori
medii. Modelarea structurilor şi proprietăţilor sistemelor complexe sau conjugate, este
dificil de realizat şi avem nevoie de calcule precum cele din mecanica cuantică
pentru a obţine lungimile legăturilor şi constantele de ȋntindere. Pentru moleculele de
dimensiuni mici, dependenţa de mediu a direcţiei geometrice poate fi modelată mai
uşor de o funcţie decât de o constantă.
2.5 Dinamica moleculară
Este important de reţinut faptul că modelarea moleculară este folosită pentru a
dezvolta un câmp de forţe, precum o funcţie de potenţial, care mai apoi este utilizată
pentru Monte Carlo, dinamica moleculară, calcule de minimizare sau dinamica
Langevin. Exemple de metode, ȋmpreună cu avantajele şi dezavantajele lor sunt
subliniate ȋn tabelul de mai jos (Sirovich, Kohn, and Krishnaprasad 2010).
Metoda Avantaje Dezavantaje
Dinamica moleculară(MD)
Mişcare continuă, legătură experimentală ȋntre structuri şi date cinetice macroscopice
Scump, durată de timp scurtă
Dinamica moleculară fixă(TMD)
Conexiune ȋntre două stări, elimină ciocnirile şi sugerează bariere
Nu e necesar fizic
Solvatarea continuă Potenţialul mediu al forţei aproximează mediul şi reduce costul modelului
Aproximată
16
Are informaţii importante despre atmosfera ionică şi asociaţiile intermoleculare
Dinamica Browniană(BD)
Mişcare de durată lungă şi pe scală largă
Hidrodinamică aproximată, sisteme limitate cu inerţie
mică
Monte Carlo(MC) Eşantionare pe scală largă; statistici folositoare
Definiţiile de mişcare sunt dificile, căi nefizice
Minimizarea Informaţii valoroase, constrângerile experimentale pot fi incorporate
Nu are informaţii dinamice
Tabel 2.1 Avantajele şi dezavantajele metodelor de simulare
Simularea moleculară dinamică asigură metodologia pentru modelarea
microscopică la scară atomică. Aceasta este o tehnică pentru studiul evoluţiei ȋn timp
a sistemelor ce permit predicţia proprietăţilor statice sau dinamice direct din
interacţiunea dintre molecule. Folosim această simulare pentru a determina
proprietăţile structurale, dinamice şi termodinamice, prin rezolvarea ecuaţiilor de
mişcare. Dinamica moleculară oferă informaţii despre dependenţa de timp şi
amplitudinea fluctuaţiilor atât pentru poziţie cât şi pentru viteză, ȋn timp ce metoda
Monte Carlo oferă informaţii numai despre poziţie, iar datele despre dependenţa de
timp sunt puţine.
Ecuaţia de mişcare poate fi rezolvată, ȋn funcţie de precizia de care avem
nevoie, fie cu ecuaţiile de mişcare ale lui Newton, fie cu ecuaţia stocastică de
mişcare a lui Langevin, fie cu ecuaţia browniană de mişcare, sau chiar cu o
combinaţie ȋntre mecanica clasică şi cea cuantică.
Un sistem clasic este descris de Hamiltonianul H, care este o funcţie de
coordonatele r şi impulsul p. Pentru sistemele normale, unde energia potenţială este
independentă de timp şi velocitate, Hamiltonianul este reprezentat de energia totală.
( ) ( ) ( ) ∑
( )
Unde K(p) este energia de cinetică, U(r) este energia potenţială, pi este
impulsul particulei i, m este masa.
2.5.1 Dinamica moleculară newtoniană
Caracterul temporal al moleculeler este cel mai bine descris de ecuaţiile de
mişcare formulate de mecanica cuantică, precum ecuaţia Schrödinger dependentă
de timp. Ȋnsă această ecuaţie este greu de rezolvat pentru sisteme de dimensiuni
(2.20)
17
mari şi de aceea o descriere mecanică este folosită pentru aproximarea mişcarii
executate de atomi. Vom folosi mecanica clasică newtoniană.
Ecuaţia de mişcare a lui Newton are forma:
Unde Fi este forţa ce acţionează asupra particulei i, mi este masa acesteia, ai
este acceleraţia, derivata de ordin doi a poziţiei r ȋn timp.
Forţa Fi este determinată de gradientul funcţiei de energie potenţială U(r)
( )
Apelând la Hamiltonian, ecuaţia clasică de mişcare este scrisă ca o pereche
de ecuaţii diferienţiale de ordinul 1:
( )
( )
Ȋnlocuind aici definiţia lui H vom obţine definiţia impulsului
Astfel, având două ecuaţii diferenţiale de ordinul 1, sistemul este mai uşor de
rezolvat decât având o singură ecuaţie de ordinul 2.
Proprietăţile ecuaţiei de mişcare a lui Newton
Conservarea energiei
Presupunem că energia potenţială U şi hamiltonianul H nu depind ȋntr-un mod
explicit de timp sau viteză, deci
. De aici rezultă faptul că derivata totală
, deci avem conservare de energie
Conservarea impulsului liniar şi unghiular
Dacă potenţialul U nu depinde decât de separarea particulei şi nu este aplicat
nici un câmp interior, atunci ecuaţia de mişcare conservă impulsul total liniar (P) şi
impulsul unghiular total (L):
∑
∑
∑
(2.25)
(2.22)
(2.21)
(2.23)
(2.24)
18
Reversibilitatea temporală
A treia proprietate exprimă faptul că ecuaţia lui Newton este reversibilă ȋn
timp. Schimbând semnul tuturor vitezelor sau impulsurilor molecula ȋşi va reconstitui
traiectoria.
2.5.2 Fitări moleculare
Domeniul biologiei structurale evoluează rapid, trecând de la studiul
proteinelor la cel al ansamblurilor moleculare de dimensiuni mari, formate din mai
multe componente ce lucrează ȋmpreună. Principala tehnică de determinare a
structurii folosită ȋn scopul studierii ansamblurilor macromoleculare este microscopia
crio-electronică(crio-EM). Ȋn unele cazuri, această tehică este singura modalitate de
obţinere a informaţiilor structurale. Dezavantajul este, că ȋn urma folosirii ei, vom
obţine reconstrucţii de rezoluţie mică a sistemelor macromoleculare, ȋn condiţiile ȋn
care sunt disponibile structuri de rezoluţie mare a componentelor individuale.
Metodele computaţionale pentru fitarea structurilor atomice ȋn hărţile crio-EM
reduc decalajul rezoluţiei dintre crio-EM şi cristalografia cu razele X (X-ray),
permiţând astfel interpretarea datelor crio-EM cu rezoluţie mai bună. Unele structuri
obţinute cu metodele de fitare sunt singurele surse ale modelelor atomice ale
ansamblurilor macromoleculare. Pentru hărţile EM cu rezoluţie mică, locaţia
proteinelor ȋntr-un complex poate fi dedusă din forma lor globală comparată cu
densitatea, fie ȋntr-un mod vizual, fie prin tăierea sistematică a corpului. Ȋn ultimul caz
are loc o căutare ȋn şase dimensiuni (trei grade de libertate de translaţie şi trei de
rotaţie) pentru a găsi cea mai bună poziţie şi orientare a unei molecule date ȋn
densitate.
Metoda MDFF
Metoda MDFF este o extensie a tehnicii de simulare dinamică
moleculară(MD), ȋn care fiecare atom este reprezentat de o particulă, ce are o
anumită masă şi sarcină. Interacţiunea dintre fiecare pereche de atomi este descrisă
de câmpul de forţe sau de energia potenţială UMD. Poziţia şi viteza fiecărui atom se
propagă ȋn timp conform mecanicii clasice, obţinându-se astfel o descriere dinamică
a sistemului.
.
19
Figura 2.7Exemplu de aplicare a MDFF (L. G. Trabuco et al. 2009)
Date necesare pentru simularea MDFF
Pentru a realiza o simulare MDFF avem nevoie de două tipuri de date de
intrare: o hartă crio-EM a complexului studiat şi modelele atomice a componentelor
ce vor fi integrate ȋn hartă. Modelele atomice iniţiale pot fi obţinute prin diferite tehnici
precum cristalografia cu raze X sau spectrografia NMR (Nuclear Magnetic
Resonance). Este important ca datele să fie corecte, deoarece orice eroare conţinută
ȋn aceste modele iniţiale poate să afecteze modelele atomice obţinute. De asemenea
orice eroare ȋn datele crio-EM datorată opticii, eşantionării, impreciziei numerice,
numărului mic de particule va fi inclusă ȋn funcţia energiei potenţiale.
Conversia hărţii de densitate crio-EM ȋn potenţial
MDFF se bazează pe metoda dinamicii moleculare, extinzând termenul UMD
prin doi termeni adiţionali. Primul termen ia ȋn consideraţie informaţiile experimentale.
Harta crio-EM este transformată ȋntr-o funcţie de energie potenţială UEM, ce conduce
atomii ȋn densitatea crio-EM, ȋn timp ce potenţialul MD (UMD) păstrează parametrii
fizici corecţi ai modelului. Al doilea termen (USS) menţine integritatea structurii
secundare a proteinei sau acizilor nucleici:
Datele obţinute din reconstrucţia crio-EM reprezintă potenţialul Coulomb a
macromoleculei. Când structura atomică este plasată ȋn harta de densitate, atomii
sunt deplasaţi din zonele cu densitate mică ȋn zonele cu densitate mare prin
aplicarea unor forţe. Energia potenţială a hărţii este:
(2.26)
20
( ) ∑ ( )
Unde { [
( )
] ( )
( )
Aici ( ) este potenţialul Coulomb dezvăluit de crio-EM, este
valoarea maximă a tuturor voxelilor (cea mai mică entitate ȋn care poate fi
descompus volumul) din harta EM, este un factor arbitrar de scalare, o
valoare limită folosită pentru a neglija datele ce nu corespund moleculei, cum ar fi
densitatea solventului, este o pondere ce poate fi variată ȋn funcţie de tipul de
atom plasat ȋn acest potenţial, iar rj este poziţia atomului j.
Valoarea limită este aleasă ȋn funcţie de histograma de densitate a hărţii
EM, care are două vârfuri de densităţi diferite. Primul, şi cel mai mare, corespunde
densităţii solventului, ȋn timp ce al doilea, mai larg, corespunde densităţii proteinei şi
acizilor nucleici (G. L. Trabuco et al. 2008).
Figura 2.8Exemplu de histogramă de densitate
Forţa aplicată asupra unui atom ȋn interiorul potenţialului este definită de
ecuaţia următoare:
( )
( )
(2.27)
(2.28)
(2.29)
21
Ecuaţia exprimă faptul că forţa aplicată pe fiecare atom i depinde numai de
gradientul potenţialului obţinut din densitatea hărţii EM la poziţia ri, deci fitarea ȋn
MDFF are loc local.
Pentru a păstra calitatea stereochimică a structurii şi pentru a preveni supra-
fitarea ȋn MDFF, sunt aplicate restricţii armonice asupra unui set de coordonate
interne, relevante pentru structura secundară a macromoleculei ȋn forma iniţială. Vom
avea, astfel, un termen nou Uss care introduce restricţiile armonice funcţiei de energie
potenţială.
∑ ( )
Unde reprezintă coordonata internă cu restricţie, este valoarea
instantanee a acestei coordonate, este valoarea de echilibru şi este luată din
structura atomică iniţială, iar este constanta de elasticitate.
Protocolul de fitare flexibilă
Pentru o obţine o fitare cât mai optimă trebuie sa se gasească o balanţa ȋntre
cei trei termeni UMD, UEM,USS. Pentru primul termen, parametrii sunt daţi de alegerea
unui câmp de forţe standard, iar ceilalţi doi termeni conţin parametrii ce pot fi reglaţi:
forţe mari din harta EM (UEM) şi restricţii mici a structurii secundare (Uss) pot conduce
la o fitare mai bună, dar pot de asemena conduce la distorsiuni ȋn structura
macromoleculară.
Pentru potenţialul UEM , parametrii care pot varia sunt factorul de scalare şi
ponderile . Ponderile sunt stabilite pentru masele atomice, ȋn timp ce determină
domeniul de măsurare a forţelor aplicate pe atomi. Gradientul potenţialului este
calculat ȋnainte de alegerea parametrului . Valori mari ale acestuia poate duce la
acceleraţii mari a atomilor provocând instabilitatea simulării.
Pentru termenul Uss trebuie să alegem constanta de elasticitate . Valorile
tipice pentru acestea sunt kμ = 200 kcalmol-1 rad-2 sau kμ=200kcalmol-1Å-2 ȋn cazul
distanţelor ARN.
MDFF poate fi efectuat ȋn paşi multipli, variind parametrii la fiecare pas. Ȋn
acest caz mai pot fi variaţi şi alţi parametri:
Temperatura poate fi ajustată pentru a permite sistemului să
depăşească barierele energetice, explorând o porţiune mai mare a
spaţiului ȋn mai puţin timp.
Filtrarea trece-jos a hărţii ȋn primul pas poate fi folosită pentru a evita
blocarea ȋntr-un minim local, pentru ca apoi să se folosească harta
originală.
Restricţiile armonice puternice pot fi aplicate asupra structurii
secundare ȋntr-un pas, pentru ca ȋntr-un pas următor acestea să scadă.
(2.30)
22
La orice moment de timp, orice porţiune din structură poate fi fixată sau
limitată la poziţia curentă.
Densitatea corespunzătoare unei părţi din structură poate fi stearsă.
Harta nouă este caracterizată de parametrul , folosit mai apoi pentru
calculul UEM folosind formulele (3.2) şi (3.2).
(
( ))
Unde este harta EM originală, iar este harta simulată, cu o valoare
maximă a voxelului ( ) (L. G. Trabuco et al. 2008).
Analiza rezultatelor MDFF
Convergenţa unei simulări MDFF (sau a unui pas ȋntr-un protocol multi-step)
poate fi evaluată prin monitorizarea ȋn timp a erorii pătratice medii (RMSD – Root
Mean Square Deviation) a structurii originale, sau a coeficientului de corelaţie
ȋncrucişată (CCC – Cross-Correlation Coefficient) dintre structura atomică şi harta de
densitate crio-EM originală.
⟨( ⟨ ⟩) ⟩ ⁄
Unde ri reprezintă vectorul coordonatelor atomului i, iar mediile sunt luate
dintr-un set de atomi din structura atomică
Pentru a calcula CCC-ul dintre structură atomică şi o hartă crio-EM, ȋntâi se
generează din structura atomică, o hartă simulată. Aceasta se realizează prin
interpolarea numerelor atomice a tuturor atomilor pe reţeaua 3D, şi apoi prin
aplicarea unui filtru trece-jos. Rezoluţia dorită a hărţii simulate este determinată de
lăţimea (2σ) a filtrului Gaussian. După ce harta simulată a fost creată cu rezoluţia
potrivită, CCC este calculat conform formulei:
⟨( ⟨ ⟩)( ⟨ ⟩)⟩
Unde ⟨S⟩ şi ⟨E⟩ sunt valorile medii a voxelilor din hărţile simulate şi originale,
iar σS şi σE sunt deviaţiile standard corespunzătoare. ia valori cuprinse ȋn intervalul
[-1;1] (L. G. Trabuco et al. 2009).
MDFF este cea mai potrivită metodă pentru studiul anasmblurilor
macromoleculare. De când a fost implementat ȋn NAMD, un software de dinamică
moleculară, poate fi folosit pentru fitarea sistemelor de dimensiuni mari, ȋn ȋntregimea
lor, ȋn aceeaşi simulare. Structura şi analiza simulărilor MDFF sunt realizate cu
plugin-ul „mdff” din cadrul VDM, ȋn timp ce simularea rulează folosind NAMD.
(2.31)
(2.32)
(3.33)
23
Capitolul 3
Virusul HIV
Un virus reprezintă un agent infecţios, ce se poate replica numai ȋn interiorul
celulelor vii din cadrul unui organism. Acesta poate să infecteze toate tipurile de
organisme, de la animale şi plante, la bacterii.
Particulele virale, numite şi virioni sunt alcătuite din două sau trei părţi:
Materialul genetic, alcătuit din ADN (acid dezoxiribonucleic) sau ARN
(acid ribonucleic)
Un ȋnveliş proteic ce protejează aceste gene
O anvelopă de lipide ce ȋnconjoară ȋnvelişul proteic când acesta se află
ȋn exteriorul celulei
Conformaţia viruşilor poate varia de la forme simple, elicoidale, la structuri mai
complexe. Un virus mediu are o dimensiune de o sută de ori mai mică decât cea a
unei bacterii. Cei mai mulţi viruşi sunt prea mici pentru a fi văzuţi direct cu un
microscop optic (Wikipedia 2009).
3.1 Noţiuni generale
Virusul HIV (Human Immunodeficiency Virus) este un lentivirus (virus ce se
poate replica lent ȋn celula gazdă ) ce cauzează SIDA (Sindromul Imunodeficienței
Dobândite), o boală ce duce ȋntr-un final la cedarea sistemului imunitar.
Virusul infectează celule vitale din sistemul imunitar, precum limfocitele T-
helper (celule Th), ȋn mod specific celulele CD4 (Cluster of Differentiation 4), celulele
macrofage sau celulele dendritice. Infecţia cu HIV conduce la un nivel scăzut de
celule CD4+T prin mai multe mecanisme precum: apoptoza celulelor neinfectate,
uciderea virală a celulelor infectate, şi uciderea celulelor CD4+T infectate. Când
numărul celulelor CD4+T scade sub un anumit nivel, numit nivel critic, imunitatea
celulară mediată este pierdută, iar corpul devine mai susceptibil la unele infecţii.
Există două tipuri de HIV: HIV-1 şi HIV-2. O descriere generală a celor două
se găseşte ȋn tabelul de mai jos (Wikipedia 2006):
24
Specie Virulenţă Infectivitate Prevalenţă Originea
HIV-1 Ridicată Ridicată Globală Cimpanzeul
comun
HIV-2 Scăzută Scazută Africa de Vest Sooty
Mangabey
Tabelul 3.1 Descrierea tipurilor de viruşi HIV
3.2 Structura virusului
Virsusul are o formă sferică, cu un diametru de 120nm. Fiecare virus conţine
două lanţuri de ARN. Pentru replicare, virusul are nevoie de o celulă gazdă, iar ARN-
ul trebuie să fie mai ȋntâi transcris ȋn ADN, ceea ce se realizează cu ajutorul unei
enzime (Reverse Transcriptase).
Figura 3.1 Structura virusului HIV
Virusul este alcătuit dintr-o anvelopă virală, o matrice de proteine şi un nucleu
viral. Anvelopa, ȋnvelişul exterior a virusului, este formată din două straturi de lipide.
Mai multe proteine sunt incluse ȋn anvelopă, formând „ace”: glicoproteina gp120 şi
transmembrana gp41. Gp120 este folosită pentru ataşarea de celula gazdă, iar gp41
este necesară ȋn procesul de fuziune. Matricea de proteine, alcătuită din proteinele
p17 este situată ȋntre anvelopă şi nucleu. Nucleul conţine o capsulă proteică, formată
din proteinele p24, ce ȋnconjoară cele două catene de ARN şi enzimele necesare
25
pentru replicare. Din cele nouă gene, menţionăm trei, numite gag, pol şi env, ce
conţin informaţiile necesare pentru creerea proteinelor structurale ale noilor particule
virale.
3.3 Ciclul de replicare a virusului
Virusul HIV are nevoie de o celulă gazdă pentru a supravieţui şi a se replica.
Pentru a se replica, virusul crează particule virale ȋn interiorul unei celule gazde, şi
aceste particule transportă virusul la celulele noi. Odată ce virusul intră ȋn corp,
acesta se ȋndreaptă spre ţesutul limfatic, unde găseşte celulele T-helper. Paşii ȋn
care virusul infectează sistemul imunitar şi se replică sunt următorii (Ferguson et al.
2002):
1. Legarea. Virusul se ataşează de celulele imunitare, iar glicoproteina gp120 se
leagă de proteinele CD4 a celulelor T-helper. Nucleul viral intră ȋn celula
gazdă şi membrana proteică a virionului fuzionează cu membrana celulei.
2. Transcripţia inversă. Enzima virală reverse transcriptase transformă ARN-ul
virusului ȋn ADN.
3. Integrarea. ADN-ul nou creat este transportat ȋn nucleul celulei de enzima
viral integrase şi fuzionează cu ADN-ul celulei. ADN-ul virusul HIV se numeşte
provirus.
4. Transcripţia. ADN-ul viral din nucleu se separă şi crează ARN
mesager(mARN) folosind propriile enzime ale celulei. ARN-ul mesager conţine
instrucţiuni pentru a crea noi proteine virale.
5. Translaţia. ARN-ul mesager este transportat ȋnapoi ȋn nucleu. Virusul
foloseşte apoi mecanismele de creare a proteinelor pentru a crea lanţuri de
proteine şi enzime virale.
6. Asamblarea. ARN-ul şi enzimele virale se adună la marginea celulei. O
enzimă numită protease desparte polipeptidele ȋn proteine virale.
7. Creerea. O nouă particulă HIV ne naşte din membrana celulei şi scapă cu o
bucată de membrană care o ȋnconjoară.
26
Figura 3.2 Ciclul de replicare a virusului
27
Capitolul 4
Simulări de dinamică moleculară
4.1 Scurtă prezentare a programelor folosite
VMD
VMD(Visual Molecular Dynamic) este un program de modelare şi vizualizare
moleculară dezvoltat de Universitatea Illinois. VMD a fost creat ca un instrument de
vizualizare şi analiză a simulărilor moleculare dinamice, dar conţine şi instrumente
pentru lucrul cu datele volumetrice, secvenţele de date şi obiectele grafice. De
asemenea, VMD are integrat şi translatori Python şi Tcl. Am folosit consola Tcl/Tc
pentru a comunica cu alte programe precum NAMD, program ce este prezentat ȋn
cele ce urmează.
NAMD
Programul NAMD(Not (just) Another Molecular Dynamics) este un pachet de
simulare moleculară dinamică ce foloseşte modelul de programare paralelă
Charm++. Programul este recunoscut pentru eficacitatea paralelă şi e folosit pentru a
simula sisteme de dimensiuni mari, de ordinul milioanelor de atomi. NAMD poate fi
conectat cu un program de grafică moleculară prin sistemul de comunicaţie, pentru a
furniza un instrument de modelare interactivă ȋn scopul vizualizării şi modificării unei
simulării aflate ȋn rulare. Programul a fost rulat prin intermediul Command Prompt
(cmd.exe).
Situs
Situs este un pachet modular de programe pentru modelarea „multi-scale” a
structurilor de rezoluţie atomică şi a datelor biofizice de rezoluţie mică obţinute ȋn
urma microscopiei electronice, tomografiei sau dispersiei sub unghi mic a razelor X.
Se poate realiza atât andocare rigidă, cât şi flexibilă, folosind o varietate de strategii
de fitare. Pentru a funcţiona şi pe Windows, pachetul de programe se rulează prin
intermediul Cygwin.
Chimera
Chimera este un program extensibil pentru vizualizarea şi analiza structurilor
moleculare şi a altor date, precum hărţi de densitate, ansambluri supramoleculare,
aliniere de secvenţe sau rezultatele andocărilor.
28
4.2 Prezentarea structurilor necesare fitărilor
După cum am prezentat şi ȋn subcapitolul 2.5.2, pentru a realiza o fitare
flexibilă avem nevoie de două tipuri de date de intrare: o hartă crio-EM şi o structură
atomică ce urmează să fie integrată ȋn hartă.
Structura 3DNO şi harta 5020
3DNO prezintă structura moleculară a trimerului gp120, aflat la ȋnvelişul
virusului HIV, ȋn starea de legare cu CD4. Structura a fost descoperită folosind
microscopia electronică la rezoluţia de 20.0 Å (PDBe 2008). Ansamblul constă ȋn
nouă molecule, iar structura sa vizualizată ȋn Chimera este reprezentată ȋn figura
următoare:
Figura 4.1 Reprezentarea structurii 3dno ȋn Chimera
Datele experimentale pe care structura se bazează au fost depozitate separat,
ȋn EMDB (Electron Microscopy Data Bank) ca intrarea 5020.
Ȋntucât nu e nevoie de toată harta, ci doar de o regiune a ei pentru a realiza
fitarea, am despărţit-o ȋn regiuni, şi am ales una din ele. Harta cuprindea patru
regiuni (39, 40, 41 şi 40). Pentru a realiza acest lucru, mai ȋntai am deschis harta ȋn
Chimera, după care am segmentat-o, pentru ca regiunile să poată fi vizualizate mai
uşor. Ȋn figura de mai jos este reprezentată harta 5020 ȋn Chimera:
29
Figura 4.2 Reprezentarea hărţii de densitate ȋn Chimera
După cum am mai zis, harta este ȋmpărţită ȋn patru regiuni: 39 colorată ȋn gri,
40 colorată ȋn verde, 41 colorată ȋn mov şi 42 colorată ȋn albastru. Am separat fiecare
regiune şi am ales să lucrez mai departe cu 42.
Figura 4.3 Regiunea 42
Structura 1GC1
Ȋn structura 1GC1 este reprezentat nucleul gp120 combinat cu CD4 şi cu un
anticorp uman de neutralizare. Această structură a fost determinată folosind difracţia
cu razele X la o rezoluţie de 2.5 Å . Mai multe detalii cu privire atât la această
structură, cât şi la altele se găsesc ȋn anexă.
30
Figura 4.4 Structura 1GC1 vizualizată ȋn Chimera
Aceasta structură este cea care va fi fitată ȋn harta de densitate 5020.
4.3 Fitare rigidă
De-a lungul timpului s-au dezvoltat câteva protocoale pentru a fita structurile
atomice, obţinute prin intermediul cristalografiei cu razele X sau prin NMR, ȋn hărţile
de densitate cu rezoluţie mică sau medie. Problema computaţională constă ȋn
determinarea celor şase grade de libertate, trei de rotaţie şi trei de translaţie.
Optimizarea CCC-ului consumă cantităţi semnificative din timpul de calcul. Pentru a
reduce acest timp se foloseşte FFT (Fast Fourier Transformation), ce accelerează
căutarea translaţională şi este implementat ȋn programul „Colores” din pachetul Situs.
Astfel doar cele trei grade de rotaţie sunt căutate ȋn spaţiul real, ȋn timp ce gradele
de translaţie sunt căutate ȋn spaţiul Fourier.
Primul pas a fost să transform harta regiunii 42 din format „mrc” ȋn format
situs. Acest lucru a fost realizat ȋntrucât programele folosite lucrează cu acest tip de
format. Ȋn cadrul liniei de comandă din cygwin am tastat:
./map2map molmap42.mrc molmap42.situs
Fitarea rigidă a fost realizată prin intermediul intrumentului „colores”. Tot ȋn
cygwin am tastat:
./colores molmap42.situs 1gc1.pdb -res 20.0
„Colores” constă ȋn trei paşi separaţi: o căutare rigidă ȋntru-un cadru 6D
discret, o detectare automată a vârfurilor, bazată pe scorurile corelate din cadru
31
(detecţie ce returnează un set de soluţii) şi o rafinare a soluţiilor apropiate de scorul
maxim de corelare. Astfel s-au generat, pe lângă altele, fişierele col_best001,
col_best002, col_best003 ce conţin coordonatele atomice a celei mai bune fitări
găsite ȋn cadrul căutării, ȋn format PDB.
Rezultatul vizualizat ȋn VMD este următorul:
Figura 4.5 Fitare rigidă
Am vizualizat ȋn Chimera, pe rând, harta ȋn format situs ȋmpreună cu cele trei
fişiere generate.
molmap42.situs ȋmpreuna cu col_best001
Figura 4.6 Varianta 1 de fitare
32
molmap42.situs ȋmpreuna cu col_best002
Figura 4.7 Varianta 2 de fitare
molmap42.situs ȋmpreuna cu col_best003
Figura 4.8 Varianta 3 de fitare
Se observă că cea mai bună fitare rigidă este cea din varianta 1.
4.4 Fitare flexibilă
Nu ȋntotdeauna fitarea rigidă este cea mai bună variantă. Când schimbări
conformaţionale ale componentelor au loc ȋn timpul formării complexului, fitarea
rigidă este neadecvată. Procedurile de fitare care permit schimbări conformationale
sunt fitările rigide, ce iau ȋn consideraţie un subset mai mic de de schimbări
33
conformaţionale. Pentru a realiza acest lucru, am folosit ȋn continuare pachetul de
programe Situs.
Ȋn partea anterioară am transformat harta din format „mrc” ȋn format „situs” şi
am generat mai multe posibilităţi de fitare, dintre care am ales una: „col_best001”. De
aceste fişiere avem nevoie şi pentru fitarea flexibilă.
Cuantizarea vectorială a structurii
Cuantizarea vectorială este o tehnică de cuantizare care permite modelarea
funcţiilor de densitate de probabilitate prin distribuţia vectorilor. Aceasta funcţionează
prin ȋmpărţirea unui set mare de puncte ȋn grupuri ce au aproximativ acelaşi număr
de puncte ȋn apropierea lor. Această metodă este utilă ȋn identificarea densităţii
datelor mari şi de rezoluţie mare.
Cuantizarea vectorială se realizează ȋn Situs prin intermediul funcţiei „qpdb”.
./qpdb col_best_001.pdb col_best_001.qpdb
Ca intrare vom avea fişierul generat ȋn fitarea rigidă şi ca ieşire un fişier ce
conţine vectorii de cuantizare. Această funcţie este interactivă, adică pe parcursul
execuţiei cere utilizatorului niste informaţii precum:
dacă să excludă atomii de apă
dacă să selecteze atomii bazaţi pe factorul B de prag
numărul vectorilor de cuantizare
dacă să se salveze anumite date ȋn fişier
Figura 4.9 Funcţia „qpdb”
Cuantizarea vectorială a hărţii
Pentru cuantizarea vectorială a hărţii vom utiliza funcţia „qvol”. Ca intrare vom
avea fişierul ȋn format „situs” ce conţine date despre hartă şi vectorii obţinuţi ȋn pasul
anterior cu funcţia „qpdb”.
./qvol molmap42.situs col_best_001.qpdb molmap42.qvol
Şi această funcţie este interactivă. Trebuie să oferim informaţii precum:
34
dacă vrem să verificăm valorile densităţilor
densitatea de tăiere
dacă vrem să optimizăm vectorii de intrare
dacă vrem să adăugăm constrângeri de distanţă
dacă vrem să salvăm anumite date
Figura 4.10 Funcţia „qvol”
Fitarea flexibilă folosind interpolarea
Fişierele generate ȋn paşii anteriori le folosim pentru a aproxima fitarea, prin
interpolare. Aceasta se realizează prin funcţia „qplasty” ce realizează o fitare flexibilă
aproximativă a datelor de rezoluţie atomică bazată pe un model de intrare a
deplasărilor destul de grosier.
./qplasty col_best_001.pdb col_best_001.qpdb molmap42.qvol final.pdb
Structura fitată a fost scrisă ȋn fişierul „final.pdb”.
Figura 4.11 Funcţia „qplasty”
35
Rezultatele fitării flexibile
Pentru a vedea rezultatele am folosit programul Chimera. Aici am deschis fişierul
rezultat „final.pdb” peste care am suprapus harta. Figurile următoare exprimă
rezultatul final pentru mai multe valori ale densitătii de tăiere:
Figura 4.12 Fitare flexibilă cu densitatea de tăiere 0
Figura 4.13 Fitare flexibilă cu densitatea de tăiere 1
36
Figura 4.14 Fitare flexibilă cu densitatea de tăiere 2.4
4.5 Dinamica folosind NAMD
Pentru a aprofunda mai bine dinamica moleculară şi a sublinia utilitatea
programului NAMD, am realizat o dinamică pe 1I5Y.pdb. Aceasta intrare conţine
structura glicoproteinei transmembranale gp41. Mai multe detalii despre această
structură se găseşte ȋn anexă. Pentru aceasta am folosit linia de comandă MS-DOS
din cadrul Windows-ului şi programul de vizualizare moleculară VMD.
Figura 4.15 Structua 1i5y vizualizată ȋn VMD
Pe lângă pdb-ul folosit, a fost necesară creerea unui fişier PSF (Protein
Structure File) ce conţine toate informaţiile referitoare la molecule, informaţii utile
pentru a aplica un câmp de forţe unui sistem molecular. Cum structurile obţinute prin
cristalografia cu razele X nu conţin atomii de hidrogen, a fost necesară creerea
acestui fişier ȋntrucât conţine nişte coordonate intuite pentru atomii de hidrogen ai
structurii. Operaţiile pentru generarea acestuia se pot realiza fie prin intermediul
VMD-ului, fie manual. Ȋn urma acestora s-au obţinut două fişiere, unul ȋn format pdb,
37
ce conţine coordonatele tuturor atomilor, inclusiv cei de hidrogen, şi cel ȋn format psf
ce conţine informaţia structurală a proteinei.
Figura 4.16 Creerea fişierului „psf” ȋn VMD
Solvatarea proteinei
Pentru a semăna mai mult cu un mediu celular, proteina trebuie sa fie
solvatată, adică introdusă ȋn apă. Aceasta se realizează ȋn două feluri, plasând
molecula ȋntr-o sferă de apă, ȋn pregătire pentru minimizare şi echilibrare fară condiţii
de limită, sau ȋntr-un cub de apă, ȋn pregătire pentru minimizare şi echilibrare cu
condiţii de limită.
Pentru a realiza acest lucru se rulează fişierul „wat_sphere.tcl”, ce va
introduce molecula ȋn sferă şi va genera două tipuri de fişiere, unul psf ce conţine
informaţii structurale şi unul pdb, ce conţine informaţii despre coordonate. De
asemenea se mai obţin informaţiile din tabelul de mai jos:
x y z
Centrul masei sferei
46.177093505859375 4.489715099334717 -2.5021438598632
Raza sferei 28.492280236344456
Tabelul 4.1 Coordonatele centrului de masă şi raza sferei
Structura obţinută este reprezentată ȋn figura de mai jos:
38
Figura 4.17 Molecula ȋntr-o sferă de apă
Pentru a creea cubul de apă, folosim ȋn VMD comanda de mai jos. Pachetul
„Solvate” va pune proteina ȋntr-un cub, folosind cele două fişiere generate când am
creat sfera de apă. Se vor crea două fişiere, unul de tip „psf” şi unul de tip „pdb”.
package require solvate solvate i5y.psf i5y.pdb -o i5y_wb
Figura 4.18 Molecula ȋntr-un cub de apă
Centrul cubului de apă se află din media aritmetică dintre minim şi maxim
pentru fiecare coordonată ȋn parte. Rezultatele sunt trecute ȋn tabelul de mai jos:
x y z
Minim 26.6140032 -10.58100032 -33.530998
Maxim 64.68699645 18.64900016 29.652999
Centru 45.6415824 3.982120513 -2.02047824
Tabelul 4.2 Minimul, maximul şi coordonatele centrului de masă
39
Simulare cu condiţii de limită non-periodice
Creerea unei sfere de apă nu este necesară, dar e utilă ȋntrucât minimizarea şi
echilibrarea din cadrul cubului de apă va duce la deformarea ȋn cea mai stabilă formă
posibilă, sfera. Astfel, creerea sferei la ȋnceputul simulării reduce cantitatea de timp
necesară pentru a ajunge la echilibru, şi reduce efortul computaţional.
După cum am precizat şi mai sus, trebuie sa efectuăm operaţiile de
minimizare şi echilibrare. Pentru a minimiza energia se caută ȋn cadrul energetic a
moleculei un minim local prin varierea poziţiilor atomilor şi calcularea energiei. Pentru
echilibrare folosim dinamica moleculară, unde, pentru fiecare atom din sistem este
rezolvată legea a doua a lui Newton. Aceste lucruri se realizează folosind NAMD prin
intermediul unui fişier denumit „i5y_ws_eq.conf”. Acesta cuprinde mai multe funcţii
explicate pe secţiuni:
Parametrii ini ţiali
Ca intrare vom avea fişierele obţinute atunci când am introdus molecula ȋn
sfera de apă, ȋn ambele formate. De asemenea vom crea şi o variabilă numită
„temperature” care va avea o valoare medie, 310K. Toate datele generate vor avea
denumirea „i5y_ws_eq” şi diferite extensii.
Parametrii de simulare
Primul pas este să specificăm faptul că fişierul parametru este ȋn formatul
folosit de câmpul de forţă CHARMM. Pasul al doilea este de a apela parametrii
câmpului de forţa din fişierul specificat, fişier ce poate fi folosit pentru toate
proteinele.
Funcţia „exclude” specifică care din interacţiunile atomice nu vor fi luate ȋn
considerare. Ȋn acest caz interacţiunile dintre atomii 1 şi 2, respectiv 1 şi 3 sunt
neglijate. Funcţia „1-4scaling” specifică cât de mult vom lua ȋn considerare
interacţiunea electrostatică dintre atomii 1 şi 4. Funcţia „cut-off” indică distanţa peste
care interacţiunile electrostatice şi van der Waals sunt desconectate. Funcţia
switching setată pe „on” indică faptul că se vor folosi funcţii de comutare pentru a
40
seta interacţiunile electrostatice şi van der Waals la valoarea 0 atunci când se atinge
valoarea de „cut-off”. Toate aceste valori sunt specificate de CHARMM.
Mai ȋntâi vom stabili valoarea pasului de timp utilizat ȋn simulare. Simulările de
dinamică moleculară rezolvă ecuaţiile legii lui Newton printr-o aproximare discretă
pentru a determina traiectoriile atomilor. Pasul de timp specifică cum vor fi
discretizate particulele dinamice. „RigidBonds” setat pe valoarea „all” specifică faptul
că toate legăturile vor fi considerate rigide. „NonbondedFreq” indică faptul că
interacţiunile fară legătură sunt calculate la fiecare pas, iar „FullElectFrequency” ne
spune cât de des vor fi calculate interacţiunile complet electrostatice.
Ȋn această secţiune stabilim faptul că vom folosi dinamica Langevin, şi vom
seta valoarea coeficientului de amortizare la o valoare minimă astfel ȋncât să avem o
dinamică bună iar temperatura să fie menţinută constantă la 310K. De asemnenea
mai precizăm faptul că dinamica Langevin nu va fi aplicată atomilor de hidrogen din
simulare.
Ȋn urma rulării se vor genera mai multe tipuri de fişiere. Ȋn primul rând vom
avea un „pdb” ce va conţine coordonatele finale ale tuturor atomilor din sistem şi tot
un „pdb” ce va conţine velocităţile finale a tuturor atomilor din sistem. De asemenea,
atât pentru coordonate cât şi pentru viteze se vor mai scrie două fişiere de restart la
fiecare 500 de paşi. „Dcdfreq” conţine numai coordonatele atomice, ce sunt scrise la
fiecare 250 de paşi, creând astfel traiectoria sistemului peste timpul de rulare.
”OutputEnergies” şi „OutputPressure” specifică numărul paşilor de timp ȋntre fiecare
ieşire a energiei, respectiv a presiunii.
41
Parametrii suplimentari
Ȋn această secţiune precizăm faptul că vom utiliza condiţiile de limită. Vom
introduce datele din tabelul 4.1. „SphericalBCk1” este o constantă aleasă arbitrar, iar
„sphericalBCexp1” ia, de obicei valoarea 2 ( potenţialul pătratic).
Scriptul de execuţie
Aici setăm numărul de iteraţii la care se variază poziţiile atomilor pentru a
căuta un minim local ȋn potenţial. Minimizarea este realizată după ce toate velocităţile
au fost setate la 0. Comanda „reintvels” resetează velocităţile astfel ȋncât sistemul să
ȋnceapă la temperatura 310. Comanda „run” specifică numărul de paşi pe care se
rulează echilibrarea dinamică.
Fişierul creat se va rula cu NAMD:
namd2 i5y_ws_eq.conf > i5y_ws_eq.log &
Unul dintre fişierele generate este „i5y_ws_eq.log”. Acesta conţine date
despre parametrii folosiţi ȋn rulare, informaţii despre sistem, informaţii despre
minimizare şi date despre echilibrare.
Figura 4.19 Date privitoare la minimizare ȋn cazul sferei de apă
42
Figura 4.20 Date privitoare la echilibrare ȋn cazul sferei de apă
Simulare cu condiţii de limită periodice
Folosirea condiţiilor de limită periodice presupune ȋnconjurarea sistemului cu
celule identice virtuale. Atomii din sistemul virtual interacţionează cu atomii din
sistemul real. Aceste condiţii de modelare sunt eficace ȋn eliminarea interacţiunilor de
suprafaţă a moleculelor de apă şi creerea unei reprezentări mai fidele decât ȋn cazul
sferei de apă.
Pentru a realiza această simulare, trebuie să se creeze un fişier de
configurare. Acesta, va avea, pe lângă câmpurile de mai sus, următoarele două
secţiuni ȋn cadrul parametrilor de simulare:
„CellBasisVector1”, „CellBasisVector2”, şi „CellBasisVector1” reprezintă
dimensiunile cubului şi se exprimă ca diferenţa, ȋn modul, dintre minim şi maxim
pentru fiecare dintre coordonatele x, y, z, iar ȋn „cellOrigin” sunt reprezentate
coordonatele centrului de masă (Tabelul 4.2) .
43
PME (Particle Mesh Ewald) este o metodă de a lucra cu interacţiunile
electrostatice atunci când sunt prezente condiţiile de limită periodice. Suma Ewald
este o metodă eficientă de a calcula forţele ȋntr-un sistem periodic. „PMEGridSize”
defineşte manual dimensiunea grilei. Trebuie să poată fi despărţit ȋn factori primi cât
mai mici (2, 3, 5) şi valoarea să fie cât mai aproape pe „cellBasisVector”. De exemplu
40=23*8 (aproape de 39); 32=25 (aproape de 30) şi 64=26 (aproape de 63.5).
„UseGroupPressure” este folosit atunci când se calculează presiunea
sistemului pe baza forţelor apărute ȋntre atomi şi energiile lor cinetice. Această
comandă stabileşte dacă interacţiunile cu privire la hidrogen se iau ȋn calcul pentru
toţi atomii de hidrogen sau doar ȋntre grupuri de atomi de hidrogen. Această valoare
este setată pe „yes” dacă „rigidBonds” este setată pe „on”. „LangevinPiston”
stabileşte dacă simularea va folosi un piston Langevin pentru a controla presiunea.
Dacă da, se stabileşte şi o valoare care să fie menţinută de piston (1bar). Constantei
de amortizare ȋi este atribuită valoarea prin „langevinPistonDecay”. Temperatura va
avea aceeaşi valoare cu cea iniţială.
4.21 Date privitoare la minimizare ȋn cazul cubului de apă
44
4.22 Date privitoare la echilibrare ȋn cazul cubului de apă
Proteina ȋn solvent implicit
Un model cu solvent implicit este o tehnică de simulare prin care se elimină
necesitatea atomilor de apă prin includerea efectelor solventului ȋn calcularea forţelor
inter-atomice. Deşi viteza de simulare ȋn acest caz este mai mare, precizia este mai
mică. GBIS (General Born Implicit Solvent) este o clasă particulară a modelelor cu
solvent implicit. Calculul acestei metode se realizează ȋn două părţi. Ȋn primul rând
este calculată raza Born pentru fiecare atom. Aceasta reprezintă gradul de expunere
a unui atom la solvent. Ȋn al doilea rând, atât pe baza separării atomice, cât şi pe
baza mediei geometrice dintre razele Born dintre doi atomi, sunt calculate forţele
electrostatice inter-atomice.
Vom crea ȋncă un fişier de configurare, care are ȋn plus faţă de câmpurile
despre care am discutat până acum, secţiunea pentru solvent implicit:
„Gbis” stabileşte dacă simularea foloseşte sau nu metoda GBIS. Implicit
aceasta are valoarea „off”, deci trebuie setată. „AlphaCutoff” setează cutoff-ul folosit
pentru a determina raza Born pentru fiecare atom. Aceasta trebuie sa aibă o valoare
mai mica decât valoarea „cutoff”. „IonConcentration” setează concentraţia ionilor
impliciţi.
45
Figura 4.23 Date privitoare la minimizare ȋn cazul GBIS
Figura 4.24 Date privitoare la echilibrare ȋn cazul GBIS
Root Square Deviation (RMSD)
Pentru a analiza ȋn ce măsură sistemul a fost echilibrat, se va folosi RMSD
(Root Mean Square Deviation), metodă prezentată ȋn capitolul 2.5.2. RMSD ne
spune cu cât o selecţie dată din moleculă deviază de la o poziţie definită ȋn spaţiu.
Sunt două metode de a calcula RMSD-ul: pentru ȋntreaga proteină şi pentru proteina
fără ultimile cinci reziduuri. Simularea pe care am realizat-o cu NAMD a generat un
fişier numit „i5y_ws_eq.dcd”. Acesta conţine o traiectorie a sistemului ce este folosită
ȋn calculul RMSD-ului proteinei.
Figura 4.25 Traiectoria proteinei
46
Ȋn continuare voi prezenta câteva grafice:
Figura 4.26 Dependenţa timp – temperatură
Figura 4.27 Dependenţa timp – energie
Temperatura şi energia ne ajută să observăm date despre stabilitatea
termodinamică a ȋntregului sistem. Pentru a vedea dacă ȋntreaga proteină este
stabilă, vom calcula RMSD. Graficele pentru aceasta sunt realizate ȋn Microsoft
Excel.
47
Figura 4.28 RMSD pentru ȋntreaga proteină
Ultimile cinci reziduuri sunt relativ instabile comparate cu restul proteinei. De
aceea calculăm un nou RMSD pentru proteină fară ultimile cinci reziduuri. Graficul
acestuia este prezentat ȋn figura următoare:
Figua 4.29 RMSD pentru proteina fară ultimile cinci reziduuri
48
Capitolul 5
Concluzii
Virusul HIV rămâne una din cele mai mari provocări ale sănătăţii publice, mai
ales ȋn ţările cu venit scăzut şi mediu. Acest virus infectează celulele sistemului
imunitar, şi duce la deteriorarea progresivă a acestuia. Astfel corpul nu mai are
abilitatea de a lupta contra infecţiilor sau a altor boli. SIDA este cea mai avansată
etapă din cadrul infecţiei cu virusul HIV şi este definită prin apariţia a 20 de infecţii
oportuniste sau cancer.
De-a lungul timpului mai mulţi oameni de ştiinţa au lucrat pentru găsirea unui
leac ȋmpotriva acestui virus. Totuşi ȋn momentul de faţă nu există o soluţie pentru
vindecarea definitivă a acestuia. Când ne referim la un tratament vorbim despre
terapii, precum HAART (High Active Antiretroviral Therapy), ce ȋncetineşte progresia
bolii sau tratamente active şi preventive a infecţiilor oportunistice.
Ȋn această lucrare am vrut să subliniez importanţa cunoaşterii acestui virus.
Pentru a avea cea mai mică şansă ȋn tratarea acestui virus, ȋn viitorul apropiat, este
necesar să cunoaştem modalitatea ȋn care funcţionează şi se multiplică. Astfel putem
realiza simulări şi observa detalii pe care nu le-am observa cu ochiul liber. Ȋnsă,
avem nevoie de cunoştiinţe din mai multe domenii, domenii ce sunt prezentate pe
scurt de-a lungul lucrării.
Cea mai importantă parte din procesul de infectare este formarea legăturii
dintre glicoproteina gp120, aflată la ȋnvelişul virusului şi receptorul CD4, aflat la
suprafaţa celulei gazdă. Tot acest mecanism a fost explicat pe larg ȋntr-un capitol
anterior deoarece avem nevoie de cât mai multe date pentru a putea realiza o
dinamică moleculară adecvată.
Ȋnţelegerea structurii şi variaţiei structurale a anvelopei virusului la cea mai
mare rezoluţie este una din cele mai mari ȋncercări ale biologiei structurale. De
asemenea joacă şi un rol important ȋn proiectarea unui vaccin pentru protejarea
ȋmpotriva virusului. Dezvoltările recente din acest domeniu ilustrează faptul că
integrarea informaţiilor obţinute din cristalografia cu razele X, spectrografia NMR,
microscopia crio-EM şi tomografie poate fi un instrument pentru a ȋnţelege structura
anvelopei şi mecanismul viral de intrare. Totuşi, deşi aceste metode sunt foarte utile,
ele sunt greu de manevrat pe structuri complexe. Modelarea computaţională
analizează necesitatea de a găsi modalităţi de a integra toate datele experimentale
ȋn modele structurale semnifictive. Ȋndeplinirea acestor scopuri cere, ȋnsă, avansări
tehnologice ȋn toate domeniile asociate.
49
Anexă
Cod PDB 1GC1
Nume moleculă HIV-1 gp120 core complexed with CD4 and a
neutralizing human antibody
Rezoluţie 2.5 Å
Data publicare 1998
Metoda X-ray
Publicată ȋn
Structure of an HIV gp120 envelope glycoprotein
in complex with the CD4 receptor and a
neutralizing human antibody.
Imagine
Harta de densitate simulată
50
Cod PDB 3DNO
Nume moleculă Complex of 3 biomacromolecules, namely HIV-
1 envelope glycoprotein gp120.
Rezoluţie 20.0 Å
Data publicare 2008
Metoda Electron microscopy
Publicată ȋn
Molecular architecture of native HIV-1 gp120
trimers.
Imagine
Harta de densitate simulată
51
Cod PDB 1I5Y
Nume moleculă Structure of transmembrane glycoprotein
(gp41)
Rezoluţie 2.1 Å
Data publicare 2001
Metoda X-ray
Publicată ȋn
Structural and functional analysis of
interhelical interactions in the human
immunodeficiency virus type 1 gp41 envelope
glycoprotein by alanine-scanning
Imagine
Harta de densitate simulată
52
Cod PDB 3CYO
Nume moleculă
Structure of a longer thermalstable core domain
of HIV-1 GP41 containing the enfuvirtide
resistance mutation N43D and complementary
mutation E137K
Rezoluţie 2.1 Å
Data publicare 2008
Metoda X-ray diffraction
Publicată ȋn
Impact of the enfuvirtide resistance mutation
N43D and the associated baseline polymorphism
E137K on peptide sensitivity and six-helix
bundle structure.
Imagine
Harta de densitate simulată
53
Cod PDB 3DNL
Nume moleculă Complex of 3 biomacromolecules, namely
HIV-1 envelope glycoprotein gp120.
Rezoluţie 20.0 Å
Data publicare 2008
Metoda Electron microscopy
Publicată ȋn Molecular architecture of native HIV-1
gp120 trimers.
Imagine
Harta de densitate simulată
54
Cod PDB 1ENV
Nume moleculă
Structure of HIV-1 envelope protein
Chimera consisting of a fragment of GCN4
zipper cloned n-terminal to two fragments
of gp41
Rezoluţie 2.6 Å
Data publicare 1997
Metoda X-ray diffraction
Publicată ȋn
Atomic structure of the ectodomain from
HIV-1 gp41.
Imagine
Harta de densitate simulată
55
Cod PDB 1I5X
Nume moleculă
HIV-1 gp41 core
Rezoluţie 1.8 Å
Data publicare 2001
Metoda X-ray diffraction
Publicată ȋn
Structural and functional analysis of
interhelical interactions in the human
immunodeficiency virus type 1 gp41
envelope glycoprotein by alanine-scanning
mutagenesis.
Imagine
Harta de densitate simulată
56
Bibliografie
Allen Michael P. 2004. Introduction to Molecular Dynamics Simulation. Computational Soft
Matter: From Synthetic Polymers to Proteins vol. 23; p. 1-28.
Becker Oren M., MacKerell Alexander D. Jr., Roux Benoit, and Wantanabe Masakatsu. 2001.
Computational Biochemistry and Biophysics. New York; p. 7-68.
Ferguson Monique R., Rojo Daniel R, Lindern Jana J., and O’Brien William. 2002. HIV-1
Replication Cycle. Clinics in Laboratory Medicine vol. 22; p. 42-51.
Hehre Warren J. 2003. A Guide to Molecular Mechanics and Quantum Chemical
Calculations. Irvine, California.
Pavel Ana Branduşa, Vasile Cristian, and Buiu Cătălin. 2011. Biomatematică şi
Bioinformatică. Concepte şi Aplicaţii. Bucureşti; p. 111-127.
PDBe. 2008. PDBeView - PDB Entry 3dno. http://www.ebi.ac.uk/pdbe-
srv/view/entry/3dno/summary.html, accesat la data 03.06.2013.
University of Massachusetts Lowell. 2008. Molecular Mechanics.
http://faculty.uml.edu/vbarsegov/teaching/bioinformatics/lectures/MolecularMechanics
Modified.pdf, accesat la data 10.06.2013.
Sirovich L., Kohn P. S., and Krishnaprasad R. V.. 2010. Interdisciplinary Applied
Mathematics. New York; p. 237-298.
Trabuco G. Leonardo, Villa Elizabeth, Mitra Kakoli, Frank Joachim, and Schulten Klaus.
2008. Flexible Fitting of Atomic Structures into Electron Microscopy Maps Using
Molecular Dynamics. Structure; p. 673-83.
Trabuco Leonardo G, Villa Elizabeth, Schreiner Eduard, Harrison Christopher B., and
Schulten Klaus. 2009. Molecular Dynamics Flexible Fitting: a Practical Guide to
Combine Cryo-electron Microscopy and X-ray Crystallography. Methods; p. 174-80.
UNAIDS. 2008. Know Your Epidemic (Epidemiology).
http://www.unaids.org/en/dataanalysis/knowyourepidemic/, accesat la data 10.06.2013.
Wikipedia. 2006. HIV - Wikipedia, the Free Encyclopedia. http://en.wikipedia.org/wiki/HIV,
accesat la data 10.06.2013.
———. 2007. Biology - Wikipedia, the Free Encyclopedia.
http://en.wikipedia.org/wiki/Biology, accesat la data 10.06.2013.
———. 2009. Virus - Wikipedia, the Free Encyclopedia. http://
http://en.wikipedia.org/wiki/Virus, accesat la data 10.06.2013.
57
———. 2010. Electron Density Aniline - Wikipedia, the Free Encyclopedia.
http://en.wikipedia.org/wiki/Electron_density, accesat la dat 19.06.2013.
Buzon Victor, Natrajan Ganesh, Schibli David, Campelo Felix, Kozlov Michael M., and
Weissenhorn Winfried. 2010. Crystal Structure of HIV-1 Gp41 Including Both Fusion
Peptide and Membrane Proximal External Regions. PLoS Pathogens.
Curtis B. M., Scharnowske S., and Watson J.. 1992. Sequence and Expression of a
Membrane-associated C-type Lectin That Exhibits CD4-independent Binding of Human
Immunodeficiency Virus Envelope Glycoprotein Gp120. Proceedings of the National
Academy of Sciences of the United States of America; p. 8356-60
Gadhe Changdev G., Kothandan Gugan, Madhavan Thirumurthy, and Cho Seung Joo. 2011.
Molecular Modeling Study of HIV-1 Gp120 Attachment Inhibitors. Medicinal Chemistry
Research vol 21.
Kwong P. D., Wyatt R., Robinson J., Sweet R. W., Sodroski J., and Hendrickson W. . 1998.
Structure of an HIV Gp120 Envelope Glycoprotein in Complex with the CD4 Receptor
and a Neutralizing Human Antibody. Nature vol 393; p. 648-59.
Chan Kwok-yan, and Trabuco Leonardo G. . 2013. Molecular Dynamics Flexible Fitting.
http://www.ks.uiuc.edu/Training/Tutorials/science/mdff/tutorial_mdff-html, accesat la
data 16.06.2013
Stone John. 2012. Using VMD. http://www.ks.uiuc.edu/Training/Tutorials/vmd/tutorial-
html/index.html, accesat la data 12.04.2013.
Phillips James, Villa Elizabeth, Yu Hang, Tanner David, and Liu Yanxin. 2012. Namd
Tutorial. http://www.ks.uiuc.edu/Training/Tutorials/namd/namd-tutorial-win-
html/index.html, accesat la data 02.06.2013.
Merk Alan, and Subramaniam Sriram. 2013. HIV-1 Envelope Glycoprotein Structure. Current
Opinion in Structural Biology vol 23; p. 1-9 .
Meyerson Joel R., Tran Erin E. H., Kuybeda Oleg, Chen Weizao, Dimitrov Dimiter S.,
Gorlani Andrea, Verrips Theo, Lifson Jeffrey D., and Subramaniam Sriram. 2012.
Molecular Structures of Trimeric HIV-1 Env in Complex with Small Antibody
Derivatives. Proceedings of the National Academy of Sciences of the United States of
America vol 110; p. 513-518
Neale G. 1990. B12 Binding Proteins. Gut 31
http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=1378341&tool=pmcentrez&r
endertype=abstract, accesat la data 14.06.2013.
Yokoyama Masaru, Naganawa Satoshi, Yoshimura Kazuhisa, Matsushita Shuzo, and Sato
Hironori. 2012. Structural Dynamics of HIV-1 Envelope Gp120 Outer Domain with V3
Loop. PloS One 7 vol 5.
Zhu Ping, Winkler Hanspeter, Chertova Elena, Taylor Kenneth , and Roux Kenneth H.. 2008.
Cryoelectron Tomography of HIV-1 Envelope Spikes: Further Evidence for Tripod-like
Legs. PLoS Pathogens vol 4.
58
Alam S Munir, Morelli Marco, Dennison S. Moses, Liao Hua-Xin, Zhang Ruijun, Xia Shi-
Mao, Rits-Volloch Sophia. 2009. Role of HIV Membrane in Neutralization by Two
Broadly Neutralizing Antibodies. Proceedings of the National Academy of Sciences of
the United States of America; p. 20234-9
Bai Xuefang, Wilson Karen L., Seedorff Jennifer E., Ahrens Douglas, Green Justin, Davison
Donna K., Jin Lei. 2008. Impact of the Enfuvirtide Resistance Mutation N43D and the
Associated Baseline Polymorphism E137K on Peptide Sensitivity and Six-Helix Bundle
Structure. Biochemistry; p. 6662–6670
Bartesaghi A., Sprechmann P., Liu J., Randall G., Sapiro G., and Subramaniam S.. 2008.
Classification and 3D Averaging with Missing Wedge Correction in Biological Electron
Tomography. Journal of Structural Biology ; p. 436-50
Bartesaghi Alberto, Lecumberry Federico, Sapiro Guillermo, and Subramaniam Sriram. 2012.
Protein Secondary Structure Determination by Constrained Single-particle Cryo-
electron Tomography. Structure; p. 2003-13
Blumenthal Robert, Durell Stewart, and Viard Mathias. 2012. HIV Entry and Envelope
Glycoprotein-mediated Fusion. The Journal of Biological Chemistry; p. 40814-9
Caffrey M., Cai M., Kaufman J., Stahl S. J., Wingfield P. T., Covell D. G., Gronenborn A.
M., and Clore G. M.. 1998. Three-dimensional Solution Structure of the 44 kDa
Ectodomain of SIV Gp41. The EMBO Journal; p. 4572-84
Cardoso Rosa F., Zwick Michael B., Stanfield Robyn L., Kunert Renate, Binley James M.,
Katinger Hermann, Burton Dennis R. and Wilson Ian A.. 2005. Broadly Neutralizing
anti-HIV Antibody 4E10 Recognizes a Helical Conformation of a Highly Conserved
Fusion-associated Motif in Gp41. Immunity vol 22; p. 163-73.
Chan David C., Fass Deborah, Berger James M., and Kim Peter S.. 1997. Core Structure of
Gp41 from the HIV Envelope Glycoprotein. Cell vol 89; p. 263-273.
Chen Lei, Kwon Young Do, Zhou Tongqing, Wu Xueling, O’Dell Sijy, Cavacini Lisa,
Hessell Ann J. . 2009. Structural Basis of Immune Evasion at the Site of CD4 Attachment
on HIV-1 Gp120. Science; p. 1123-7.
Choe H.. 1996. The Beta -Chemokine Receptors CCR3 and CCR5 Facilitate Infection by
Primary HIV-1 Isolates. Cell.
Chong Huihui, Yao Xue, Sun Jianping, Qiu Zonglin, Zhang Meng, Waltersperger Sandro,
Wang Meitian, Cui Sheng, and He Yuxian. 2012. The M-T Hook Structure Is Critical for
Design of HIV-1 Fusion Inhibitors. The Journal of Biological Chemistry; p. 850-6.
Deng H., Liu R., W. Ellmeier, Choe S., Unutmaz D., Burkhart M., Di Marzio P. . 1996.
Identification of a Major Co-receptor for Primary Isolates of HIV-1. Nature; p. 661-6.
Diskin Ron, Marcovecchio Paola M., and Bjorkman Pamela J.. 2010. Structure of a Clade C
HIV-1 Gp120 Bound to CD4 and CD4-induced Antibody Reveals anti-CD4
Polyreactivity. Nature Structural & Molecular Biology; p. 608-13.