LUCRARE DE DIPLOMӐ - ACSE Departmentacse.pub.ro/wp-content/uploads/2013/07/Licenta-Ungureanu-Ioana.pdf · 1.Introducere. Formularea problemei. ... farmacologie, medicină. Cum cantitatea

1

Universitatea Politehnica Bucureşti

Facultatea de Automatică şi Calculatoare

Departamentul de Automatică şi Ingineria Sistemelor

LUCRARE DE DIPLOMӐ

Dinamica glicoproteinelor HIV

Absolvent: Conducător ştiinţific:

Ioana Ungureanu Prof. univ. dr. ing. Cătălin Buiu

Bucureşti 2013

2

Cuprins:

1.Introducere. Formularea problemei. .................................................................... 1

1.1 Generalităţi ........................................................................................................ 1

1.2 Prezentarea lucrării ........................................................................................... 2

2.Modelare şi simulare moleculară ......................................................................... 4

2.1 Generalităţi ........................................................................................................ 4

2.2 Mecanica cuantică şi mecanica moleculară ...................................................... 6

2.3 Modele bazate pe mecanica cuantică ............................................................... 7

2.3.1 Ecuaţia lui Schrödinger ............................................................................... 8

2.3.2. Aproximaţia Born- Oppenheimer ............................................................... 9

2.3.3 Aproximaţia Hartree – Fock ...................................................................... 10

2.4 Modele bazate pe mecanica moleculară ......................................................... 12

2.4.1 Ipoteza termodinamicii .............................................................................. 13

2.4.2 Aditivitatea ................................................................................................ 14

2.4.3 Transferabilitatea ...................................................................................... 15

2.5 Dinamica moleculară ....................................................................................... 15

2.5.1 Dinamica moleculară newtoniană ............................................................. 16

2.5.2 Fitări moleculare ....................................................................................... 18

3.Virusul HIV ........................................................................................................... 23

3.1 Noţiuni generale .............................................................................................. 23

3.2 Structura virusului ........................................................................................... 24

3.3 Ciclul de replicare a virusului .......................................................................... 25

4.Simulări de dinamică moleculară ....................................................................... 27

4.1 Scurtă prezentare a programelor folosite ........................................................ 27

4.2 Prezentarea structurilor necesare fitărilor ...................................................... 28

4.3 Fitare rigidă ..................................................................................................... 30

4.4 Fitare flexibilă .................................................................................................. 32

4.5 Dinamica folosind NAMD ................................................................................ 36

5.Concluzii ............................................................................................................... 48

Anexă ....................................................................................................................... 49

Bibliografie .............................................................................................................. 56

1

Capitolul 1

Introducere. Formularea problemei.

1.1 Generalităţi

Biologia este ştiinţa care se ocup ă cu studiul vieţii şi a organismelor vii. Acest

domeniu face referire la informaţii precum structura, funcţia, modalitatea de creştere

şi evoluţie a organismelor, distribuţia şi clasificarea lor. Toate subdisciplinile acestui

domeniu extrem de complex sunt unificate sub cinci axiome fundamentale: celulele

sunt unitaţile fundamentale ale vieţii, genele sunt unităţile fundamentale ale eredităţii,

speciile noi şi trăsăturile moştenite sunt produsul evoluţiei, un organism îşi reglează

mediul său intern pentru a se menţine în condiţii stabile şi, ultima, organismele vii

consumă şi transformă energie (Wikipedia 2010).

Subdisciplinile biologiei sunt definite în funcţie de scala la care sunt studiate

organismele, precum şi de metodele folosite în recunoaşterea şi urmărirea lor:

biochimia studiază chimia care stă la baza vieţii, biologia moleculară studiază

interacţiunile dintre molecule, biologia celulară studiază celula, fiziologia studiază

funcțiile mecanice, fizice și biochimice ale ţesuturilor şi ale organelor, ecologia

studiază felul în care organismele interacţionează în propriu lor mediu. În aceasta

lucrare sunt facute dese referiri la biologia moleculară şi de aceea este esenţial să

înţelegem cu se ocupă mai exact această branşă a biologiei. Mai precis, biologia

moleculară presupune înţelegerea interacţiunii dintre diferite sisteme componente ale

celulei, precum interacţiunea dintre diferite tipuri de ADN, ARN sau biosinteza

proteinelor.

Bioinformatica este o disciplină complexă, reprezentată prin cercetări din

biologia moleculară, genomică, proteomică, farmacologie, medicină. Cum cantitatea

de informaţie ce trebuie procesată şi prelucrată este foarte mare, a fost necesară

crearea unor baze de date biologice şi a unor programe ce implementează software

algoritmii necesari, precum şi metode de modelare matematică (Pavel, Vasile, and

Buiu 2011).

Studiul bioinformaticii şi a biologiei computaţionale include arii de dezvoltare

precum metode computaţionale pentru studiul organizării şi evoluţiei genelor şi a

genomului, metode tehnologice de abordare a structurii şi dinamicii moleculare,

metode de genomica comparativă evolutivă, şi metode de analiză şi predicţie a

structurilor.

2

1.2 Prezentarea lucrării

Această lucrare are ca temă prezentarea dinamicii glicoproteinelor aflate la

învelişul virusului HIV (Human Immunodeficiency Virus) şi anume glicoproteinele

gp120 şi gp41. Este importantă înţelegerea structurală şi funcţională a virsului pentru

a găsi metode de tratament şi poate chiar de eliminare a acestuia. Pentru aceasta

este nevoie de nişte cunoştinţe de bază în diverse domenii, în special în biologie,

domeniu prezentat pe larg anterior, chimie moleculară, fizică , programare etc.

Lucrarea este alcatuită din şapte părţi, ce vor fi prezentate pe scurt în cele ce

urmează.

În capitolul curent, „ Introducere. Formularea problemei”, au fost prezentate

informaţii generale, de bază, cu privire la domeniul de studiu, informaţii pe care orice

individ, indiferent dacă aprofundează sau nu acest domeniu, trebuie să le reţină.

Al doilea capitol al lucrării, şi anume „ Modelarea şi simularea moleculară”, va

prezenta diverse metode de modelare moleculară. Modelarea oferă o modalitate de

a explora caracteristicile structurale, dinamice, sau termodinamice, de a testa şi

dezvolta ipoteze, de a interpreta şi extinde datele experimentale şi, nu în ultimul

rând, de a înţelege legile care stau la baza structurii, flexibilităţii şi funcţiei

moleculare. Aici vom aprofunda noţiuni despre mecanica cuantică, mecanica

moleculară, aflând atât avantajele, cât şi dezavantajele folosirii lor. De asemenea

sunt prezentate noţiunile de bază din dinamica moleculară. O partea importantă a

acesteia este metoda MDFF. Metodele hibride computaţionale folosite pentru a

combina atât date structurale din surse diferite, cât şi rezoluţii, devin o parte esenţială

a biologiei structurale pe măsură ce acest domeniu evoluează spre studierea

ansamblurilor moleculare de dimensiuni mari. Astfel s-a dezvoltat o metodă numită

MDFF ce combină stucturile atomice de rezoluţie mare cu hărţile de microscopie crio-

electronică(crio-EM). Metoda presupune o simulare moleculară dinamică ȋn care un

potenţial bazat pe harta crio-EM este adăugat câmpului de forţe standard. Forţele

externe proporţionale cu gradientul hărţii de densitate se adaugă ȋntr-o simulare

dinamică a structurii atomice.

În al treilea capitol al lucrării, adică „Virusul HIV”, este prezentat pe larg, cu

trimiteri la literatura de specialitate, virusul HIV. Este menţionată structura,

componentele principale şi, apoi, analizate cele două glicoproteine, gp120 şi gp41,

responsabile cu transmiterea virusului în celulele sistemului imunitar. Virusul

imunodeficienţei umane de tip 1 (HIV-1) infecteaza milioane de oameni din toată

lumea, cauzând boala letala SIDA (Sindromul Imunodeficienței Dobândite). Conform

raportului unui program dezvoltat de Naţiunile Unite (UNAIDS), s-a estimat ca la

sfarşitul anului 2008 un numar de 33.4 milioane de oameni sunt infectaţi cu virusul

HIV. Din aceştia, 2.1 milioane sunt copii cu varsta sub 15 ani. De asemenea trebuie

menţionat ca ȋn 2008 s-au sesizat 2 milioane de decese datorate bolii SIDA (UNAIDS

2008) .

3

Ȋn al patrulea capitol, „Simulări de dinamică moleculară” sunt prezentate

simulări de dinamică moleculară aplicate pe gp120 şi gp41 şi rezultatele obţinute. Cu

ajutorul programului software VDM şi a codurilor ajutătoare NAMD şi Situs am

realizat partea practică. Am realizat două tipuri de fitări, fitarea rigidă şi cea flexibilă,

utilizând pachetul Situs şi o dinamică moleculară, folosind NAMD.

Al cincilea capitol „Concluzii” prezintă, pe scurt toată esenţa lucrării. Vor fi

reamintite definiţiile cele mai importante, ce stau la baza înţelegerii conceptului. După

aceasta scurtă, dar totuşi extrem de importantă revizie, vor fi prezentate toate

rezultatele finale, într-o manieră uşor de înţeles.

A şasea secţiune este pentru anexă. Am selectat, dintr-un număr mare, câteva

structuri de proteine. Unele dintre acestea au fost folosite la partea practică şi de

aceea câteva informaţii ȋn plus despre ele sunt utile.

Ultima secţiune, şi anume „Bibliografia” cuprinde toate referinţele care au fost

folosite ȋn redactarea acestei lucrări. Acestea pot fi cărţi ȋn format electronic, articole

online, sau chiar site-uri. Toate aceste documente au avut un rol extrem de

important, atât în realizarea părţii teoretice, cât şi în cea practică, oferindu-mi

cunoştinţele necesare pentru a realiza acest proiect.

4

Capitolul 2

Modelare şi simulare moleculară

2.1 Generalităţi

Modelarea moleculară a sistemelor de către calculatoare a luat amploare ȋn

ultimii ani. Tot mai mulţi oameni de ştiinţă, din diverse domenii de studiu, ȋşi arată

interesul faţă de această disciplină. Modelarea biologică a polimerilor precum

proteinele, acizii nucleici şi lipidele, este un domeniu complex, multidisciplinar:

biologii descriu cadru celular, chimiştii adaugă detaliile atomice şi moleculare,

fizicienii extind aceste viziuni la nivel electonic şi evidenţiază forţele care acţionează

asupra corpurilor, matematicienii analizează şi formulează algoritmi şi metode

numerice specifice pentru fiecare problemă ȋn parte, iar programatorii şi inginerii au

un rol extrem de important ȋn implementarea programelor de mari dimensiuni, astfel

ȋncât acestea să ruleze la viteze mari şi pe platforme extinse. Ȋn modelarea biologică,

o interpretare interdisciplinară este importantă nu numai datorită faptului că sunt

implicate mai multe aspecte, ci şi pentru că cea mai bună abordare tehnologică

porneşte mereu de la problema biologică. De asemenea conexiunile dintre teorie şi

partea practică, experimentală, sunt esenţiale: modelele computaţionale evoluează

pe măsură ce datele experimentale devin disponibile, iar teoriile biologice şi noile

experimente sunt bazate pe observaţiile tehnologice obţinute de la calculatoare.

Modelarea moleculară este ştiinţa care se ocupă cu studiul structurilor şi a

funcţiilor moleculare prin construirea unui model ce se bazează pe date reale, şi

implementarea lui tehnologică. Construirea unui model poate fi extrem de simplă,

precum realizarea şabloanelor de plastic sau a tijelor metalice, sau complexă,

precum sculpturile de lemn realizate prin intermediul laserului. Calculele sunt

realizate cu ajutorul mecanicii cuantice, mecanicii moleculare, dinamicii moleculare,

Monte Carlo, metodei de solvatare, SAR (structure/activity relationship), informaţiilor

şi bazelor de date chimice şi biologice. De asemenea, o componentă a modelării

biomoleculare este rafinarea datelor experimentale, primite de la NMR (Nuclear

Magnetic Resonance) sau cristalografia cu razele X.

Deşi modelele sunt o reprezentare simplistă a mediului celular, studiile

sistematice asupra lor pot ajuta la descoperirea de şabloane, modele şi perspective,

care altfel ar fi greu de observat. Ȋn modelare, principala ţintă este dezvoltarea şi

aplicarea modelelor corespunzătoare cu situaţia reală pe care o analizăm. Prin

urmare, aplicabilitatea acestora trebuie sa fie clar definită şi puterea de predicţie clar

demonstrată.

5

Ȋn ultimii ani, simularea moleculară dinamică a biomoleculelor a cunoscut o

dezvoltare explozivă şi a fost aplicată pe o gamă largă de probleme. Astfel s-au

evidenţiat două aspecte ce au un rol esenţial ȋn simulare:

Simulările asigură mişcarea particulelor individuale ca funcţie de timp astfel

ȋncât să se poată răspunde la ȋntrebări despre proprietăţile unui sistem mai uşor

decât prin efectuarea experimentelor;

Deşi potenţialul utilizat ȋn simulări este aproximat, el se află sub controlul

utilizatorului, astfel ȋncât eliminând sau modificând diferite date, să se poată

determina efectul lor asupra proprietăţilor examinate.

Ȋn studiul biologiei moleculare există trei tipuri de aplicaţii a metodelor de

simulare bazate pe dinamica moleculară. Prima utilizează simularea ca o metodă de

eşantionare a spaţiului de configurare. Aceasta este folosită pentru a determina sau

a ȋmbunataţi structurile obţinute cu date experimentale, precum difracţia cu razele X.

A doua utilizează simulările pentru a determina mediile de echilibru, inclusiv

proprietăţile structurale sau termodinamica sistemului. Pentru asemenea aplicaţii

este necesar ca simulările să eşantioneze corect spaţiul de configurare, precum ȋn

prima aplicaţie, cu condiţia suplimentară ca fiecare punct să fie ponderat cu factorul

Boltzmann corespunzător. A treia este folosită pentru a examina dinamica propriu-

zisă. Aici, pe lângă faptul că trebuie să eşantionam spaţiul de configurare cu

ponderea Boltzmann potrivită, mai trebuie ca aceasta să fie făcută astfel ȋncât

dezvoltarea temporală a sistemului să fie reprezentată ȋn mod corespunzător. Pentru

primele două metode, poate fi folosită atât simularea Monte Carlo, cât şi dinamica

moleculară. Ȋn schimb, la a treia aplicaţie, în care este extrem de importantă

mişcarea şi dezvoltarea ei, numai dinamica moleculară poate oferi informaţiile

necesare. Avantajul folosirii dinamicii moleculare ȋn locul metodei Monte Carlo este

acela că oferă o cale către proprietaţile dinamice ale sistemului: coeficienţii de

transport, răspunsurile temporale la perturbaţii, proprietăţile reologice

(interdependența între solicitările mecanice, răspunsul corpurilor și proprietățile

acestora) (Becker et al. 2001).

Simularea computerizată acţionează ca o legătură ȋntre partea microscopică şi

scalele de timp şi lumea macroscopică din laborator: avem presupuneri a

interacţiunilor dintre molecule şi obţinem o predicţie cat mai exactă a proprietăţilor.

Când ne referim la exactitatea predicţiilor ne referim la faptul că acurateţea lor este

limitată de restricţiile pe care le avem. După cum spuneam şi la ȋnceputul capitolului,

simularea se comportă ca şi o legătură ȋntre teorie şi experiment. Putem să testăm o

teorie prin simularea aceluiaşi model, putem testa modelul comparându-l cu

rezultatele experimentale, putem, de asemenea, să desfaşurăm pe calculator

experimente care sunt dificil sau imposibil de realizat ȋn laborator.

Ȋn cele din urmă, vrem sa facem comparaţii cu măsurările experimentale

realizate pe anumite materiale şi de aceea un model cât mai precis a interacţiunilor

moleculare este esenţial. Scopul moleculării dinamice este acela de a aduce

procesul de presupunere la minim.

6

Figura 2.1 – Simularea ca o legătură între microscopic şi macroscopic

Figura 2.2 – Simularea ca o legătură între teorie şi experiment (Allen 2004)

2.2 Mecanica cuantică şi mecanica moleculară

Pentru a calcula structura moleculară şi caracteristicile energetice ale

diferitelor elemente s-a dezvoltat un număr mare de proceduri şi modele, fiecare

axându-se pe diferite proprietăţi, şi fiecare având avantajele şi dezavantajele sale.

Acestea sunt grupate ȋn două categorii principale: modele bazate pe mecanica

cuantică şi modele bazate pe mecanica moleculară.

Modelele bazate pe mecanca cuantică au la bază ecuaţia lui Schrödinger .

Acest tip de abordare tratează moleculele ca o colecţie de nuclee şi electroni, fară să

ia ȋn consideraţie legăturile chimice. Soluţia ecuaţiei lui Schrödinger este exprimată

ȋn termeni de mişcare a electronilor, ceea ce conduce, ȋn final, la informaţii despre

7

structura moleculară, caracteristicile energetice sau chiar despre legăturile chimice.

Cu toate acestea, trebuie realizate nişte aproximaţii, ȋntrucât ecuaţia lui Schrödinger

nu poate fi rezolvată decât pentru un sistem de un electron (atomul de hidrogen).

Al doilea tip de model menţionat, este cel bazat pe mecanica moleculară. Spre

deosebire de cel bazat pe mecanica cuantică, care porneşte de la o ecuaţie, acesta

porneşte de la o privire de ansamblu asupra structurii moleculare. Moleculele nu mai

sunt văzute ca o colecţie de nuclee şi electroni, ci ca fiind alcătuite din atomi şi

legături. Poziţia atomilor este modificată astfel ȋncât să se potrivească cu o structură

de date deja cunoscută (lungimea legăturii şi unghiuri), precum şi ca să cuprindă

interacţiunile fară legătură.

Un avantaj al mecanicii moleculare este acela că e mai simplu de folosit,

ȋntrucât nu e nevoie să se rezolve ecuaţia lui Schrödinger pentru electronii ȋn

mişcare, dar totuşi e nevoie de o descriere amanunţită a legăturilor chimice precum

şi a informaţiilor precise despre structura moleculară.

Ȋn figura de mai jos putem observa cum o parte din sistem (regiunea de

reacţie) este tratată prin metode cuantice, pe când solventul ȋnconjurător şi sistemul

rămas este tratat ȋn mod clasic:

Figura 2.3 Conceptul QM/MM (Sirovich, Kohn, and Krishnaprasad 2010)

2.3 Modele bazate pe mecanica cuantică

Mecanica cuantică descrie moleculele ȋn termeni de interacţiuni ȋntre nuclee şi

electroni şi geometria moleculară ȋn termeni de aranjamente de energie minimă a

nucleelor.

Dacă ar fi posibilă rezolvarea ecuaţiei Schrödinger pentru un sistem format

din mai mulţi electroni, proprietăţile moleculare rezultate ar reproduce ȋntr-un mod cât

8

mai fidel cantităţile obţinute ȋn mod experimental. Totuşi, cum soluţia ecuaţiei este

aproximată, proprietăţile moleculare rezultate nu se mai identifică cu rezultatele

obţinute experimental. Diferite aproximaţii ale ecuaţiei vor duce la rezultate diferite.

Putem presupune că, cu cât aproximările modelului teoretic (ecuaţia Schrödinger)

sunt ȋn număr mai mic, rezultatele experimentale sunt mai aproape de realitate.

Când ne referim la găsirea unui model teoretic, căutăm de fapt un set de

aproximaţii pentru ecuaţia Schrödinger. Un asemenea model trebuie să respecte un

număr de condiţii (Hehre 2003):

Modelul trebuie să producă energie, dându-se doar tipul şi poziţia nucleelor,

numărul total de electroni şi numărul de electroni neȋmperecheaţi

Modelul nu trebuie să apeleze la „intuiţia chimică”

Amplitudinea erorii energiei calculate ar trebui să crească proporţional cu

dimensiunea moleculară, adică sa fie „ size consistent”

Ȋntre energia modelului şi energia Schrödinger ar trebui să existe o legătură

Modelul trebuie să se aplice atât pe probleme simple, cât şi pe probleme

reale, complexe

2.3.1 Ecuaţia lui Schrödinger

Ecuaţia Schrödinger este următoarea:

[

] ( ) ( )

Unde: E= energia electronică ȋn unităţi atomice, = unda care descrie

mişcarea electronilor, dependentă de coordonatele electronului, r=distanţa faţa de

nucleu, Z=sarcina electrică.

Astfel, termenii din paranteză reprezintă energia cinetică şi potenţială a unui

electron aflat la distanţa r faţă de un nucleu cu sarcină Z.

Pătratul funcţiei de undă ȋnmulţit cu un volum exprimă probabilitatea de a găsi

electronul ȋn volumul respectiv. Acesta este denumit densitatea totală de electroni şi

corespunde cu densitatea de electroni masurată ȋn experimentul de difracţie a

razelor X. Valorile mari indică poziţia atomilor, valorile medii accentuează legăturile,

iar valorile mici oferă informaţii despre forma şi dimensiunea moleculei. Un exemplu

a densităţii electronilor este reprezentată ȋn figura următoare (Wikipedia 2010):

(2.1)

9

Figura 2.4 – Densitatea de electroni calculată pentru anilină

Pentru un sistem multi-nuclear, multi-electron, ecuaţia Schrödinger va fi

generalizată conform ecuaţiei de mai jos:

Unde este o funcţie de undă multi-electron, iar reprezintă operatorul

Hamiltonian, care, ȋn unităţi atomice este dat de formula:

∑

∑

∑ ∑

∑ ∑

∑ ∑

Unde Z este sarcina nucleară, MA este masa nucleului A raportată la masa

unui electron, RAB este distanţa dintre nucleele A şi B, rij este distanţa dintre electronii

i şi j cu i<j, iar riA este distanţa dintre electronul i şi nucleul A.

2.3.2. Aproximaţia Born- Oppenheimer

Pentru a simplifica ecuaţia Schrödinger pentru sistemele moleculare şi ȋntrucât

viteza mişcării nucleelor este mică ȋn comparaţie cu viteza la care electronii se

deplasează, şi anume viteza luminii, putem presupune că nucleele nu se mişcă.

Această ipoteză se numeşte aproximaţia Born – Oppenheimer:

(2.2)

(2.3)

10

sau

∑

∑ ∑

∑ ∑

Cum viteza nucleelor am presupus-o nulă, termenii care descriu energia

cinetică nucleară dispar ȋn ecuaţia 2.5, iar potenţialul Coulomb este constant şi folosit

pentru a afla energia totală a sistemului (E).

∑ ∑

2.3.3 Aproximaţia Hartree – Fock

Ecuaţia Schrödinger electronică (2.5), rezultată ȋn urma aproximaţiei Born –

Oppenheimer, este ȋn continuare dificil de rezolvat. O noua aproximaţie menită să

simplifice calculul este aceea prin care subliniem că electronii se mişcă independent

unii de ceilalţi. Ȋn realitate, ȋnsă, electronii individuali sunt limitaţi la orbitalii moleculari,

aceştia fiind determinaţi presupunând că electronul se deplasează cu un câmp mediu

al celorlalţi electroni.

Funcţia de undă, , se va scrie cu ajutorul unui determinant, numit

determinantul Slater. Acesta este antisimetric la schimbul coordonatelor electronice.

√ |

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

|

Unde se referă la un orbital centrifug şi e produsul dintre o funcţie spaţială

sau orbitalul molecular şi o funcţie de rotaţie α sau β. Din faptul că există două

funcţii de rotaţie, putem trage concluzia că maxim doi electroni pot ocupa un orbital

molecular. Dacă ar mai exista un al treilea electron, două randuri diferite din

determinant ar fi identice, deci valoarea lui ar fi zero.

Setul de orbitali moleculari care conduc la cea mai mică energie este obţinut

printr-un proces numit SFC (self-consistent-field). Pe lângă procedura Hartree-Fock,

metoda SFC mai include proceduri funcţionale de densitate. Din procedurile SFC

rezultă ecuaţii de forma:

( ) ( ) ( )

Din ecuaţia de mai sus (2.8) rezultă că forma operatorului Fock va fi de forma:

(2.6)

(2.4)

(2.5)

(2.7)

(2.8)

11

( )

( )

Unde xi sunt coordonatele unghiulare şi spaţiale ale electronului i,

reprezintă orbitalii de rotaţie, iar este potenţialul efectiv al electonului i, care

depinde de orbitalii celorlalţi electroni.

Aproximaţia LCAO (Linear Combination of Atomic Orbitals)

Ȋn urma aplicării aproximaţiei Hartree – Fock se obţine un set de ecuaţii

diferenţiale, fiecare incluzând coordonatele unui electron. Pentru a o transforma intr-

un set de ecuaţii algebrice, vom introduce o aproximaţie ȋn plus.

Ȋn practică, orbitalii moleculari sunt exprimaţi sub formă de combinaţii liniare

ale unui set finit de funcţii prescrise ca funcţii de bază.

Ecuaţia aproximării LCAO este scrisă sub forma:

∑

Unde c reprezintă coeficienţii orbitalului molecular (necunoscuţi) şi orbitalii

atomici (sunt situaţi ȋn poziţii nucleare).

Ecuaţiile Roothaan – Hall

Dacă aplicăm ecuaţiile Schrödinger electronice asupra aproximaţiilor Hartree –

Fock şi LCAO, vom obţine ecuaţiile Roothaan – Hall:

Unde reprezintă energiile orbitale, S este matricea de suprapunere

(ȋntretăiere), F este matricea Fock şi este analoagă cu Hamiltonianul din ecuaţia

Schrödinger, iar elementele ei sunt date de formula:

Hnucleu este nucleul Hamiltonian, iar elementele lui sunt date de formula:

∫ ( ) [

∑

]

Elementele Coulomb şi de schimb sunt date de formulele:

∑ ∑ ( )

(2.10)

(2.11)

(2.9)

(2.14)

(2.13)

(2.12)

12

∑ ∑ ( )

Unde P este matricea de densitate:

∑

Produsul dintre un element al matricii de densitate şi orbitalii atomici asociaţi,

ȋnsumaţi pe toţi orbitalii, duce la calculul densitaţii electronilor despre care am vorbit

in capitolul 2.3.1.

(μν | λσ) este o integrală dublă:

( ) ∫∫ ( ) ( ) [

] ( ) ( )

Modelele Hartree – Fock sunt bine-definite şi au proprietăţi unice. Sunt „size -

consistent”, adică eroarea totală este proporţională cu dimensiunea moleculară, şi

variaţionale, adică energia calculată reprezintă o limită superioară a energiei obţinute

experimental. Nu numai energiile şi funcţiile de undă pot fi analizate prin metode

analitice, ci şi prima şi a doua derivată. Astfel, optimizarea geometrică, ce foloseşte

prima derivată, şi determinarea frecvenţelor vibraţionale, ce foloseşte a doua

derivată, sunt mult mai uşor de determinat.

2.4 Modele bazate pe mecanica moleculară

După cum am exemplificat şi ȋn subcapitolul 2.1, o abordare alternativă este

mecanica moleculară, la care se mai face referinţa şi sub denumirea de câmpuri de

forţă sau metoda energiei potenţiale. Funcţia ţintă ȋn mecanica moleculară poate fi

luată ca aproximaţia Born-Oppenheimer a energiei potenţiale ȋn ceea ce priveşte

nucleele (Ep(X), unde X este vectorul de poziţie pentru nuclee), iar electronii vor fi

variabile implicite ale potenţialului. O deosebire esenţială faţa de mecanica cuantică,

este faptul că această funcţie de potenţial trebuie evaluată empiric.

Mecanica moleculară descrie moleculele ca fiind atomi cu legături, care au

fost distorsionate de la o geometrie specifică datorită interacţiunilor fară legături van

der Waals şi Coulomb. Succesul modelelor moleculare depinde de gradul de

transferabilitate a parametrilor geometrici de la o moleculă la alta, precum şi de

dependenţa predictibilă a parametrilor de hibridizare atomică. O moleculă este

considerată un sistem mecanic ȋn care particulele sunt conectate prin arce, şi unde

forţele fizice au un rol important ȋn structura şi dinamica lor. Ca răspuns la aceste

forţe, moleculele se ȋntind, se leagă sau se rotesc ȋn jurul acestor legături.

(2.15)

(2.17)

(2.16)

13

Figura 2.5. Cele patru tipuri de interacţiuni (University of Massachusetts Lowell

2008)

Principiul de bază este acela că forţele fizice cumulative pot fi folosite să

descrie geometriile şi energiile moleculare. Structura spaţială obţinută ȋn final este

este o reglare a geometriei astfel ȋncât să minimizeze energia internă totală.

Din punct de vedere practic mecanica moleculară implică construcţia unei

energii potenţiale, ȋn funcţie de poziţiile atomice, plecând de la un număr mare de

date moleculare. Contribuţiile entropice sunt neglijate sau aproximate prin diferite

tehnici ȋn funcţie de care din aceste variante este mai utilă. Minimizarea acestei

funcţii poate fi folosită pentru a calcula zonele favorabile din spaţiul de configuraţie

multi-dimensional, iar simularea dinamică moleculară poate explica stările termice

accesibile ale sistemului.

Pentru ca folosirea dinamicii moleculare să aibă efectele dorite, trebuie să se

respecte trei principii: ipoteza termodinamicii, aditivitatea energiei potenţiale şi

transferabilitatea potenţialelor. Acestea vor fi detaliate mai pe larg ȋn subcapitolele

care urmează.

2.4.1 Ipoteza termodinamicii

Ipoteza termodinamicii presupune că majoritatea macromoleculelor sunt

conduse la structura lor naturală, cu intervenţie minimă, sau chiar deloc a

catalizatorilor, asta datorită termodinamicii. Aceasta este ȋn contradicţie cu procesele

care au nevoie de interacţiunea enzimelor pentru a micşora barierele de activare. O

stare unică este codată ȋn secvenţa proteinei, deoarece interacţiunile ȋn reţea din

lanţurile polipeptidice heterogene ghidează proteina spre o conformaţie nativă, care e

o structură de energie minimă. Plierea spontană a unei proteine nu se bazează pe

nici un ajutor extern, ci işi urmează secvenţa de instrucţiuni internă. Structura

14

naturală a proteinei este, ȋn general, stabilă la mutaţii, ceea ce duce la cresterea

energiei lor native.

2.4.2 Aditivitatea

Principiul mecanic al aditivităţii presupune că energia moleculară poate fi

exprimată ca o sumă de potenţiale derivate din forţe fizice precum van der Waals,

electrostatice, mecanice. Aceste forţe pot fi separate ȋn termeni locali si ne-locali.

Termenii locali:

( ) ∑ ( ) ∑ ( ) ∑ ( )

Unde Eleg, Edir, Etor sunt potenţialele de legătură, potenţiale de unghiuri de

legătură, respectiv diedrice, iar suma se extinde peste setul de legături bi, unghiurile

de legătură i şi unghiurile diedriece i.

Figura 2.6 Molecula ca sistem mecanic (Sirovich, Kohn, and Krishnaprasad

2010)

Termenii ne-locali:

Termenii ne-locali se pot scrie sub forma:

- ( ) ∑ ( )

(2.19)

(2.18)

15

Unde funcţiile sunt de obicei raţionale, iar energiile se compun de obicei din

contribuţii van der Waals şi Coulomb ȋntre perechile de atomi legate.

Aceasta separare dinte termenii locali şi cei ne-locali poate fi folosită ȋn

construirea algoritmilor care folosesc structuri de funcţii pentru a accelera

convergenţa. Pe lângă aceasta, separarea este baza protocoalelor „multi-step”

pentru dinamica moleculară ce ȋmbunatăţesc forţele locale şi ne-locale la diferite

frecvenţe. Ea este necesară ȋntrucât termenii locali se schimbă rapid, pe când cei ne-

locali se schimbă mai lent.

2.4.3 Transferabilitatea

Principiul transferabilităţii presupune că potenţialele pot fi dezvoltate pentru a

cuprinde toate datele experimentale pentru structurile reprezentative, apoi pot fi

aplicate pentru a prezice moleculele compuse din acelaşi subgrup chimic. Aceasta

poate fi realizată ȋntrucât distanţele de legătură şi unghiurile de legătură tind să aibă

valori similare pentru diferite tipuri de molecule ȋn condiţii normale. Totuşi ȋn condiţii

speciale, când asupra lor acţionează diferite forţe, aceste valori tind să ia valori

medii. Modelarea structurilor şi proprietăţilor sistemelor complexe sau conjugate, este

dificil de realizat şi avem nevoie de calcule precum cele din mecanica cuantică

pentru a obţine lungimile legăturilor şi constantele de ȋntindere. Pentru moleculele de

dimensiuni mici, dependenţa de mediu a direcţiei geometrice poate fi modelată mai

uşor de o funcţie decât de o constantă.

2.5 Dinamica moleculară

Este important de reţinut faptul că modelarea moleculară este folosită pentru a

dezvolta un câmp de forţe, precum o funcţie de potenţial, care mai apoi este utilizată

pentru Monte Carlo, dinamica moleculară, calcule de minimizare sau dinamica

Langevin. Exemple de metode, ȋmpreună cu avantajele şi dezavantajele lor sunt

subliniate ȋn tabelul de mai jos (Sirovich, Kohn, and Krishnaprasad 2010).

Metoda Avantaje Dezavantaje

Dinamica moleculară(MD)

Mişcare continuă, legătură experimentală ȋntre structuri şi date cinetice macroscopice

Scump, durată de timp scurtă

Dinamica moleculară fixă(TMD)

Conexiune ȋntre două stări, elimină ciocnirile şi sugerează bariere

Nu e necesar fizic

Solvatarea continuă Potenţialul mediu al forţei aproximează mediul şi reduce costul modelului

Aproximată

16

Are informaţii importante despre atmosfera ionică şi asociaţiile intermoleculare

Dinamica Browniană(BD)

Mişcare de durată lungă şi pe scală largă

Hidrodinamică aproximată, sisteme limitate cu inerţie

mică

Monte Carlo(MC) Eşantionare pe scală largă; statistici folositoare

Definiţiile de mişcare sunt dificile, căi nefizice

Minimizarea Informaţii valoroase, constrângerile experimentale pot fi incorporate

Nu are informaţii dinamice

Tabel 2.1 Avantajele şi dezavantajele metodelor de simulare

Simularea moleculară dinamică asigură metodologia pentru modelarea

microscopică la scară atomică. Aceasta este o tehnică pentru studiul evoluţiei ȋn timp

a sistemelor ce permit predicţia proprietăţilor statice sau dinamice direct din

interacţiunea dintre molecule. Folosim această simulare pentru a determina

proprietăţile structurale, dinamice şi termodinamice, prin rezolvarea ecuaţiilor de

mişcare. Dinamica moleculară oferă informaţii despre dependenţa de timp şi

amplitudinea fluctuaţiilor atât pentru poziţie cât şi pentru viteză, ȋn timp ce metoda

Monte Carlo oferă informaţii numai despre poziţie, iar datele despre dependenţa de

timp sunt puţine.

Ecuaţia de mişcare poate fi rezolvată, ȋn funcţie de precizia de care avem

nevoie, fie cu ecuaţiile de mişcare ale lui Newton, fie cu ecuaţia stocastică de

mişcare a lui Langevin, fie cu ecuaţia browniană de mişcare, sau chiar cu o

combinaţie ȋntre mecanica clasică şi cea cuantică.

Un sistem clasic este descris de Hamiltonianul H, care este o funcţie de

coordonatele r şi impulsul p. Pentru sistemele normale, unde energia potenţială este

independentă de timp şi velocitate, Hamiltonianul este reprezentat de energia totală.

( ) ( ) ( ) ∑

( )

Unde K(p) este energia de cinetică, U(r) este energia potenţială, pi este

impulsul particulei i, m este masa.

2.5.1 Dinamica moleculară newtoniană

Caracterul temporal al moleculeler este cel mai bine descris de ecuaţiile de

mişcare formulate de mecanica cuantică, precum ecuaţia Schrödinger dependentă

de timp. Ȋnsă această ecuaţie este greu de rezolvat pentru sisteme de dimensiuni

(2.20)

17

mari şi de aceea o descriere mecanică este folosită pentru aproximarea mişcarii

executate de atomi. Vom folosi mecanica clasică newtoniană.

Ecuaţia de mişcare a lui Newton are forma:

Unde Fi este forţa ce acţionează asupra particulei i, mi este masa acesteia, ai

este acceleraţia, derivata de ordin doi a poziţiei r ȋn timp.

Forţa Fi este determinată de gradientul funcţiei de energie potenţială U(r)

( )

Apelând la Hamiltonian, ecuaţia clasică de mişcare este scrisă ca o pereche

de ecuaţii diferienţiale de ordinul 1:

( )

( )

Ȋnlocuind aici definiţia lui H vom obţine definiţia impulsului

Astfel, având două ecuaţii diferenţiale de ordinul 1, sistemul este mai uşor de

rezolvat decât având o singură ecuaţie de ordinul 2.

Proprietăţile ecuaţiei de mişcare a lui Newton

Conservarea energiei

Presupunem că energia potenţială U şi hamiltonianul H nu depind ȋntr-un mod

explicit de timp sau viteză, deci

. De aici rezultă faptul că derivata totală

, deci avem conservare de energie

Conservarea impulsului liniar şi unghiular

Dacă potenţialul U nu depinde decât de separarea particulei şi nu este aplicat

nici un câmp interior, atunci ecuaţia de mişcare conservă impulsul total liniar (P) şi

impulsul unghiular total (L):

∑

∑

∑

(2.25)

(2.22)

(2.21)

(2.23)

(2.24)

18

Reversibilitatea temporală

A treia proprietate exprimă faptul că ecuaţia lui Newton este reversibilă ȋn

timp. Schimbând semnul tuturor vitezelor sau impulsurilor molecula ȋşi va reconstitui

traiectoria.

2.5.2 Fitări moleculare

Domeniul biologiei structurale evoluează rapid, trecând de la studiul

proteinelor la cel al ansamblurilor moleculare de dimensiuni mari, formate din mai

multe componente ce lucrează ȋmpreună. Principala tehnică de determinare a

structurii folosită ȋn scopul studierii ansamblurilor macromoleculare este microscopia

crio-electronică(crio-EM). Ȋn unele cazuri, această tehică este singura modalitate de

obţinere a informaţiilor structurale. Dezavantajul este, că ȋn urma folosirii ei, vom

obţine reconstrucţii de rezoluţie mică a sistemelor macromoleculare, ȋn condiţiile ȋn

care sunt disponibile structuri de rezoluţie mare a componentelor individuale.

Metodele computaţionale pentru fitarea structurilor atomice ȋn hărţile crio-EM

reduc decalajul rezoluţiei dintre crio-EM şi cristalografia cu razele X (X-ray),

permiţând astfel interpretarea datelor crio-EM cu rezoluţie mai bună. Unele structuri

obţinute cu metodele de fitare sunt singurele surse ale modelelor atomice ale

ansamblurilor macromoleculare. Pentru hărţile EM cu rezoluţie mică, locaţia

proteinelor ȋntr-un complex poate fi dedusă din forma lor globală comparată cu

densitatea, fie ȋntr-un mod vizual, fie prin tăierea sistematică a corpului. Ȋn ultimul caz

are loc o căutare ȋn şase dimensiuni (trei grade de libertate de translaţie şi trei de

rotaţie) pentru a găsi cea mai bună poziţie şi orientare a unei molecule date ȋn

densitate.

Metoda MDFF

Metoda MDFF este o extensie a tehnicii de simulare dinamică

moleculară(MD), ȋn care fiecare atom este reprezentat de o particulă, ce are o

anumită masă şi sarcină. Interacţiunea dintre fiecare pereche de atomi este descrisă

de câmpul de forţe sau de energia potenţială UMD. Poziţia şi viteza fiecărui atom se

propagă ȋn timp conform mecanicii clasice, obţinându-se astfel o descriere dinamică

a sistemului.

.

19

Figura 2.7Exemplu de aplicare a MDFF (L. G. Trabuco et al. 2009)

Date necesare pentru simularea MDFF

Pentru a realiza o simulare MDFF avem nevoie de două tipuri de date de

intrare: o hartă crio-EM a complexului studiat şi modelele atomice a componentelor

ce vor fi integrate ȋn hartă. Modelele atomice iniţiale pot fi obţinute prin diferite tehnici

precum cristalografia cu raze X sau spectrografia NMR (Nuclear Magnetic

Resonance). Este important ca datele să fie corecte, deoarece orice eroare conţinută

ȋn aceste modele iniţiale poate să afecteze modelele atomice obţinute. De asemenea

orice eroare ȋn datele crio-EM datorată opticii, eşantionării, impreciziei numerice,

numărului mic de particule va fi inclusă ȋn funcţia energiei potenţiale.

Conversia hărţii de densitate crio-EM ȋn potenţial

MDFF se bazează pe metoda dinamicii moleculare, extinzând termenul UMD

prin doi termeni adiţionali. Primul termen ia ȋn consideraţie informaţiile experimentale.

Harta crio-EM este transformată ȋntr-o funcţie de energie potenţială UEM, ce conduce

atomii ȋn densitatea crio-EM, ȋn timp ce potenţialul MD (UMD) păstrează parametrii

fizici corecţi ai modelului. Al doilea termen (USS) menţine integritatea structurii

secundare a proteinei sau acizilor nucleici:

Datele obţinute din reconstrucţia crio-EM reprezintă potenţialul Coulomb a

macromoleculei. Când structura atomică este plasată ȋn harta de densitate, atomii

sunt deplasaţi din zonele cu densitate mică ȋn zonele cu densitate mare prin

aplicarea unor forţe. Energia potenţială a hărţii este:

(2.26)

20

( ) ∑ ( )

Unde { [

( )

] ( )

( )

Aici ( ) este potenţialul Coulomb dezvăluit de crio-EM, este

valoarea maximă a tuturor voxelilor (cea mai mică entitate ȋn care poate fi

descompus volumul) din harta EM, este un factor arbitrar de scalare, o

valoare limită folosită pentru a neglija datele ce nu corespund moleculei, cum ar fi

densitatea solventului, este o pondere ce poate fi variată ȋn funcţie de tipul de

atom plasat ȋn acest potenţial, iar rj este poziţia atomului j.

Valoarea limită este aleasă ȋn funcţie de histograma de densitate a hărţii

EM, care are două vârfuri de densităţi diferite. Primul, şi cel mai mare, corespunde

densităţii solventului, ȋn timp ce al doilea, mai larg, corespunde densităţii proteinei şi

acizilor nucleici (G. L. Trabuco et al. 2008).

Figura 2.8Exemplu de histogramă de densitate

Forţa aplicată asupra unui atom ȋn interiorul potenţialului este definită de

ecuaţia următoare:

( )

( )

(2.27)

(2.28)

(2.29)

21

Ecuaţia exprimă faptul că forţa aplicată pe fiecare atom i depinde numai de

gradientul potenţialului obţinut din densitatea hărţii EM la poziţia ri, deci fitarea ȋn

MDFF are loc local.

Pentru a păstra calitatea stereochimică a structurii şi pentru a preveni supra-

fitarea ȋn MDFF, sunt aplicate restricţii armonice asupra unui set de coordonate

interne, relevante pentru structura secundară a macromoleculei ȋn forma iniţială. Vom

avea, astfel, un termen nou Uss care introduce restricţiile armonice funcţiei de energie

potenţială.

∑ ( )

Unde reprezintă coordonata internă cu restricţie, este valoarea

instantanee a acestei coordonate, este valoarea de echilibru şi este luată din

structura atomică iniţială, iar este constanta de elasticitate.

Protocolul de fitare flexibilă

Pentru o obţine o fitare cât mai optimă trebuie sa se gasească o balanţa ȋntre

cei trei termeni UMD, UEM,USS. Pentru primul termen, parametrii sunt daţi de alegerea

unui câmp de forţe standard, iar ceilalţi doi termeni conţin parametrii ce pot fi reglaţi:

forţe mari din harta EM (UEM) şi restricţii mici a structurii secundare (Uss) pot conduce

la o fitare mai bună, dar pot de asemena conduce la distorsiuni ȋn structura

macromoleculară.

Pentru potenţialul UEM , parametrii care pot varia sunt factorul de scalare şi

ponderile . Ponderile sunt stabilite pentru masele atomice, ȋn timp ce determină

domeniul de măsurare a forţelor aplicate pe atomi. Gradientul potenţialului este

calculat ȋnainte de alegerea parametrului . Valori mari ale acestuia poate duce la

acceleraţii mari a atomilor provocând instabilitatea simulării.

Pentru termenul Uss trebuie să alegem constanta de elasticitate . Valorile

tipice pentru acestea sunt kμ = 200 kcalmol-1 rad-2 sau kμ=200kcalmol-1Å-2 ȋn cazul

distanţelor ARN.

MDFF poate fi efectuat ȋn paşi multipli, variind parametrii la fiecare pas. Ȋn

acest caz mai pot fi variaţi şi alţi parametri:

Temperatura poate fi ajustată pentru a permite sistemului să

depăşească barierele energetice, explorând o porţiune mai mare a

spaţiului ȋn mai puţin timp.

Filtrarea trece-jos a hărţii ȋn primul pas poate fi folosită pentru a evita

blocarea ȋntr-un minim local, pentru ca apoi să se folosească harta

originală.

Restricţiile armonice puternice pot fi aplicate asupra structurii

secundare ȋntr-un pas, pentru ca ȋntr-un pas următor acestea să scadă.

(2.30)

22

La orice moment de timp, orice porţiune din structură poate fi fixată sau

limitată la poziţia curentă.

Densitatea corespunzătoare unei părţi din structură poate fi stearsă.

Harta nouă este caracterizată de parametrul , folosit mai apoi pentru

calculul UEM folosind formulele (3.2) şi (3.2).

(

( ))

Unde este harta EM originală, iar este harta simulată, cu o valoare

maximă a voxelului ( ) (L. G. Trabuco et al. 2008).

Analiza rezultatelor MDFF

Convergenţa unei simulări MDFF (sau a unui pas ȋntr-un protocol multi-step)

poate fi evaluată prin monitorizarea ȋn timp a erorii pătratice medii (RMSD – Root

Mean Square Deviation) a structurii originale, sau a coeficientului de corelaţie

ȋncrucişată (CCC – Cross-Correlation Coefficient) dintre structura atomică şi harta de

densitate crio-EM originală.

⟨( ⟨ ⟩) ⟩ ⁄

Unde ri reprezintă vectorul coordonatelor atomului i, iar mediile sunt luate

dintr-un set de atomi din structura atomică

Pentru a calcula CCC-ul dintre structură atomică şi o hartă crio-EM, ȋntâi se

generează din structura atomică, o hartă simulată. Aceasta se realizează prin

interpolarea numerelor atomice a tuturor atomilor pe reţeaua 3D, şi apoi prin

aplicarea unui filtru trece-jos. Rezoluţia dorită a hărţii simulate este determinată de

lăţimea (2σ) a filtrului Gaussian. După ce harta simulată a fost creată cu rezoluţia

potrivită, CCC este calculat conform formulei:

⟨( ⟨ ⟩)( ⟨ ⟩)⟩

Unde ⟨S⟩ şi ⟨E⟩ sunt valorile medii a voxelilor din hărţile simulate şi originale,

iar σS şi σE sunt deviaţiile standard corespunzătoare. ia valori cuprinse ȋn intervalul

[-1;1] (L. G. Trabuco et al. 2009).

MDFF este cea mai potrivită metodă pentru studiul anasmblurilor

macromoleculare. De când a fost implementat ȋn NAMD, un software de dinamică

moleculară, poate fi folosit pentru fitarea sistemelor de dimensiuni mari, ȋn ȋntregimea

lor, ȋn aceeaşi simulare. Structura şi analiza simulărilor MDFF sunt realizate cu

plugin-ul „mdff” din cadrul VDM, ȋn timp ce simularea rulează folosind NAMD.

(2.31)

(2.32)

(3.33)

23

Capitolul 3

Virusul HIV

Un virus reprezintă un agent infecţios, ce se poate replica numai ȋn interiorul

celulelor vii din cadrul unui organism. Acesta poate să infecteze toate tipurile de

organisme, de la animale şi plante, la bacterii.

Particulele virale, numite şi virioni sunt alcătuite din două sau trei părţi:

Materialul genetic, alcătuit din ADN (acid dezoxiribonucleic) sau ARN

(acid ribonucleic)

Un ȋnveliş proteic ce protejează aceste gene

O anvelopă de lipide ce ȋnconjoară ȋnvelişul proteic când acesta se află

ȋn exteriorul celulei

Conformaţia viruşilor poate varia de la forme simple, elicoidale, la structuri mai

complexe. Un virus mediu are o dimensiune de o sută de ori mai mică decât cea a

unei bacterii. Cei mai mulţi viruşi sunt prea mici pentru a fi văzuţi direct cu un

microscop optic (Wikipedia 2009).

3.1 Noţiuni generale

Virusul HIV (Human Immunodeficiency Virus) este un lentivirus (virus ce se

poate replica lent ȋn celula gazdă ) ce cauzează SIDA (Sindromul Imunodeficienței

Dobândite), o boală ce duce ȋntr-un final la cedarea sistemului imunitar.

Virusul infectează celule vitale din sistemul imunitar, precum limfocitele T-

helper (celule Th), ȋn mod specific celulele CD4 (Cluster of Differentiation 4), celulele

macrofage sau celulele dendritice. Infecţia cu HIV conduce la un nivel scăzut de

celule CD4+T prin mai multe mecanisme precum: apoptoza celulelor neinfectate,

uciderea virală a celulelor infectate, şi uciderea celulelor CD4+T infectate. Când

numărul celulelor CD4+T scade sub un anumit nivel, numit nivel critic, imunitatea

celulară mediată este pierdută, iar corpul devine mai susceptibil la unele infecţii.

Există două tipuri de HIV: HIV-1 şi HIV-2. O descriere generală a celor două

se găseşte ȋn tabelul de mai jos (Wikipedia 2006):

24

Specie Virulenţă Infectivitate Prevalenţă Originea

HIV-1 Ridicată Ridicată Globală Cimpanzeul

comun

HIV-2 Scăzută Scazută Africa de Vest Sooty

Mangabey

Tabelul 3.1 Descrierea tipurilor de viruşi HIV

3.2 Structura virusului

Virsusul are o formă sferică, cu un diametru de 120nm. Fiecare virus conţine

două lanţuri de ARN. Pentru replicare, virusul are nevoie de o celulă gazdă, iar ARN-

ul trebuie să fie mai ȋntâi transcris ȋn ADN, ceea ce se realizează cu ajutorul unei

enzime (Reverse Transcriptase).

Figura 3.1 Structura virusului HIV

Virusul este alcătuit dintr-o anvelopă virală, o matrice de proteine şi un nucleu

viral. Anvelopa, ȋnvelişul exterior a virusului, este formată din două straturi de lipide.

Mai multe proteine sunt incluse ȋn anvelopă, formând „ace”: glicoproteina gp120 şi

transmembrana gp41. Gp120 este folosită pentru ataşarea de celula gazdă, iar gp41

este necesară ȋn procesul de fuziune. Matricea de proteine, alcătuită din proteinele

p17 este situată ȋntre anvelopă şi nucleu. Nucleul conţine o capsulă proteică, formată

din proteinele p24, ce ȋnconjoară cele două catene de ARN şi enzimele necesare

25

pentru replicare. Din cele nouă gene, menţionăm trei, numite gag, pol şi env, ce

conţin informaţiile necesare pentru creerea proteinelor structurale ale noilor particule

virale.

3.3 Ciclul de replicare a virusului

Virusul HIV are nevoie de o celulă gazdă pentru a supravieţui şi a se replica.

Pentru a se replica, virusul crează particule virale ȋn interiorul unei celule gazde, şi

aceste particule transportă virusul la celulele noi. Odată ce virusul intră ȋn corp,

acesta se ȋndreaptă spre ţesutul limfatic, unde găseşte celulele T-helper. Paşii ȋn

care virusul infectează sistemul imunitar şi se replică sunt următorii (Ferguson et al.

2002):

1. Legarea. Virusul se ataşează de celulele imunitare, iar glicoproteina gp120 se

leagă de proteinele CD4 a celulelor T-helper. Nucleul viral intră ȋn celula

gazdă şi membrana proteică a virionului fuzionează cu membrana celulei.

2. Transcripţia inversă. Enzima virală reverse transcriptase transformă ARN-ul

virusului ȋn ADN.

3. Integrarea. ADN-ul nou creat este transportat ȋn nucleul celulei de enzima

viral integrase şi fuzionează cu ADN-ul celulei. ADN-ul virusul HIV se numeşte

provirus.

4. Transcripţia. ADN-ul viral din nucleu se separă şi crează ARN

mesager(mARN) folosind propriile enzime ale celulei. ARN-ul mesager conţine

instrucţiuni pentru a crea noi proteine virale.

5. Translaţia. ARN-ul mesager este transportat ȋnapoi ȋn nucleu. Virusul

foloseşte apoi mecanismele de creare a proteinelor pentru a crea lanţuri de

proteine şi enzime virale.

6. Asamblarea. ARN-ul şi enzimele virale se adună la marginea celulei. O

enzimă numită protease desparte polipeptidele ȋn proteine virale.

7. Creerea. O nouă particulă HIV ne naşte din membrana celulei şi scapă cu o

bucată de membrană care o ȋnconjoară.

26

Figura 3.2 Ciclul de replicare a virusului

27

Capitolul 4

Simulări de dinamică moleculară

4.1 Scurtă prezentare a programelor folosite

VMD

VMD(Visual Molecular Dynamic) este un program de modelare şi vizualizare

moleculară dezvoltat de Universitatea Illinois. VMD a fost creat ca un instrument de

vizualizare şi analiză a simulărilor moleculare dinamice, dar conţine şi instrumente

pentru lucrul cu datele volumetrice, secvenţele de date şi obiectele grafice. De

asemenea, VMD are integrat şi translatori Python şi Tcl. Am folosit consola Tcl/Tc

pentru a comunica cu alte programe precum NAMD, program ce este prezentat ȋn

cele ce urmează.

NAMD

Programul NAMD(Not (just) Another Molecular Dynamics) este un pachet de

simulare moleculară dinamică ce foloseşte modelul de programare paralelă

Charm++. Programul este recunoscut pentru eficacitatea paralelă şi e folosit pentru a

simula sisteme de dimensiuni mari, de ordinul milioanelor de atomi. NAMD poate fi

conectat cu un program de grafică moleculară prin sistemul de comunicaţie, pentru a

furniza un instrument de modelare interactivă ȋn scopul vizualizării şi modificării unei

simulării aflate ȋn rulare. Programul a fost rulat prin intermediul Command Prompt

(cmd.exe).

Situs

Situs este un pachet modular de programe pentru modelarea „multi-scale” a

structurilor de rezoluţie atomică şi a datelor biofizice de rezoluţie mică obţinute ȋn

urma microscopiei electronice, tomografiei sau dispersiei sub unghi mic a razelor X.

Se poate realiza atât andocare rigidă, cât şi flexibilă, folosind o varietate de strategii

de fitare. Pentru a funcţiona şi pe Windows, pachetul de programe se rulează prin

intermediul Cygwin.

Chimera

Chimera este un program extensibil pentru vizualizarea şi analiza structurilor

moleculare şi a altor date, precum hărţi de densitate, ansambluri supramoleculare,

aliniere de secvenţe sau rezultatele andocărilor.

28

4.2 Prezentarea structurilor necesare fitărilor

După cum am prezentat şi ȋn subcapitolul 2.5.2, pentru a realiza o fitare

flexibilă avem nevoie de două tipuri de date de intrare: o hartă crio-EM şi o structură

atomică ce urmează să fie integrată ȋn hartă.

Structura 3DNO şi harta 5020

3DNO prezintă structura moleculară a trimerului gp120, aflat la ȋnvelişul

virusului HIV, ȋn starea de legare cu CD4. Structura a fost descoperită folosind

microscopia electronică la rezoluţia de 20.0 Å (PDBe 2008). Ansamblul constă ȋn

nouă molecule, iar structura sa vizualizată ȋn Chimera este reprezentată ȋn figura

următoare:

Figura 4.1 Reprezentarea structurii 3dno ȋn Chimera

Datele experimentale pe care structura se bazează au fost depozitate separat,

ȋn EMDB (Electron Microscopy Data Bank) ca intrarea 5020.

Ȋntucât nu e nevoie de toată harta, ci doar de o regiune a ei pentru a realiza

fitarea, am despărţit-o ȋn regiuni, şi am ales una din ele. Harta cuprindea patru

regiuni (39, 40, 41 şi 40). Pentru a realiza acest lucru, mai ȋntai am deschis harta ȋn

Chimera, după care am segmentat-o, pentru ca regiunile să poată fi vizualizate mai

uşor. Ȋn figura de mai jos este reprezentată harta 5020 ȋn Chimera:

29

Figura 4.2 Reprezentarea hărţii de densitate ȋn Chimera

După cum am mai zis, harta este ȋmpărţită ȋn patru regiuni: 39 colorată ȋn gri,

40 colorată ȋn verde, 41 colorată ȋn mov şi 42 colorată ȋn albastru. Am separat fiecare

regiune şi am ales să lucrez mai departe cu 42.

Figura 4.3 Regiunea 42

Structura 1GC1

Ȋn structura 1GC1 este reprezentat nucleul gp120 combinat cu CD4 şi cu un

anticorp uman de neutralizare. Această structură a fost determinată folosind difracţia

cu razele X la o rezoluţie de 2.5 Å . Mai multe detalii cu privire atât la această

structură, cât şi la altele se găsesc ȋn anexă.

30

Figura 4.4 Structura 1GC1 vizualizată ȋn Chimera

Aceasta structură este cea care va fi fitată ȋn harta de densitate 5020.

4.3 Fitare rigidă

De-a lungul timpului s-au dezvoltat câteva protocoale pentru a fita structurile

atomice, obţinute prin intermediul cristalografiei cu razele X sau prin NMR, ȋn hărţile

de densitate cu rezoluţie mică sau medie. Problema computaţională constă ȋn

determinarea celor şase grade de libertate, trei de rotaţie şi trei de translaţie.

Optimizarea CCC-ului consumă cantităţi semnificative din timpul de calcul. Pentru a

reduce acest timp se foloseşte FFT (Fast Fourier Transformation), ce accelerează

căutarea translaţională şi este implementat ȋn programul „Colores” din pachetul Situs.

Astfel doar cele trei grade de rotaţie sunt căutate ȋn spaţiul real, ȋn timp ce gradele

de translaţie sunt căutate ȋn spaţiul Fourier.

Primul pas a fost să transform harta regiunii 42 din format „mrc” ȋn format

situs. Acest lucru a fost realizat ȋntrucât programele folosite lucrează cu acest tip de

format. Ȋn cadrul liniei de comandă din cygwin am tastat:

./map2map molmap42.mrc molmap42.situs

Fitarea rigidă a fost realizată prin intermediul intrumentului „colores”. Tot ȋn

cygwin am tastat:

./colores molmap42.situs 1gc1.pdb -res 20.0

„Colores” constă ȋn trei paşi separaţi: o căutare rigidă ȋntru-un cadru 6D

discret, o detectare automată a vârfurilor, bazată pe scorurile corelate din cadru

31

(detecţie ce returnează un set de soluţii) şi o rafinare a soluţiilor apropiate de scorul

maxim de corelare. Astfel s-au generat, pe lângă altele, fişierele col_best001,

col_best002, col_best003 ce conţin coordonatele atomice a celei mai bune fitări

găsite ȋn cadrul căutării, ȋn format PDB.

Rezultatul vizualizat ȋn VMD este următorul:

Figura 4.5 Fitare rigidă

Am vizualizat ȋn Chimera, pe rând, harta ȋn format situs ȋmpreună cu cele trei

fişiere generate.

molmap42.situs ȋmpreuna cu col_best001

Figura 4.6 Varianta 1 de fitare

32





Se observă că cea mai bună fitare rigidă este cea din varianta 1.

4.4 Fitare flexibilă

Nu ȋntotdeauna fitarea rigidă este cea mai bună variantă. Când schimbări

conformaţionale ale componentelor au loc ȋn timpul formării complexului, fitarea

rigidă este neadecvată. Procedurile de fitare care permit schimbări conformationale

sunt fitările rigide, ce iau ȋn consideraţie un subset mai mic de de schimbări

33

conformaţionale. Pentru a realiza acest lucru, am folosit ȋn continuare pachetul de

programe Situs.

Ȋn partea anterioară am transformat harta din format „mrc” ȋn format „situs” şi

am generat mai multe posibilităţi de fitare, dintre care am ales una: „col_best001”. De

aceste fişiere avem nevoie şi pentru fitarea flexibilă.

Cuantizarea vectorială a structurii

Cuantizarea vectorială este o tehnică de cuantizare care permite modelarea

funcţiilor de densitate de probabilitate prin distribuţia vectorilor. Aceasta funcţionează

prin ȋmpărţirea unui set mare de puncte ȋn grupuri ce au aproximativ acelaşi număr

de puncte ȋn apropierea lor. Această metodă este utilă ȋn identificarea densităţii

datelor mari şi de rezoluţie mare.

Cuantizarea vectorială se realizează ȋn Situs prin intermediul funcţiei „qpdb”.

./qpdb col_best_001.pdb col_best_001.qpdb

Ca intrare vom avea fişierul generat ȋn fitarea rigidă şi ca ieşire un fişier ce

conţine vectorii de cuantizare. Această funcţie este interactivă, adică pe parcursul

execuţiei cere utilizatorului niste informaţii precum:

dacă să excludă atomii de apă

dacă să selecteze atomii bazaţi pe factorul B de prag

numărul vectorilor de cuantizare

dacă să se salveze anumite date ȋn fişier

Figura 4.9 Funcţia „qpdb”

Cuantizarea vectorială a hărţii

Pentru cuantizarea vectorială a hărţii vom utiliza funcţia „qvol”. Ca intrare vom

avea fişierul ȋn format „situs” ce conţine date despre hartă şi vectorii obţinuţi ȋn pasul

anterior cu funcţia „qpdb”.

./qvol molmap42.situs col_best_001.qpdb molmap42.qvol

Şi această funcţie este interactivă. Trebuie să oferim informaţii precum:

34

dacă vrem să verificăm valorile densităţilor

densitatea de tăiere

dacă vrem să optimizăm vectorii de intrare

dacă vrem să adăugăm constrângeri de distanţă

dacă vrem să salvăm anumite date

Figura 4.10 Funcţia „qvol”

Fitarea flexibilă folosind interpolarea

Fişierele generate ȋn paşii anteriori le folosim pentru a aproxima fitarea, prin

interpolare. Aceasta se realizează prin funcţia „qplasty” ce realizează o fitare flexibilă

aproximativă a datelor de rezoluţie atomică bazată pe un model de intrare a

deplasărilor destul de grosier.

./qplasty col_best_001.pdb col_best_001.qpdb molmap42.qvol final.pdb

Structura fitată a fost scrisă ȋn fişierul „final.pdb”.

Figura 4.11 Funcţia „qplasty”

35

Rezultatele fitării flexibile

Pentru a vedea rezultatele am folosit programul Chimera. Aici am deschis fişierul

rezultat „final.pdb” peste care am suprapus harta. Figurile următoare exprimă

rezultatul final pentru mai multe valori ale densitătii de tăiere:

Figura 4.12 Fitare flexibilă cu densitatea de tăiere 0

Figura 4.13 Fitare flexibilă cu densitatea de tăiere 1

36

Figura 4.14 Fitare flexibilă cu densitatea de tăiere 2.4

4.5 Dinamica folosind NAMD

Pentru a aprofunda mai bine dinamica moleculară şi a sublinia utilitatea

programului NAMD, am realizat o dinamică pe 1I5Y.pdb. Aceasta intrare conţine

structura glicoproteinei transmembranale gp41. Mai multe detalii despre această

structură se găseşte ȋn anexă. Pentru aceasta am folosit linia de comandă MS-DOS

din cadrul Windows-ului şi programul de vizualizare moleculară VMD.

Figura 4.15 Structua 1i5y vizualizată ȋn VMD

Pe lângă pdb-ul folosit, a fost necesară creerea unui fişier PSF (Protein

Structure File) ce conţine toate informaţiile referitoare la molecule, informaţii utile

pentru a aplica un câmp de forţe unui sistem molecular. Cum structurile obţinute prin

cristalografia cu razele X nu conţin atomii de hidrogen, a fost necesară creerea

acestui fişier ȋntrucât conţine nişte coordonate intuite pentru atomii de hidrogen ai

structurii. Operaţiile pentru generarea acestuia se pot realiza fie prin intermediul

VMD-ului, fie manual. Ȋn urma acestora s-au obţinut două fişiere, unul ȋn format pdb,

37

ce conţine coordonatele tuturor atomilor, inclusiv cei de hidrogen, şi cel ȋn format psf

ce conţine informaţia structurală a proteinei.

Figura 4.16 Creerea fişierului „psf” ȋn VMD

Solvatarea proteinei

Pentru a semăna mai mult cu un mediu celular, proteina trebuie sa fie

solvatată, adică introdusă ȋn apă. Aceasta se realizează ȋn două feluri, plasând

molecula ȋntr-o sferă de apă, ȋn pregătire pentru minimizare şi echilibrare fară condiţii

de limită, sau ȋntr-un cub de apă, ȋn pregătire pentru minimizare şi echilibrare cu

condiţii de limită.

Pentru a realiza acest lucru se rulează fişierul „wat_sphere.tcl”, ce va

introduce molecula ȋn sferă şi va genera două tipuri de fişiere, unul psf ce conţine

informaţii structurale şi unul pdb, ce conţine informaţii despre coordonate. De

asemenea se mai obţin informaţiile din tabelul de mai jos:

x y z

Centrul masei sferei

46.177093505859375 4.489715099334717 -2.5021438598632

Raza sferei 28.492280236344456

Tabelul 4.1 Coordonatele centrului de masă şi raza sferei

Structura obţinută este reprezentată ȋn figura de mai jos:

38

Figura 4.17 Molecula ȋntr-o sferă de apă

Pentru a creea cubul de apă, folosim ȋn VMD comanda de mai jos. Pachetul

„Solvate” va pune proteina ȋntr-un cub, folosind cele două fişiere generate când am

creat sfera de apă. Se vor crea două fişiere, unul de tip „psf” şi unul de tip „pdb”.

package require solvate solvate i5y.psf i5y.pdb -o i5y_wb

Figura 4.18 Molecula ȋntr-un cub de apă

Centrul cubului de apă se află din media aritmetică dintre minim şi maxim

pentru fiecare coordonată ȋn parte. Rezultatele sunt trecute ȋn tabelul de mai jos:

x y z

Minim 26.6140032 -10.58100032 -33.530998

Maxim 64.68699645 18.64900016 29.652999

Centru 45.6415824 3.982120513 -2.02047824

Tabelul 4.2 Minimul, maximul şi coordonatele centrului de masă

39

Simulare cu condiţii de limită non-periodice

Creerea unei sfere de apă nu este necesară, dar e utilă ȋntrucât minimizarea şi

echilibrarea din cadrul cubului de apă va duce la deformarea ȋn cea mai stabilă formă

posibilă, sfera. Astfel, creerea sferei la ȋnceputul simulării reduce cantitatea de timp

necesară pentru a ajunge la echilibru, şi reduce efortul computaţional.

După cum am precizat şi mai sus, trebuie sa efectuăm operaţiile de

minimizare şi echilibrare. Pentru a minimiza energia se caută ȋn cadrul energetic a

moleculei un minim local prin varierea poziţiilor atomilor şi calcularea energiei. Pentru

echilibrare folosim dinamica moleculară, unde, pentru fiecare atom din sistem este

rezolvată legea a doua a lui Newton. Aceste lucruri se realizează folosind NAMD prin

intermediul unui fişier denumit „i5y_ws_eq.conf”. Acesta cuprinde mai multe funcţii

explicate pe secţiuni:

Parametrii ini ţiali

Ca intrare vom avea fişierele obţinute atunci când am introdus molecula ȋn

sfera de apă, ȋn ambele formate. De asemenea vom crea şi o variabilă numită

„temperature” care va avea o valoare medie, 310K. Toate datele generate vor avea

denumirea „i5y_ws_eq” şi diferite extensii.

Parametrii de simulare

Primul pas este să specificăm faptul că fişierul parametru este ȋn formatul

folosit de câmpul de forţă CHARMM. Pasul al doilea este de a apela parametrii

câmpului de forţa din fişierul specificat, fişier ce poate fi folosit pentru toate

proteinele.

Funcţia „exclude” specifică care din interacţiunile atomice nu vor fi luate ȋn

considerare. Ȋn acest caz interacţiunile dintre atomii 1 şi 2, respectiv 1 şi 3 sunt

neglijate. Funcţia „1-4scaling” specifică cât de mult vom lua ȋn considerare

interacţiunea electrostatică dintre atomii 1 şi 4. Funcţia „cut-off” indică distanţa peste

care interacţiunile electrostatice şi van der Waals sunt desconectate. Funcţia

switching setată pe „on” indică faptul că se vor folosi funcţii de comutare pentru a

40

seta interacţiunile electrostatice şi van der Waals la valoarea 0 atunci când se atinge

valoarea de „cut-off”. Toate aceste valori sunt specificate de CHARMM.

Mai ȋntâi vom stabili valoarea pasului de timp utilizat ȋn simulare. Simulările de

dinamică moleculară rezolvă ecuaţiile legii lui Newton printr-o aproximare discretă

pentru a determina traiectoriile atomilor. Pasul de timp specifică cum vor fi

discretizate particulele dinamice. „RigidBonds” setat pe valoarea „all” specifică faptul

că toate legăturile vor fi considerate rigide. „NonbondedFreq” indică faptul că

interacţiunile fară legătură sunt calculate la fiecare pas, iar „FullElectFrequency” ne

spune cât de des vor fi calculate interacţiunile complet electrostatice.

Ȋn această secţiune stabilim faptul că vom folosi dinamica Langevin, şi vom

seta valoarea coeficientului de amortizare la o valoare minimă astfel ȋncât să avem o

dinamică bună iar temperatura să fie menţinută constantă la 310K. De asemnenea

mai precizăm faptul că dinamica Langevin nu va fi aplicată atomilor de hidrogen din

simulare.

Ȋn urma rulării se vor genera mai multe tipuri de fişiere. Ȋn primul rând vom

avea un „pdb” ce va conţine coordonatele finale ale tuturor atomilor din sistem şi tot

un „pdb” ce va conţine velocităţile finale a tuturor atomilor din sistem. De asemenea,

atât pentru coordonate cât şi pentru viteze se vor mai scrie două fişiere de restart la

fiecare 500 de paşi. „Dcdfreq” conţine numai coordonatele atomice, ce sunt scrise la

fiecare 250 de paşi, creând astfel traiectoria sistemului peste timpul de rulare.

”OutputEnergies” şi „OutputPressure” specifică numărul paşilor de timp ȋntre fiecare

ieşire a energiei, respectiv a presiunii.

41

Parametrii suplimentari

Ȋn această secţiune precizăm faptul că vom utiliza condiţiile de limită. Vom

introduce datele din tabelul 4.1. „SphericalBCk1” este o constantă aleasă arbitrar, iar

„sphericalBCexp1” ia, de obicei valoarea 2 ( potenţialul pătratic).

Scriptul de execuţie

Aici setăm numărul de iteraţii la care se variază poziţiile atomilor pentru a

căuta un minim local ȋn potenţial. Minimizarea este realizată după ce toate velocităţile

au fost setate la 0. Comanda „reintvels” resetează velocităţile astfel ȋncât sistemul să

ȋnceapă la temperatura 310. Comanda „run” specifică numărul de paşi pe care se

rulează echilibrarea dinamică.

Fişierul creat se va rula cu NAMD:

namd2 i5y_ws_eq.conf > i5y_ws_eq.log &

Unul dintre fişierele generate este „i5y_ws_eq.log”. Acesta conţine date

despre parametrii folosiţi ȋn rulare, informaţii despre sistem, informaţii despre

minimizare şi date despre echilibrare.

Figura 4.19 Date privitoare la minimizare ȋn cazul sferei de apă

42

Figura 4.20 Date privitoare la echilibrare ȋn cazul sferei de apă

Simulare cu condiţii de limită periodice

Folosirea condiţiilor de limită periodice presupune ȋnconjurarea sistemului cu

celule identice virtuale. Atomii din sistemul virtual interacţionează cu atomii din

sistemul real. Aceste condiţii de modelare sunt eficace ȋn eliminarea interacţiunilor de

suprafaţă a moleculelor de apă şi creerea unei reprezentări mai fidele decât ȋn cazul

sferei de apă.

Pentru a realiza această simulare, trebuie să se creeze un fişier de

configurare. Acesta, va avea, pe lângă câmpurile de mai sus, următoarele două

secţiuni ȋn cadrul parametrilor de simulare:

„CellBasisVector1”, „CellBasisVector2”, şi „CellBasisVector1” reprezintă

dimensiunile cubului şi se exprimă ca diferenţa, ȋn modul, dintre minim şi maxim

pentru fiecare dintre coordonatele x, y, z, iar ȋn „cellOrigin” sunt reprezentate

coordonatele centrului de masă (Tabelul 4.2) .

43

PME (Particle Mesh Ewald) este o metodă de a lucra cu interacţiunile

electrostatice atunci când sunt prezente condiţiile de limită periodice. Suma Ewald

este o metodă eficientă de a calcula forţele ȋntr-un sistem periodic. „PMEGridSize”

defineşte manual dimensiunea grilei. Trebuie să poată fi despărţit ȋn factori primi cât

mai mici (2, 3, 5) şi valoarea să fie cât mai aproape pe „cellBasisVector”. De exemplu

40=23*8 (aproape de 39); 32=25 (aproape de 30) şi 64=26 (aproape de 63.5).

„UseGroupPressure” este folosit atunci când se calculează presiunea

sistemului pe baza forţelor apărute ȋntre atomi şi energiile lor cinetice. Această

comandă stabileşte dacă interacţiunile cu privire la hidrogen se iau ȋn calcul pentru

toţi atomii de hidrogen sau doar ȋntre grupuri de atomi de hidrogen. Această valoare

este setată pe „yes” dacă „rigidBonds” este setată pe „on”. „LangevinPiston”

stabileşte dacă simularea va folosi un piston Langevin pentru a controla presiunea.

Dacă da, se stabileşte şi o valoare care să fie menţinută de piston (1bar). Constantei

de amortizare ȋi este atribuită valoarea prin „langevinPistonDecay”. Temperatura va

avea aceeaşi valoare cu cea iniţială.

4.21 Date privitoare la minimizare ȋn cazul cubului de apă

44

4.22 Date privitoare la echilibrare ȋn cazul cubului de apă

Proteina ȋn solvent implicit

Un model cu solvent implicit este o tehnică de simulare prin care se elimină

necesitatea atomilor de apă prin includerea efectelor solventului ȋn calcularea forţelor

inter-atomice. Deşi viteza de simulare ȋn acest caz este mai mare, precizia este mai

mică. GBIS (General Born Implicit Solvent) este o clasă particulară a modelelor cu

solvent implicit. Calculul acestei metode se realizează ȋn două părţi. Ȋn primul rând

este calculată raza Born pentru fiecare atom. Aceasta reprezintă gradul de expunere

a unui atom la solvent. Ȋn al doilea rând, atât pe baza separării atomice, cât şi pe

baza mediei geometrice dintre razele Born dintre doi atomi, sunt calculate forţele

electrostatice inter-atomice.

Vom crea ȋncă un fişier de configurare, care are ȋn plus faţă de câmpurile

despre care am discutat până acum, secţiunea pentru solvent implicit:

„Gbis” stabileşte dacă simularea foloseşte sau nu metoda GBIS. Implicit

aceasta are valoarea „off”, deci trebuie setată. „AlphaCutoff” setează cutoff-ul folosit

pentru a determina raza Born pentru fiecare atom. Aceasta trebuie sa aibă o valoare

mai mica decât valoarea „cutoff”. „IonConcentration” setează concentraţia ionilor

impliciţi.

45

Figura 4.23 Date privitoare la minimizare ȋn cazul GBIS

Figura 4.24 Date privitoare la echilibrare ȋn cazul GBIS

Root Square Deviation (RMSD)

Pentru a analiza ȋn ce măsură sistemul a fost echilibrat, se va folosi RMSD

(Root Mean Square Deviation), metodă prezentată ȋn capitolul 2.5.2. RMSD ne

spune cu cât o selecţie dată din moleculă deviază de la o poziţie definită ȋn spaţiu.

Sunt două metode de a calcula RMSD-ul: pentru ȋntreaga proteină şi pentru proteina

fără ultimile cinci reziduuri. Simularea pe care am realizat-o cu NAMD a generat un

fişier numit „i5y_ws_eq.dcd”. Acesta conţine o traiectorie a sistemului ce este folosită

ȋn calculul RMSD-ului proteinei.

Figura 4.25 Traiectoria proteinei

46

Ȋn continuare voi prezenta câteva grafice:

Figura 4.26 Dependenţa timp – temperatură

Figura 4.27 Dependenţa timp – energie

Temperatura şi energia ne ajută să observăm date despre stabilitatea

termodinamică a ȋntregului sistem. Pentru a vedea dacă ȋntreaga proteină este

stabilă, vom calcula RMSD. Graficele pentru aceasta sunt realizate ȋn Microsoft

Excel.

47

Figura 4.28 RMSD pentru ȋntreaga proteină

Ultimile cinci reziduuri sunt relativ instabile comparate cu restul proteinei. De

aceea calculăm un nou RMSD pentru proteină fară ultimile cinci reziduuri. Graficul

acestuia este prezentat ȋn figura următoare:

Figua 4.29 RMSD pentru proteina fară ultimile cinci reziduuri

48

Capitolul 5

Concluzii

Virusul HIV rămâne una din cele mai mari provocări ale sănătăţii publice, mai

ales ȋn ţările cu venit scăzut şi mediu. Acest virus infectează celulele sistemului

imunitar, şi duce la deteriorarea progresivă a acestuia. Astfel corpul nu mai are

abilitatea de a lupta contra infecţiilor sau a altor boli. SIDA este cea mai avansată

etapă din cadrul infecţiei cu virusul HIV şi este definită prin apariţia a 20 de infecţii

oportuniste sau cancer.

De-a lungul timpului mai mulţi oameni de ştiinţa au lucrat pentru găsirea unui

leac ȋmpotriva acestui virus. Totuşi ȋn momentul de faţă nu există o soluţie pentru

vindecarea definitivă a acestuia. Când ne referim la un tratament vorbim despre

terapii, precum HAART (High Active Antiretroviral Therapy), ce ȋncetineşte progresia

bolii sau tratamente active şi preventive a infecţiilor oportunistice.

Ȋn această lucrare am vrut să subliniez importanţa cunoaşterii acestui virus.

Pentru a avea cea mai mică şansă ȋn tratarea acestui virus, ȋn viitorul apropiat, este

necesar să cunoaştem modalitatea ȋn care funcţionează şi se multiplică. Astfel putem

realiza simulări şi observa detalii pe care nu le-am observa cu ochiul liber. Ȋnsă,

avem nevoie de cunoştiinţe din mai multe domenii, domenii ce sunt prezentate pe

scurt de-a lungul lucrării.

Cea mai importantă parte din procesul de infectare este formarea legăturii

dintre glicoproteina gp120, aflată la ȋnvelişul virusului şi receptorul CD4, aflat la

suprafaţa celulei gazdă. Tot acest mecanism a fost explicat pe larg ȋntr-un capitol

anterior deoarece avem nevoie de cât mai multe date pentru a putea realiza o

dinamică moleculară adecvată.

Ȋnţelegerea structurii şi variaţiei structurale a anvelopei virusului la cea mai

mare rezoluţie este una din cele mai mari ȋncercări ale biologiei structurale. De

asemenea joacă şi un rol important ȋn proiectarea unui vaccin pentru protejarea

ȋmpotriva virusului. Dezvoltările recente din acest domeniu ilustrează faptul că

integrarea informaţiilor obţinute din cristalografia cu razele X, spectrografia NMR,

microscopia crio-EM şi tomografie poate fi un instrument pentru a ȋnţelege structura

anvelopei şi mecanismul viral de intrare. Totuşi, deşi aceste metode sunt foarte utile,

ele sunt greu de manevrat pe structuri complexe. Modelarea computaţională

analizează necesitatea de a găsi modalităţi de a integra toate datele experimentale

ȋn modele structurale semnifictive. Ȋndeplinirea acestor scopuri cere, ȋnsă, avansări

tehnologice ȋn toate domeniile asociate.

49

Anexă

Cod PDB 1GC1

Nume moleculă HIV-1 gp120 core complexed with CD4 and a

neutralizing human antibody

Rezoluţie 2.5 Å

Data publicare 1998

Metoda X-ray

Publicată ȋn

Structure of an HIV gp120 envelope glycoprotein

in complex with the CD4 receptor and a

neutralizing human antibody.

Imagine

Harta de densitate simulată

50

Cod PDB 3DNO

Nume moleculă Complex of 3 biomacromolecules, namely HIV-

1 envelope glycoprotein gp120.

Rezoluţie 20.0 Å

Data publicare 2008

Metoda Electron microscopy

Publicată ȋn

Molecular architecture of native HIV-1 gp120

trimers.

Imagine


51

Cod PDB 1I5Y

Nume moleculă Structure of transmembrane glycoprotein

(gp41)

Rezoluţie 2.1 Å

Data publicare 2001

Metoda X-ray

Publicată ȋn

Structural and functional analysis of

interhelical interactions in the human

immunodeficiency virus type 1 gp41 envelope

glycoprotein by alanine-scanning

Imagine


52

Cod PDB 3CYO

Nume moleculă

Structure of a longer thermalstable core domain

of HIV-1 GP41 containing the enfuvirtide

resistance mutation N43D and complementary

mutation E137K

Rezoluţie 2.1 Å

Data publicare 2008

Metoda X-ray diffraction

Publicată ȋn

Impact of the enfuvirtide resistance mutation

N43D and the associated baseline polymorphism

E137K on peptide sensitivity and six-helix

bundle structure.

Imagine


53

Cod PDB 3DNL

Nume moleculă Complex of 3 biomacromolecules, namely

HIV-1 envelope glycoprotein gp120.

Rezoluţie 20.0 Å

Data publicare 2008

Metoda Electron microscopy

Publicată ȋn Molecular architecture of native HIV-1

gp120 trimers.

Imagine


54

Cod PDB 1ENV

Nume moleculă

Structure of HIV-1 envelope protein

Chimera consisting of a fragment of GCN4

zipper cloned n-terminal to two fragments

of gp41

Rezoluţie 2.6 Å

Data publicare 1997


Publicată ȋn

Atomic structure of the ectodomain from

HIV-1 gp41.

Imagine


55

Cod PDB 1I5X

Nume moleculă

HIV-1 gp41 core

Rezoluţie 1.8 Å

Data publicare 2001


Publicată ȋn

Structural and functional analysis of

interhelical interactions in the human

immunodeficiency virus type 1 gp41

envelope glycoprotein by alanine-scanning

mutagenesis.

Imagine


56

Bibliografie

Allen Michael P. 2004. Introduction to Molecular Dynamics Simulation. Computational Soft

Matter: From Synthetic Polymers to Proteins vol. 23; p. 1-28.

Becker Oren M., MacKerell Alexander D. Jr., Roux Benoit, and Wantanabe Masakatsu. 2001.

Computational Biochemistry and Biophysics. New York; p. 7-68.

Ferguson Monique R., Rojo Daniel R, Lindern Jana J., and O’Brien William. 2002. HIV-1

Replication Cycle. Clinics in Laboratory Medicine vol. 22; p. 42-51.

Hehre Warren J. 2003. A Guide to Molecular Mechanics and Quantum Chemical

Calculations. Irvine, California.

Pavel Ana Branduşa, Vasile Cristian, and Buiu Cătălin. 2011. Biomatematică şi

Bioinformatică. Concepte şi Aplicaţii. Bucureşti; p. 111-127.

PDBe. 2008. PDBeView - PDB Entry 3dno. http://www.ebi.ac.uk/pdbe-

srv/view/entry/3dno/summary.html, accesat la data 03.06.2013.

University of Massachusetts Lowell. 2008. Molecular Mechanics.

http://faculty.uml.edu/vbarsegov/teaching/bioinformatics/lectures/MolecularMechanics

Modified.pdf, accesat la data 10.06.2013.

Sirovich L., Kohn P. S., and Krishnaprasad R. V.. 2010. Interdisciplinary Applied

Mathematics. New York; p. 237-298.

Trabuco G. Leonardo, Villa Elizabeth, Mitra Kakoli, Frank Joachim, and Schulten Klaus.

2008. Flexible Fitting of Atomic Structures into Electron Microscopy Maps Using

Molecular Dynamics. Structure; p. 673-83.

Trabuco Leonardo G, Villa Elizabeth, Schreiner Eduard, Harrison Christopher B., and

Schulten Klaus. 2009. Molecular Dynamics Flexible Fitting: a Practical Guide to

Combine Cryo-electron Microscopy and X-ray Crystallography. Methods; p. 174-80.

UNAIDS. 2008. Know Your Epidemic (Epidemiology).

http://www.unaids.org/en/dataanalysis/knowyourepidemic/, accesat la data 10.06.2013.

Wikipedia. 2006. HIV - Wikipedia, the Free Encyclopedia. http://en.wikipedia.org/wiki/HIV,

accesat la data 10.06.2013.

———. 2007. Biology - Wikipedia, the Free Encyclopedia.

http://en.wikipedia.org/wiki/Biology, accesat la data 10.06.2013.

———. 2009. Virus - Wikipedia, the Free Encyclopedia. http://

http://en.wikipedia.org/wiki/Virus, accesat la data 10.06.2013.

http://faculty.uml.edu/vbarsegov/teaching/bioinformatics/lectures/MolecularMechanicsModified.pdf

http://faculty.uml.edu/vbarsegov/teaching/bioinformatics/lectures/MolecularMechanicsModified.pdf

57

———. 2010. Electron Density Aniline - Wikipedia, the Free Encyclopedia.

http://en.wikipedia.org/wiki/Electron_density, accesat la dat 19.06.2013.

Buzon Victor, Natrajan Ganesh, Schibli David, Campelo Felix, Kozlov Michael M., and

Weissenhorn Winfried. 2010. Crystal Structure of HIV-1 Gp41 Including Both Fusion

Peptide and Membrane Proximal External Regions. PLoS Pathogens.

Curtis B. M., Scharnowske S., and Watson J.. 1992. Sequence and Expression of a

Membrane-associated C-type Lectin That Exhibits CD4-independent Binding of Human

Immunodeficiency Virus Envelope Glycoprotein Gp120. Proceedings of the National

Academy of Sciences of the United States of America; p. 8356-60

Gadhe Changdev G., Kothandan Gugan, Madhavan Thirumurthy, and Cho Seung Joo. 2011.

Molecular Modeling Study of HIV-1 Gp120 Attachment Inhibitors. Medicinal Chemistry

Research vol 21.

Kwong P. D., Wyatt R., Robinson J., Sweet R. W., Sodroski J., and Hendrickson W. . 1998.

Structure of an HIV Gp120 Envelope Glycoprotein in Complex with the CD4 Receptor

and a Neutralizing Human Antibody. Nature vol 393; p. 648-59.

Chan Kwok-yan, and Trabuco Leonardo G. . 2013. Molecular Dynamics Flexible Fitting.

http://www.ks.uiuc.edu/Training/Tutorials/science/mdff/tutorial_mdff-html, accesat la

data 16.06.2013

Stone John. 2012. Using VMD. http://www.ks.uiuc.edu/Training/Tutorials/vmd/tutorial-

html/index.html, accesat la data 12.04.2013.

Phillips James, Villa Elizabeth, Yu Hang, Tanner David, and Liu Yanxin. 2012. Namd

Tutorial. http://www.ks.uiuc.edu/Training/Tutorials/namd/namd-tutorial-win-

html/index.html, accesat la data 02.06.2013.

Merk Alan, and Subramaniam Sriram. 2013. HIV-1 Envelope Glycoprotein Structure. Current

Opinion in Structural Biology vol 23; p. 1-9 .

Meyerson Joel R., Tran Erin E. H., Kuybeda Oleg, Chen Weizao, Dimitrov Dimiter S.,

Gorlani Andrea, Verrips Theo, Lifson Jeffrey D., and Subramaniam Sriram. 2012.

Molecular Structures of Trimeric HIV-1 Env in Complex with Small Antibody

Derivatives. Proceedings of the National Academy of Sciences of the United States of

America vol 110; p. 513-518

Neale G. 1990. B12 Binding Proteins. Gut 31

http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=1378341&tool=pmcentrez&r

endertype=abstract, accesat la data 14.06.2013.

Yokoyama Masaru, Naganawa Satoshi, Yoshimura Kazuhisa, Matsushita Shuzo, and Sato

Hironori. 2012. Structural Dynamics of HIV-1 Envelope Gp120 Outer Domain with V3

Loop. PloS One 7 vol 5.

Zhu Ping, Winkler Hanspeter, Chertova Elena, Taylor Kenneth , and Roux Kenneth H.. 2008.

Cryoelectron Tomography of HIV-1 Envelope Spikes: Further Evidence for Tripod-like

Legs. PLoS Pathogens vol 4.

58

Alam S Munir, Morelli Marco, Dennison S. Moses, Liao Hua-Xin, Zhang Ruijun, Xia Shi-

Mao, Rits-Volloch Sophia. 2009. Role of HIV Membrane in Neutralization by Two

Broadly Neutralizing Antibodies. Proceedings of the National Academy of Sciences of

the United States of America; p. 20234-9

Bai Xuefang, Wilson Karen L., Seedorff Jennifer E., Ahrens Douglas, Green Justin, Davison

Donna K., Jin Lei. 2008. Impact of the Enfuvirtide Resistance Mutation N43D and the

Associated Baseline Polymorphism E137K on Peptide Sensitivity and Six-Helix Bundle

Structure. Biochemistry; p. 6662–6670

Bartesaghi A., Sprechmann P., Liu J., Randall G., Sapiro G., and Subramaniam S.. 2008.

Classification and 3D Averaging with Missing Wedge Correction in Biological Electron

Tomography. Journal of Structural Biology ; p. 436-50

Bartesaghi Alberto, Lecumberry Federico, Sapiro Guillermo, and Subramaniam Sriram. 2012.

Protein Secondary Structure Determination by Constrained Single-particle Cryo-

electron Tomography. Structure; p. 2003-13

Blumenthal Robert, Durell Stewart, and Viard Mathias. 2012. HIV Entry and Envelope

Glycoprotein-mediated Fusion. The Journal of Biological Chemistry; p. 40814-9

Caffrey M., Cai M., Kaufman J., Stahl S. J., Wingfield P. T., Covell D. G., Gronenborn A.

M., and Clore G. M.. 1998. Three-dimensional Solution Structure of the 44 kDa

Ectodomain of SIV Gp41. The EMBO Journal; p. 4572-84

Cardoso Rosa F., Zwick Michael B., Stanfield Robyn L., Kunert Renate, Binley James M.,

Katinger Hermann, Burton Dennis R. and Wilson Ian A.. 2005. Broadly Neutralizing

anti-HIV Antibody 4E10 Recognizes a Helical Conformation of a Highly Conserved

Fusion-associated Motif in Gp41. Immunity vol 22; p. 163-73.

Chan David C., Fass Deborah, Berger James M., and Kim Peter S.. 1997. Core Structure of

Gp41 from the HIV Envelope Glycoprotein. Cell vol 89; p. 263-273.

Chen Lei, Kwon Young Do, Zhou Tongqing, Wu Xueling, O’Dell Sijy, Cavacini Lisa,

Hessell Ann J. . 2009. Structural Basis of Immune Evasion at the Site of CD4 Attachment

on HIV-1 Gp120. Science; p. 1123-7.

Choe H.. 1996. The Beta -Chemokine Receptors CCR3 and CCR5 Facilitate Infection by

Primary HIV-1 Isolates. Cell.

Chong Huihui, Yao Xue, Sun Jianping, Qiu Zonglin, Zhang Meng, Waltersperger Sandro,

Wang Meitian, Cui Sheng, and He Yuxian. 2012. The M-T Hook Structure Is Critical for

Design of HIV-1 Fusion Inhibitors. The Journal of Biological Chemistry; p. 850-6.

Deng H., Liu R., W. Ellmeier, Choe S., Unutmaz D., Burkhart M., Di Marzio P. . 1996.

Identification of a Major Co-receptor for Primary Isolates of HIV-1. Nature; p. 661-6.

Diskin Ron, Marcovecchio Paola M., and Bjorkman Pamela J.. 2010. Structure of a Clade C

HIV-1 Gp120 Bound to CD4 and CD4-induced Antibody Reveals anti-CD4

Polyreactivity. Nature Structural & Molecular Biology; p. 608-13.

Documents

LUCRARE DE DIPLOMӐ - ACSE Departmentacse.pub.ro/wp-content/uploads/2013/07/Licenta-Ungureanu-Ioana.pdf · 1.Introducere. Formularea problemei. ... farmacologie, medicină. Cum cantitatea