13
1 Varijacije u broju kopija 1. Novo pitanje genomike : Genom čoveka ili genomi ljudi? Genomika je naučna oblast koja je nastala kao rezultat dostignuća molekularne biologije i razvoja tehnika kojima je moguće odrediti redosled nukleotida u molekulima nukleinskih kiselina. Naziv genomika nastao je dodavanjem sufiksa omika na reč gen. Sufiks omika je grčkog porekla i znači sve, svako, potpuno, kompletno. Predmet istraživanja genomike su genomi kako živećih tako i izumrlih vrsta. Početak 21. veka obeležen je završetkom najvećeg i najskupljeg naučnog projekta iz oblasti molekularne biologije, dešifrovanje sekvence genoma čoveka. Internacionalni konzorcijum „Genom čoveka“ rezultate svoga rada objavljuje 15. februara 2001. godine u časopisu „Nature. Samo dan kasnije tim naučnika kompanije Celera Genomics objavljuje svoje rezultate dešifrovanja genoma čoveka u časopisu „Science“. Tom prilikom data je i preliminarna procena da genomi različitih individua poseduju 99,9% identičnu sekvencu. Aprila 2003. godine dobijena je kompletna sekvenca genoma čoveka, dok je broj gena procenjen na oko 30000 u oktobru 2004. godine. Od tada, svake godine svedoci smo nove revizije broja gena čoveka. Prema skorašnjim podacima naš genom poseduje manje od 20000 gena koji kodiraju za proteine. Rezultati projekta ENCODE (eng. Encyclopedia of DNA Elements) pokazuju da genom čoveka poseduje više gena koji kodiraju regulatorne molekule RNK nego gena koji kodiraju proteine (Tabela 1). Tabela 1. Inventar genoma čoveka Vrste gena Broj gena Geni koji kodiraju proteine 19797 Geni koji kodiraju duge nekodirajuće RNK 15931 Geni koji kodiraju male nekodirajuće RNK 9882 Psudogeni 14477 Ukupan broj gena 60498 Do početka 2016. godine kompletno su dešifrovani genomi preko 8000 vrsta, dok su za preko 33000 vrsta objavljeni preliminarni draftovi genoma. U toku je i sekvenciranje preko 35000 genoma. Na osnovu dešifrovanja genoma razlizičitih vrsta razvila se i nova naučna disciplina komparativna genomika. Osnovni cilj ove naučne discipline je upoređivanje genoma različitih vrsta u cilju identifikacija njihovih sličnosti i razlika, naročito na nivou gena i drugih funkcionalnih elemenata genoma, kao što su promotori i regulatorni elemenati. Na osnovu rezultata ovih istraživanja smatra se da će komparativna genomika pomoći u razumevanju funkcija i evolucije genoma. Jedan od glavnih ciljeva genomike je i istraživanje genoma čoveka, njegove strukture i funkcije. Zahvaljujući tehnološkom napretku u poslednjih deset godina sve je veći broj laboratorija koje su u mogućnosti da vrše brzo i relativno jeftino sekvenciranje kompletnih

Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

1

Varijacije u broju kopija

1. Novo pitanje genomike : Genom čoveka ili genomi ljudi?

Genomika je naučna oblast koja je nastala kao rezultat dostignuća molekularne

biologije i razvoja tehnika kojima je moguće odrediti redosled nukleotida u molekulima

nukleinskih kiselina. Naziv genomika nastao je dodavanjem sufiksa omika na reč gen. Sufiks

omika je grčkog porekla i znači sve, svako, potpuno, kompletno. Predmet istraživanja

genomike su genomi kako živećih tako i izumrlih vrsta.

Početak 21. veka obeležen je završetkom najvećeg i najskupljeg naučnog projekta iz

oblasti molekularne biologije, dešifrovanje sekvence genoma čoveka. Internacionalni

konzorcijum „Genom čoveka“ rezultate svoga rada objavljuje 15. februara 2001. godine u

časopisu „Nature“. Samo dan kasnije tim naučnika kompanije Celera Genomics objavljuje

svoje rezultate dešifrovanja genoma čoveka u časopisu „Science“. Tom prilikom data je i

preliminarna procena da genomi različitih individua poseduju 99,9% identičnu sekvencu.

Aprila 2003. godine dobijena je kompletna sekvenca genoma čoveka, dok je broj gena

procenjen na oko 30000 u oktobru 2004. godine. Od tada, svake godine svedoci smo nove

revizije broja gena čoveka. Prema skorašnjim podacima naš genom poseduje manje od

20000 gena koji kodiraju za proteine. Rezultati projekta ENCODE (eng. Encyclopedia of

DNA Elements) pokazuju da genom čoveka poseduje više gena koji kodiraju regulatorne

molekule RNK nego gena koji kodiraju proteine (Tabela 1).

Tabela 1. Inventar genoma čoveka

Vrste gena Broj gena

Geni koji kodiraju proteine 19797

Geni koji kodiraju duge nekodirajuće RNK 15931

Geni koji kodiraju male nekodirajuće RNK 9882

Psudogeni 14477

Ukupan broj gena 60498

Do početka 2016. godine kompletno su dešifrovani genomi preko 8000 vrsta, dok su za

preko 33000 vrsta objavljeni preliminarni draftovi genoma. U toku je i sekvenciranje preko

35000 genoma. Na osnovu dešifrovanja genoma razlizičitih vrsta razvila se i nova naučna

disciplina komparativna genomika. Osnovni cilj ove naučne discipline je upoređivanje

genoma različitih vrsta u cilju identifikacija njihovih sličnosti i razlika, naročito na nivou gena i

drugih funkcionalnih elemenata genoma, kao što su promotori i regulatorni elemenati. Na

osnovu rezultata ovih istraživanja smatra se da će komparativna genomika pomoći u

razumevanju funkcija i evolucije genoma.

Jedan od glavnih ciljeva genomike je i istraživanje genoma čoveka, njegove strukture

i funkcije. Zahvaljujući tehnološkom napretku u poslednjih deset godina sve je veći broj

laboratorija koje su u mogućnosti da vrše brzo i relativno jeftino sekvenciranje kompletnih

Page 2: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

2

genoma individua, kao i da vrše upoređivanja iščitanih genoma u cilju identifikacije sličnosti i

razlika. Poređenjem sekvenci genoma različitih individua, pokazano je da postoje

kvantitativne strukturne razlike u genomima ljudi koje se danas nazivaju varijacije u broju

kopija (eng. copy number variation, CNV). To su segmenti molekula DNK veličine od 50bp

do 1Mb (ili veći) koji se u jednom genomu pojavljuje u različitom broju kopija u odnosu na

referentni genom. Varijacije u broju kopija su kvantitativne strukturne varijante genoma.

Pored kvantitativnih, razlikuju se i pozicione strukturne varijante (translokacije) i orijentacione

strukturne varijante (inverzije).

Kombinacijom genskog čipa i komparativne genomske hibridizacije razvijena je nova

molekularno-biološka metoda koja se naziva komparativna genomska hibridizacija

bazirana na genskom čipu (aCGH) (slika 1). Komparativna genomska hibridizacija je

molekularno-biološka metoda za ispitivanje duplikacija i delecija velikih hromozomskih

regiona, i numeričkih hromozomskih aberacija. Korišćenjem aCGH moguće je vršiti

simulatno upoređivanje genoma dve individue. Razvoj ove metode omogućen je

konstruisanjem genskog čipa na kome je „istačkan“ genom jedne osobe predstavljen u vidu

oligonukleotida. Zbog prirode istačkanih proba ovako „istačkan“ genski čip naziva se genski

čip reprezentativnih oligonukleotida (eng. Representational Oligonucleotide Microarray), a

sama analiza poznata je po svom engleskom akronimu ROMA (eng. Representational

Oligonucleotide Microarray Analysis). Rezolucija prvih oligonukleotidnih genskih čipova koji

su se koristili tokom razvoja metode aCGH iznosila je 30kb.

Slika 1. Komparativna genomska hibridizacija bazirana na genskom čipu (aCGH). Ova metoda bazira se na simultanoj hibridizaciji dve genomske DNK (izolovane iz uzoraka poreklom od dve osobe) na genskom čipu na čijoj podlozi se nalazi „istačkan“ genom treće osobe.

Page 3: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

3

U analizi inidividualnih razlika između genoma ljudi, pored aCGH, svoju primenu imaju i

strategije nove generacije sekvenciranja. Svaki sekvenciran genom može biti predmet

analize CNV ako se sekvenca tog genoma uporedi sa sekvencom nekog prethodno očitanog

genoma korišćenjem odgovarajućih bioinformatičkih algoritama. Danas, postoji najmanje 12

različitih metodoloških platofirmi za detekciju i analizu razlika između genoma različitih

individua. One se međusobno razlikuju po korišćenim metodama za identifikaciju razlika u

genomima ljudi (različite modifikacije aCGH ili različite strategije nove generacije

sekvenciranja) i po matematičkim algoritimima za selekciju i analizu dobijenih rezultata.

Zajednička osobina prethodno navedenih platformi je neophodnost da se identifikovane

razlike u genomima analiziranih individua potvrde korišćenjem neke od konvencionalnih

metoda molekularne biologije kao što su: fluorescentna in situ hibridizacija (FISH); lančana

reakcija polimerizacije u realnom vremenu (eng. real-time PCR), sekvenciranja definisane

sekvence molekula DNK ili multipleks amplifikacija ligiranih proba (metoda MLPA).

Multipleks amplifikacija ligiranih proba (eng. Multiplex Ligation-dependent Probe

Amplification, MLPA) je metoda koja omogućava brzo detektovanje promena u broju kopija

(delecija ili duplikacija). Najznačajnija odlika MLPA je što se ne umnožavaju ciljne sekvence

DNK, već probe koje hibridizuju s njima. Svaka MLPA proba sastoji se od dva

oligonukleotida, koja hibridizuju sa susednim ciljnim sekvencama na takvom rastojanju da

između njih može da se odigra proces ligacije (slika 2).

Slika 2. Multipleks amplifikacija ligiranih proba (MLPA). Metoda podrazumeva denaturaciju DNK (nije prikazana na slici), hibridizaciju MLPA proba sa ciljnima sekvencama, amplifikaciju ligiranih proba PCR-om. Umnoženi fragmenti se identifikuju i kvantifikuju fragment analizom.

Jedan oligonukleotid svake MLPA probe na 3’ kraju sadrži sekvencu komplementarnu

specifičnoj ciljnoj sekvenci, dok na 5’ kraju sadrži sekvencu koja je zajednička za sve MLPA

probe i komplementaran je fluorescentno obeleženom PCR prajmeru. Drugi oligonukleotid

svake MLPA probe na 5’ kraju poseduje sekvencu komplementarnu specifičnoj ciljnoj

sekvenci, na 3’ kraju sadrži sekvencu zajedničku za sve MLPA probe koja je

komplementarna neobeleženom prajmeru. Između ova dva kraja nalazi se insert ili “stuffer”

Hibridizacija Ligacija PCR

MLPA probe

Page 4: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

4

sekvenca različite dužine. Ligacijom oligonukleotida MLPA probe (koji su hibridizovali sa

susednim ciljnim sekvencama) formiraju se uspešno ligirane probe koje imaju identične

sekvence na 5’ i 3’ krajevima. Zahvaljujući ovoj njihovoj osobini omogućena je istovremena

amplifikacija i do 50 različitih MLPA proba korišćenjem samo jednog para prajmera. Kao

rezultat procesa amplifikacije ligiranih MLPA proba, nastaju PCR produkti jedinstvene

dužine, odnosno kombinacija jedinstvenih, PCR-om umnoženih fragmenata čiji je opseg

dužina od nekoliko desetina do nekoliko stotina bp. Umnoženi fragmenti se analiziraju

fragment analizom, metodom za razdvajanje fragmenata molekula DNK na osnovu njihovih

dužina sa senzitivnošću od 1bp. Primenom specifičnog softvera za obradu podataka utvrđuje

se broj kopija (delecija ili duplikacija) analiziranih segmenata molekula DNK.

U prošloj deceniji, naučnici su koristili različite nazive za identifikovane kvantitativne

strukturne razlike u genomima ljudi. Jonathan Sebat ih je nazvao polimorfizmi u broju kopija

(eng. copy number polymorphism, CNP), dok ih je Anthony John Lafrate nazvao velika skala

varijacija u broju kopija (eng. large-scale copy-number variation, LCV). Eray Tuzun je

identifikovane razlike nazvao ISV (eng. intermediate – sized variant, ISV). Svi ovi pojmovi

danas su objedinjeni pojom CNV. Najznačajniji eksperimenti u periodu otkrića i identifikacije

varijacija u broju kopija u genomu čoveka nalaze se u tabeli 2.

Tabela 2. Eksperimenti kojima je otkriveno postojanje varijacija u broju kopija

Godina Naučnici Otkrića

2003. Wigler i Lucito Otkriće tehnike ROMA (genski čip reprezentativnih

oligonukleotida)

2004. Iafrate i saradnici 255 duplikacija i delecija između genoma 55 nesrodnih

individua

2004. Sebat i saradnici 221 razlika između genoma 20 nesrodnih individua

2005. Tuzin i saradnici 241 razlika i 56 inverzija između genoma datog od strane

internacionalnog konzorcijuma „Genom čoveka“ (HGP) i

genoma anonimnog muškarca

2005. Conrad i saradnici Upoređivanjem dva genoma identifikovali 586 delecionih

varijanti veličine od 300bp do 1,2Mb, pri čemu su 92 gena

bilo kompletno deletirana dok su 109 gena bila delimično

deletirana

2006. Hinds i saradnici Identifikovali 215 potencijalnih delecionih varijanti veličine

od 70bp do 10kb kod 24 nesrodnih individua

2006. Redon i saradnici Identifikovali 1,447 CNVs koje zauzimaju veličinu od

360Mb (12% genoma) i sadrže hiljade gena (3000),

lokuse povezane sa bolestima čoveka, funkcionalne

elemente i segmetne duplikacije tokom analize genoma

270 individua iz 4 evropske populacije

2007. Lipson i saradnici Optimizacija metode aCGH i unapređenje matematičkog

algoritma za analizu dobijenih rezultata

Prvobitno korišćeni termin polimorfizam zamenjen je terminom varijanta jer se

polimorfizam definiše kao genetička varijanta sa učestalošću ređeg alela ≥ 1%. Dosadašnja

Page 5: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

5

istraživanja pokazuju da su određene CNV u opštoj populaciji prisutne sa frekvencom

manjom od 1% te se zbog toga ne ubrajaju u polimorfizame sekvenci molekula DNK. Upravo

zbog male učestalosti pojedinih CNV, i pored razlika u genomima pojedinačnih individua koje

mogu da obuhvataju i 15% ukupne dužine genoma, još uvek se na genome različitih ljudi

gleda kao na jedinstven genom čoveka.

Drugim rečima, ove razlike ne daju osnovu da se govori o genomima ljudi umesto o

„jedinstvenom“ genomu čoveka. Na taj način osnažuju se etički, moralni i socijalni principi na

kojima se baziraju savremena istraživanja genoma čoveka i obesmišljena svaka nenaučna

namera konstruisanja tzv. „novih naučnih činjenica“ koje bi opravdavali neku novu

eugenetiku.

2. Opšte odlike varijacija u broju kopija

Po svojoj prirodi, CNV mogu biti duplikacije, delecije ili insercije sekvence molekula

DNK, i kompleksniji genetički rearanžmani koji obuhvataju veći broj hromozoma (kompleksne

CNV).

Varijacije u broju kopija po tipu duplikacija dele se na tandemske i multialelske.

Tandemske duplikacije podrazumevaju duplikacije određenog segmenta molekula DNK koji

se u svim analiziranim genomima dupliciraju na isti način, dok multialelske duplikacije

podrazumevaju duplikacije čiji se broj dupliciranih segmenata molekula DNK razlikuje između

analiziranih genoma (slika 3). Kompleksna CNV podrazumeva segment molekula DNK koji

u jednom genomu može biti dupliciran a u drugom deletiran. Sve, do sada otkrivene, CNV

mogu se naći u katalogu genetičkih varijanti genoma čoveka (eng. Database of Genomic

Variants, DGV) na internet strani http://projects.tcag.ca/variation.

Slika 3. Tipovi varijacija u broju kopija (CNV). Varijacija u broju kopija je segment molekula DNK koji u jednom genomu u odnosu na drugi genom može biti a. deletiran, b. tandemski dupliciran, c. insertovan, d. različiti broj puta dupliciran (multialelska duplikacija) ili e. može biti kompleksno izmenjen u smislu duplikacija i delecija (kompleksna CNV).

U genomu čoveka detektovano je i prisustvo triplikata. Po svojoj strukturi razlikuju se

dva tipa triplikata. Tipu I pripadaju segmenti molekula DNK koji predstavljaju tandemski

Page 6: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

6

ponovljene triplikate, a tipu II triplikati koji su međusobno invertni i razdvojeni segmentima

molekula DNK koji su duplicirani (slika 4).

Slika 4. Triplikati kao varijacije u broju kopija. a. Triplikati tipa I predstavljaju tandemski ponovljene (po principu glava-rep) tri kopije određenog segmenta molekula DNK; b. Triplikati tipa II su triplikati koji su međusobno invertni i razvojeni segmentima molekula DNK koji su duplicirani.

CNV po tipu duplikacija treba razlikovati od mikrosatelita i minisatelita. Istovremeno,

CNV po tipu delecija treba razlikovati od mikro-delecija veličine od preko 1 Mb koje se

ubrajaju u hromozomske aberacije. Takođe, u CNV po tipu insercija ne ubrajaju se insercije

nastale kao posledica aktivnosti transpozona. Poslednjih godina, pojedini autori insercije i ne

ubrajaju u CNV.

Preliminarna istraživanja pokazuju da se preko 99% CNV nasleđuju, dok tokom života

jedne individue de novo nastaje 1% CNV. Takođe, prema dosadašnjim analizama genom

jedne individue poseduje najmanje 12 CNV u odnosu na referentni genom čoveka. U

istraživanjima distribucije CNV u genomima ljudi kao referentni genom uzima se genom

iščitan tokom projekta „Genom čoveka“.

CNV u protein kodirajućim delovima genoma najčešće obuhvataju gene za proteine

uključene u puteve prenosa signala u ćelijama imunskog sistema, međućelijskoj komunikaciji

i interakciji sa spoljašnom sredinom (čulo mirisa npr.). Takođe, geni za proteine uključene u

mehanizme transpozicije prisutni su u različitom broju kopija kao posledica CNV.

Duplikacija gena ne znači obavezno i povećan nivo ekspresije proteinskog produkta.

Na ekspresiju dupliciranih gena utiče pozicioni efekat, kao i da li varijacija u broju kopija

obuhvata regulatorne elemente gena. U slučajevima kada CNV po tipu duplikacije obuhvata i

regulatorni region, ekspresija gena može biti povećana (slika 5a). Međutim, duplikacije koje

ne obuhvataju regulatorne elemente (slika 5b) ili multialelske duplikacije (slika 5c) usled

pozicionog efekta, ne moraju biti povezane sa povećanim nivom ekspresije dupliciranog

gena. Na kraju, duplikacija može dovesti do promena u strukturi hromatinske petlje koja

ograničava region molekula DNK u kojima regulatorni elementi ostvaruju svoj efekat na

ekspresiju gena. U takvim okolnostima, ekspresija dupliciranog gena može biti značajno

smanjena ili potpuno blokirana (slika 5d).

Page 7: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

7

Slika 5. Efekat CNV na eksresiju gena. a. CNV po tipu duplikacije može uzrokovati povećan nivo ekspresije gena ukoliko duplikacija obuhvata i regulatorni region datog gena; b. U slučajevima kada CNV ne obuhvata regulatorni region, ekspresija gena može biti samo neznatno uvećana i pored toga što je gen prisutan u dve kopije; c. Kada je gen dupliciran kao posledica kompleksne CNV, jedna kopija gena (locirana na drugom hromozomu) može biti potpuno utišana usled pozicionog efekta, d. Smanjen nivo ekspresije dupliciranog gena može biti posledica promene u strukturi hromatinske petlje koja nastaje kao posledica CNV i koja ograničava domen dejstva okolnih regulatornih regiona.

Međutim, najveće iznenađenje bilo je otkriće kompletno deletiranih gena u genomima

pojedinih individua bez efekata na normalno funkcionisanje organizma, odnosno bez

povezanosti takvih delecija sa patofiziološkim mehanizma razvoja bolesti. Procenjeno je da

oko 3000 gena čoveka mogu biti meta delimične ili kompletne delecije. Do danas je u

genomu čoveka identifikovano preko 100 protein kodirajućih gena koji su kompletno dilatirani

kao posledica postojanja CNV. Jedino objašnjenje za prisustvo delecija gena bez efekta na

funkcionisanje ćelija je da ćelije imaju sposobnost uključivanja kompenzatornih mehanizama

ili aktiviranja alternativnih metaboličkih puteva kojima imaju mogućnost anuliranja nedostatka

pojedinačnog gena.

Pored genoma čoveka, CNV otkrivene su i u genomima drugih vrsta kao što su

šimpanze (2006. godine), laboratorijski miševi (2007. godine), pernate životinje (2008.

godine), rezuzus makaki (2008. godine), psi (2009. godine), krave (2010. godine). Pored

genoma životinja, CNV detektovane su i u genomima biljaka kao što je Arabidopsis thaliana

(2008. godine) ili kukuruz (2009. godine). Varijacije u broju kopija detektovane su i kod

Drosophila (2007. godine), pivskog kvasca (2008. godine) i Caenorhabditis elegans (2010.

godine).

Od ukupno 331 detektovane CNV u genomu šimpaze, njih 74 obuhvata iste regione

genoma kao i kod čoveka. Uočeni obrazac distribucije CNV u genomima šimpanze i čoveka

podržava hipotezu da je dupliciranje gena bio jedan od mehanizama povećanja broja gena u

genomima tokom evolucije.

Page 8: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

8

3. Molekularni mehanizmi nastanaka varijacija u broju kopija

Do danas nije poznat tačan molekularni mehanizam nastanka CNV (slika 6). Moguće

je da CNV nastaju kao posledica određenih replikacionih i rekombinacionih procesa:

a) nealelske homologne rekombinacije

b) nehomolognog (prostog) spajanja krajeva (NHEJ) kao mehanizma reparacije

dvolančanih prekida

c) mehanizma FoSTeS tokom reparacije prekida u molekulu DNK

d) transpozicije L1 elemenata.

Slika 6. Molekularni mehanizmi nastanka CNV. a. nealelska homologna rekombinacija, b. nehomologno spajanje krajeva, c. reparacijom prekida u molekulu DNK mehanizmom FoSTeS, d. tokom transpozicije L1 elemenata.

Nealelska homologna rekombinacija na tri načina može dovesti do duplikacija ili

delecija segmenta molekula DNK. Duplikacije i delecije mogu biti posledica kako

interhromozomskog (slika 7a), tako i intrahromozomskog (slika 7b) krosingovera. Rezultat

nealelske homologne rekombinacije koja se odvija u okviru iste hromatide može biti delecija

određenog segmenta molekula DNK (slika 7c). Kao posledica odvijanja nealelske homologne

rekombinacije između sestrinskih hromatida formira se izohromozom koji sadrži segment

molekula DNK koji je invertovan (slika 7d).

Dvolančani prekidi u molekulu DNK čoveka najčešće se repariraju nehomologim

spajanjem krajeva. Ovaj mehanizam može biti uzrok delecije određenog segmenta molekula

DNK (slika 6b). Transpozicija retrotranspozona može generisati duplikacije u genomu čoveka

koje se zbog načina nastanka nazivaju i retro CNV (slika 6d).

Page 9: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

9

Slika 7. Nealelska homologna rekombinacija. Kao rezultat nealelske homologne rekombinacije može doći do delecije ili duplikacije segmenta molekula DNK koji se rekombinuje. a. Nealelska homologna rekombinacija između dva hromozoma za posledicu može imati deleciju ili duplikaciju segmenta molekula DNK; b. Genetički rearanžmani po tipu delecije ili duplikacije rezultat su i nealelske homologne rekombinacije koja se odigrava unutar jednog hromozoma; c. Ukoliko se ova vrsta rekombinacije odigrava u okviru jedne hromatide, rezultat je delecija segmenta molekula DNK koji se rekombinuje; d) Ako se nealaleska homologna rekombinacija odigrava između dve sestrinske hromatide rezultat može biti genetički rearanžman po tipu inverzije (izohromozom).

Kompleksne CNV verovatno nastaju kao posledica reparacije jednolančanih prekida

u molekulu DNK tokom replikacije mehanizmom koji je poznat po svojoj skraćenici

mehanizam FoSTeS (eng. fork stalling and template switching, FoSTeS) (slika 6c).

Mehanizam FoSTeS aktivira se zaustavljanjem replikacione viljuške na mestu jednolančanog

prekida u molekulu DNK. Zbog zaustavljanja i kolapsa replikacione viljuške zaostajući lanac

se razdvaja od lanca koji je bio matrica za njegovu sintezu. Zaostajući lanac, na osnovu

mikrohomologije, nastavlja replikaciju korišćenjem druge replikacione viljuške koja se nalazi

u blizini one koja je zaustavljena na mestu jednolančanog prekida. U zavisnosti da li se nova

replikaciona viljuška nalazi uzvodno ili nizvodno od mesta jednolančanog prekida, nastavak

replikacije dovodi do delecije ili duplikacije određenog segmenta molekula DNK. Nastali

duplicirani segmenti mogu biti direktno ponovljeni ili invertovani.

4. Varijacije u broju kopija i bolesti čoveka

Neposredno nakon otkrića varijacija u broju kopija počela su istraživanja o mogućoj

ulozi CNV u patogenezi bolesti čoveka. Dosadašnja istraživanja pokazala su snažnu

asocijaciju pojedinih CNV koje obuhvataju protein kodirajuće gene sa razvojem psihijatrijskih

bolesti (uključujući i autizam), gojaznosti, psorijaze (autoimunska bolest kože), šećerne

bolesti, zapaljenskih bolesti creva, itd. Poslednjih godina istražuje se moguća uloga CNV u

procesima neoplastične transformacije koji su odogovorni za razvoj karicinoma debelog

creva, pluća i prostate.

Za neke bolesti čoveka molekularno-biološkim analizama pokazano je da su jedini do

sada utvrđeni genetički uzročnici razvoja bolesti CNV. Takve bolesti se bez obzira na kliničku

sliku ili organ koji pogađaju jednim imenom nazivaju oboljenja broja kopija (eng. copy-

number disorder). Određene kongentalne bolesti srca ili bubrega su neke od njih.

Page 10: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

10

Međutim, CNV koje obuhvataju protein kodirajuće gene mogu imati i pozitivan efekat po

individue koji je poseduju. Primer su infektivne bolesti, kao što su infekcija HIV-a ili malarija.

Naime, upoređivanjem distribucije CNV u 13 gena kod zdrave dece i njihovih vršnjaka

zaraženih HIV-om u populaciji Brazila pokazana je pozitivna korelacija između broja kopija

gena DEFB104 i rezistentnosti na infekciju ovim virusom.

U okviru farmakogenomike danas se intezivno istražuje uloga CNV u individualnim

odgovorima na primenjenu terapiju za lečenje brojnih bolesti čoveka.

Kada je genom čoveka u pitanju, u toku je veliki naučni projekat koji za cilj ima

identifikaciju varijacija u broju kopija (eng. Copy Number Variation Project) u genomima

269 nasumično izabranih individua iz svih krajeva sveta (Amerike, Evrope, Kine, Japana,

Nigerije, itd,). Cilj ovog projekta je i otkriće uloge CNV u fenomenima odgovornim za

ekspresiju genoma. Kao jedno od ključnih pitanja budućih istraživanja izdvaja se pitanje

značaja CNV za evoluciju genoma čoveka. Dosadašnja istraživanja ukazuju da CNV po tipu

duplikacija koje obuhvataju protein kodirajuće gene u genomu čoveka imaju adaptivini značaj

preko efekta povećanja doze gena.

Page 11: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

11

Ključni koncepti

U okviru genomike, razvojem metode komparativne genomske hibridizacije bazirane

na genskom čipu (aCGH) počela je analiza individualnih razlika u genomima ljudi i

ustanovljeno je da se zbog varijacija u broju kopija genomi ljudi međusobno razlikuju

preko 12%.

Varijacije u broju kopija (CNV) su segmenti molekula DNK veličine od 50bp do 1Mb ili

veći koji se u jednom genomu pojavljuje u različitom broju kopija u odnosu na

referentni genom. Po svojoj prirodi, CNV mogu biti duplikacije, delecije ili insercije

sekvence molekula DNK, ili kompleksniji genetički rearanžmani koji obuhvataju veći

broj hromozoma (kompleksne CNV). U CNV ubrajaju se i triplikati koji se po svojoj

prirodi dele u triplikate tipa I i tipa II. Varijacije u broju kopija su kvantitativne

strukturne varijante genoma.

Dosadašnja istraživanja pokazuju da se određene CNV u opštoj populaciji registruju

sa frekvencom manjom od 1%, zbog čega se ne ubrajaju u polimorfizam sekvenci

molekula DNK. Upravo zbog toga, i pored razlika u genomima pojedinačnih individua

koje mogu da obuhvataju i 15% ukupne dužine genoma a nastaju kao posledica

CNV, još uvek se na genome ljudi gleda kao na jedinstven genom.

U slučaju da CNV po tipu duplikacija obuhvataju gene, ekspresija takvih gena zavisi

od toga da li je duplikacija tandemska ili multialelska i da li duplikacija obuhvata i

regulatorne regione dupliciranog gena.

CNV otkrivene su i u genomima šimpanza, laboratorijskih miševa, kokošaka, rezuzus

majmuna, pasa, krava, Arabidopsis thaliana, kukuruza, pivskog kvasca, Drosophila i

Caenorhabditis elegans.

Mogući molekularni mehanizmi nastanka CNV su: nealelska homologna

rekombinacije, nehomologno spajanje krajeva tokom reparacije dvolančanih prekida,

reparacija prekida u molekulu DNK mehanizmom FoSTeS ili transpozicija L1

elemenata.

Pojedine CNV koje obuhvataju protein kodirajuće gene asocirane su sa razvojem

psihijatrijskih bolesti, autizma, gojaznosti, psorijaze (autoimunska bolest kože),

šećerne bolesti, zapaljenskih bolesti creva, itd. Poslednjih godina istražuje se i uloga

CNV u procesima neoplastične transformacije koji su odogovorni za razvoj

karicinoma kolona, pluća i prostate.

U toku je veliki naučni projekat koji za cilj ima identifikaciju svih varijacija u broju

kopija u genomu čoveka (eng. Copy Number Variation Project). Ciljevi ovog projekta

su i ispitivanje uloge CNV u procesima odgovornim za ekspresiju genoma, kao i

njihovog značaja za evoluciju genoma čoveka.

Page 12: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

12

Pitanja

1. Šta su varijacije u broju kopija (CNV)?

2. Zašto se varijacije u broju kopija ne ubarajaju u polimorfizme sekvence molekula

DNK?

3. Koje vrste duplikacija se ubrajaju u CNV?

4. Šta je ROMA tehnika, a šta metoda aCGH?

5. Koje se molekularno-biološke metode koriste za proveru identifikovanih CNV?

6. Koji su molekularno-biološki mehanizmi odgovorni za nastanak CNV?

7. Kakve efekte CNV mogu imati na ekspresiju gena?

8. Koji je značaj CNV u istraživanjima molekularne osnove bolesti čoveka?

9. Pored genoma čoveka, kod kojih vrsta je detektovana pojava CNV?

10. Koji su ciljevi Projekta „Varijacije u broju kopija“?

Page 13: Varijacije u broju ponovaka - University of Belgradebiolozi.bio.bg.ac.rs/attachments/article/2793/Mol... · Osnovni cilj ove naučne discipline je upoređivanje ... Svi ovi pojmovi

13

Literatura

1. Carter NP. Methods and strategies for analyzing copy number variation using DNA

microarrays. Nat Genet. 2007; 39(7 Suppl):S16-21.

2. Conrad DF, Pinto D, Redon R, Feuk L, Gokcumen O, Zhang Y, Aerts J, Andrews TD,

Barnes C, Campbell P, Fitzgerald T, Hu M, Ihm CH, Kristiansson K, Macarthur DG,

Macdonald JR, Onyiah I, Pang AW, Robson S, Stirrups K, Valsesia A, Walter K, Wei

J; Wellcome Trust Case Control Consortium, Tyler-Smith C, Carter NP, Lee C,

Scherer SW, Hurles ME. Origins and functional impact of copy number variation in

the human genome. Nature. 2010;464(7289):704-12.

3. He Y, Hoskins JM, McLeod HL. Copy number variants in pharmacogenetic genes.

Trends Mol Med. 2011;17(5):244-51.

4. Iafrate AJ, Feuk L, Rivera MN, Listewnik ML, Donahoe PK, Qi Y, Scherer SW, Lee C.

Detection of large-scale variation in the human genome. Nat Genet. 2004; 36(9):949-

51.

5. Lee C, Scherer SW. The clinical context of copy number variation in the human

genome. Expert Rev Mol Med. 2010;12:e8.

6. Li W, Olivier M. Current analysis platforms and methods for detecting copy number

variation. Physiol Genomics. 2013;45(1):1-16.

7. Perry GH, Tchinda J, McGrath SD, Zhang J, Picker SR, Cáceres AM, Iafrate AJ,

Tyler-Smith C, Scherer SW, Eichler EE, Stone AC, Lee C. Hotspots for copy number

variation in chimpanzees and humans. Proc Natl Acad Sci U S A. 2006;

103(21):8006-11.

8. Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD, Fiegler H, Shapero

MH, Carson AR, Chen W, Cho EK, Dallaire S, Freeman JL, González JR, Gratacòs

M, Huang J, Kalaitzopoulos D, Komura D, MacDonald JR, Marshall CR, Mei R,

Montgomery L, Nishimura K, Okamura K, Shen F, Somerville MJ, Tchinda J, Valsesia

A, Woodwark C, Yang F, Zhang J, Zerjal T, Zhang J, Armengol L, Conrad DF, Estivill

X, Tyler-Smith C, Carter NP, Aburatani H, Lee C, Jones KW, Scherer SW, Hurles ME.

Global variation in copy number in the human genome. Nature. 2006; 444(7118):444-

54.

9. Sebat J, Lakshmi B, Troge J, Alexander J, Young J, Lundin P, Månér S, Massa H,

Walker M, Chi M, Navin N, Lucito R, Healy J, Hicks J, Ye K, Reiner A, Gilliam TC,

Trask B, Patterson N, Zetterberg A, Wigler M. Large-scale copy number

polymorphism in the human genome. Science. 2004;305(5683):525-8.

10. Wellcome Trust Case Control Consortium. Genome-wide association study of CNVs

in 16,000 cases of eight common diseases and 3,000 shared controls. Nature. 2010;

464(7289):713-20.