Upload
lyn
View
28
Download
0
Embed Size (px)
DESCRIPTION
Promoottorien etsintä. Jenni Hulkkonen 23.3.2005. Don King. Motivaatio. uusien geenien etsinnässä transkription aloituskohdan ja promoottorin löytäminen vaikeata geenien säätely ihmisellä on kaikissa soluissaan kaikki geenit, mutta vain osa geeneistä ilmentyy joissakin soluissa - PowerPoint PPT Presentation
Citation preview
Promoottorien etsintä
Jenni Hulkkonen
23.3.2005
Don King
Motivaatio
uusien geenien etsinnässä transkription aloituskohdan ja promoottorin
löytäminen vaikeata geenien säätely
ihmisellä on kaikissa soluissaan kaikki geenit, mutta vain osa geeneistä ilmentyy joissakin soluissa
jotkin geenit toiminnassa oletusarvoisesti sairauksien tutkiminen
Prokarioottien transkription aloitus
sigma tekijä kiinnittyy RNA polymeraasiin kompleksi löytää transkription aloituskohdan
Eukarioottien transkription aloitus
monimutkaisempi kuin prokarioottien, koska eukarioottien perimä ja systeemit monimutkaisempia
geenit pakkautuneina tarvitsee saada aloituskohta esille ennen kuin
voidaan aloittaa koodaus eukariooteilla tiukemmin säädelty useita säätely tekijöitä
Transcription factorit, TF
basal factors minimi promoottori TATAA, RNA polymeraasi II, TFIIB,…
upstream factors vahvistajat ja hiljentäjät
variaatiot jotkut kirjaimet voivat olla erilaisia, esimerkiksi viereinen
proteiini voi antaa tämän mahdollisuuden sensitiivisyys ja spesifisyys voidaan kuvailla matemaattisin mallein:
matriisipohjaiset ovat spesifisempiä kuin IUPAC painomatriisit voivat ennustaa sitoutumisaffiniteettia matriisiperheet sisältävät TF:ien biologisen vaihtelevuuden
TFBS =transcription factor binding site lyhyt pätkä DNA:ta (5-25nukleotidiä) sitoutunut yksi tai useita transcription factoreita hyvin konservoituneita säätelykohtia:
jopa 50 000nukleotidin päässä otettava huomioon myös toinen juoste voi olla myös geenin sisällä
DNA:han sitoutuvat domainit
Zinc finger Leucine Zipper Homeodomain
tärkeitä kehitysbiologiassa TATA- sitoutuva proteiini
CpG islands
Ihmisen genomissa CpG dinukleotidit ovat harvinaisia
CpG parit käyvät läpi metylaation, joka muuttaa C nukleotidia
Metyloitu C voi mutatoitua hyvin suurella todennäköisyydellä T:ksi
Promoottori alueet ovat CpG rikkaita Alueita ei ole metyloitu ja täten mutatoituvat
harvemmin (evolutionäärisesti tärkeitä) Näitä kutsutaan CpG islandeiksi
Mikrosirut
Promoottorien ennustamisessa käytetään hyväksi mikrosiruja
sirujen avulla etsitään samalla tavalla ekspressoituvia geenejä
tällä hetkellä käytännössä ainoa keino etsiä uusia transcriptio factoreita
Ohjelmat
pelkästään sekvenssiin pohjautuvia TATA box CpG islands tulevaisuudessa 3-uloitteisuus huomioon
Promoottori alueen etsintä promoottori analyysi tarvitsee promoottorin sekvenssin
saaminen voi olla triviaalia! meneekö vastavirta sekvenssi toisen promoottorin
päälle? ohjelmia:
UCSC tarvitsee RefSeq mRNA accession koodit tarjoaa valmiiksi tehdyn kokoelman vastavirta
sekvensseistä LocusLink
tärkeä UCSC:n käyttöön jos ei RefSeq koodeja EnsMART
Promoottori alueiden analyysi
etsitään jo tiedossa olevia TFBS vastavirrasta The TRANSFAC database ver. 6.0
eukarioottien transkriptio tekijöiden, niiden genomiin sitoutuvien osien ja DNA sitoutumisprofiilin tietokanta
Gene Regulation Match
potentiaalisten transkriptio tekijöiden sitoutumiskohtien etsimiseen
käyttää TRANFAC 6.0:n kirjastoa mononukleotidi painomatriiseista
Uusien transkriptio tekijöiden etsintä
MEME Työkalu motifien etsintään DNA:sta
Motif on pala sekvenssiä joka toistuu sukulais DNA sekvenssien ryhmässä
Kuvaa motifeja paikkariippuvaisilla kirjaintodennäköisyys matriiseilla, jotka kertovat kuinka todennäköisiä jokainen mahdollinen kirjain on kussakin kohtaa sekvenssi pätkää
Yksittäinen MEME motif ei sisällä aukkoja Aukkoja sisältävät MEME jaetaan kahteen tai
useampaan erilliseen motifiin Antaa ulos yhtä monta motifia kuin on pyydetty
AlignACE Käyttää Gibbs sampling algoritmiä
Genomatix Sovelluksella kuukausittaiset rajat Matinspector
Etsii transcriptio tekijöiden sitoutumiskohtia Käyttää matriiseja sekä IUPAC kirjastoja
Sisältää noin 400 sitoutumiskohtaa ElDorado
Näyttää saatavilla olevan annotaation genomi alueesta Gene2Promoter
Etsii ja analysoi promoottoreita Promoottoreiden suoraan hakemiseen
PromoterInspector Promoottorien hyvin specifinen ennustaminen nisäkkäille Promoottori alueiden etsimiseen Suunniteltu paikantamaan potentiaalisia promoottori alueita DNAn
kohdista, joita ei ole vielä annotoitu Ihmisen korkealaatuisiin promoottoreihin käytä elDoradoa tai
Gene2Promoteria
Lähteet
www.csc.fi/molbio/opetus/promoottorianalyysi luentokalvoja
Molecular Biology of the Cell
Kiitoksia!
Kysymyksiä?
http://www.bio.com/pics/nucleosomes_chromatin.jpg
http://www.mdx.ac.uk/www/lifesciences/alex/images/0905_2.gif
http://images.google.fi/imgres?imgurl=http://fajerpc.magnet.fsu.edu/Education/2010/Lectures/24_DNA_files/image014.jpg&imgrefurl=http://fajerpc.magnet.fsu.edu/Education/2010/Lectures/24_dna.htm&h=259&w=594&sz=28&tbnid=fAnLCofwn_IJ:&tbnh=57&tbnw=131&start=103&prev=/images%3Fq%3Dnucleosomes%26start%3D100%26hl%3Dfi%26lr%3D%26sa%3DN
Prokaryotic DNA The main DNA in prokaryotes is a circular molecule attached to
the plasma membrane. Some DNA is organized in smaller circles called plasmids. 90% of the genome consists of functional genes, i.e. genes
coding for proteins. Genes coding for a metabolic pathway are lumped together into an
operon. Eukaryotic DNA: Prokaryotic DNA is a relatively simple circular molecule. In
eukaryotes, DNA is associated with proteins to form a complex called chromatin.
Chromatin A variety of proteins form part of this complex: Histones are small, basic, structural proteins that bind to
negatively charged phosphate groups. They show a highly conserved structure (homology) between higher and lower organisms.
Nonhistones are regulatory proteins(leucine zippers; zinc fingers).
Promoottori
Ennen geenin transkription alkamista tarvitaan useita prosesseja ennen kuin varsinainen luenta voidaan aloittaa
Nucleosomes DNA is tightly wrapped around a protein core made of basic protein (histones). Each repeating unit (nucleosome) consists of 200 base pairs, which shortens the
length of DNA by about 10-fold. The space between nucleosomes is a site for binding of regulatory proteins that initiate
DNA replication or transcription. DNA appearing as a string of beads (nucleosomes) is an active form of DNA and is
called euchromatin. Coiled nucleosomes In order to shorten DNA further (the shorter the strand the less likely it is to get
entangled with other strands), nucleosomes are supercoiled like rope. In this form, DNA is inactive, proteins reading DNA are sterically hindered by the
dense further packing of chromatin. The inactive state of DNA is referred to as heterochromatin.
Extended chromatin That’s not enough. The “rope” of coiled nucleosomes folds over in pleats, forming an
extended chromatin. The folds are held by nonhistone binding proteins. Condensed chromatin The folded fiber can be folded again, generating condensed chromatin. Chromosome Finally, condensed chromatin folds again to form a chromosome. This most condensed form of a single DNA molecule occurs only during cell division.
Kolme perusmekanismia