Upload
martin-trevino
View
83
Download
4
Embed Size (px)
DESCRIPTION
Metody molekulární biologie v ekologii a systematice rostlin 13 . NGS, SNP, FCM. Petr Koutecký & Jiří Košnar, 2011. Next Generation Sequencing - úvod. N ext G eneration S equencing (NGS) High-throughput Sequencing v jednom runu nezávisle sekvenuje tisíce až miliony molekul - PowerPoint PPT Presentation
Citation preview
Metody molekulární biologie v ekologii a systematice
rostlin
13. NGS, SNP, FCM
Petr Koutecký & Jiří Košnar, 2011
Next Generation Sequencing - úvod
Next Generation Sequencing (NGS)
High-throughput Sequencing
► v jednom runu nezávisle sekvenuje tisíce až miliony molekul
► poskytuje velké množství dat za nižší cenu než klasické (např. Sangerovo) sekvenování
► obvykle odlišné biochemické principy
► vyplatí se u vzorků s velkou komplexitou (složitostí) – genomy, vzorky společenstev, nebo pro nízce abundantní molekuly
► celková cena analýzy je ale stále relativně vysoká (min. desítky – stovky tisíc Kč)
► 454 pyrosequencing, Illumina, SOLiD, Ion Torrent a několik dalších nových metod
454 pyrosequencing
princip 454 pyrosekvenování (*1996):
► po inkorporaci dNTP se odštěpí pyrofosfát (PPi)→ ATP sulfuryláza jej přemění na ATP → luciferáza za přítomnosti ATP přemění
luciferin na oxyluciferin→ záblesk(→ apyráza – degraduje neinkorp. dNTP a
ATP)
► v každém cyklu na templát pouštěn jen jeden typ dNTP» např. když se přidá T a vznikne záblesk, tak
na dané pozici je opravdu T
454 pyrosequencing
► výška píku záblesku odráží počet inkorporovaných nukleotidů daného typu
delší homopolymerní sekvence → hlavní zdroj chyb 454 sekvenace
(454 je více chybující než klasická sekvenace)
► na rozdíl od Sangerova sekvenování je čitelný i úsek za sekv. primerem
454 pyrosequencing► kde vzít molekuly DNA templátu na sekvenaci?
fragmenty DNA – genomická DNA, PCR produkt
na každý jednotlivý fragment DNA napojeny adaptory
adaptory vážou fragment na capture beads (1 fragment → 1 bead)
emulzní PCR (emPCR) – na každé bead proběhne klonální amplifikace fragmentu → namnožení daného typu molekuly DNA
454 pyrosequencing
jednotlivé beads zapadnou do jamek pikotitrační destičky ...
... a jsou podrobeny cyklickému procesu pyrosekvenace
... zařízení snímá signál zvlášť pro každou dílčí jamku: v 1 jamce jen 1 bead → sekvenační signál z původně 1 fragmentu DNA (klonálně namnoženého do mnoha kopií pomocí emPCR)
454 pyrosequencing► výstup:
► získají se sekvence o délce < 1000 bp, nejčastěji 700 bp (podle typu použité sequencing chemistry)
► počet získaných sekvencí - podle kapacity daného typu přístroje:
◄ Roche GS FLX (17 mil. Kč):
~ 1 000 000 sekvencí / run (~ 100 tis. Kč)
◄ Roche GS Junior (3.5 mil. Kč):
~ 100 000 sekvencí / run (~ desítky tis. Kč)
► vzorky se posílají komerčním servisním firmám
454 pyrosequencing
► jak analyzovat víc vzorků najednou?
► předpokladem je odlišit jednotlivé sekvence = určit, kterému ze vzorků patří
a) fyzická separace jednotlivých vzorků (jen u GS FLX): pomocí gasket (těsnění) rozdělujícího pikotitrační destičku do několika regionů (2, 4, 8 a 16)
b) identifikace výstupních sekvencí pomocí připojení MID (= Multiplex Identifier) sekvence: může být součástí adaptorů napojovaných na DNA fragmenty, nebo součástí PCR primerů použitých na amplifikaci daného konkrétního vz.
► vede ke snížení počtu sekvencí na 1 vzorek, ale zároveň šetří peníze
Illumina (Solexa)Illumina Genome Analyzer II Workflow
Illumina (Solexa)
► možnost analýzy více vzorků najednou - 8 lanes:
• 7 na vzorky (každá až s 12 multiplex. vzorky)
• 1 na kontrolní Illumina vzorek
► výstup:
► získají se biliony sekvencí o délce 50-100 bp
nosič pro bridge amplification
SOLid (Life Technologies - Applied Biosystems)
Sequencing by Oligonucleotide Ligation and Detection
► navázání adaptorů, emulzní PCR, beads navázány na glass slide
► po navázání primeru probíhá sekvenace ligací:• fluor. značené dinukleotidové sondy → pokud sonda sedí, je přiligována• po detekci ze sondy odštěpena fluor. část, opakování předchozího kroku• produkt odstraněn denaturací• další cyklus s primerem o (n-1) kratším
→ nová sekvenace vlákna
► biliony readů 50 bp, díky opakované sekvenaci vysoká spolehlivost čtení!
Ion Torrent (Life Technologies)
► emulzní PCR
► podobně jako při 454 postupně pouštěny jednotlivé typy dNTP
► velmi rychlé
► 100 tis. až miliony < 200 bp readů
► nejlevnější run (< 10 tis. Kč) i přístroj
princip Ion Torrent: navázání dNTP při prodlužování řetězce DNA vede k odštěpení H+ → detekována změna pH
homopolymerní sekvence (TT): jako u 454 – např. 2x vyšší pík
Aplikace NGS
Sekvenování genomů
► metodu je třeba zvolit zejména podle velikosti zkoumaného genomu: na malé (prokaryotní, cp nebo mt) genomy dostačuje i 454 pyrosekvenování
► hledání nových sekvenčních markerů – screening genomu, EST library
Doorduin et al. 2011.The Complete Chloroplast Genome of 17 Individuals of Pest Species Jacobaea vulgaris: SNPs, Microsatellites and Barcoding Markers for Population and Phylogenetic Studies. DNA Res. 18: 93–105.
- Illumina, chloroplastový genom 12 původních (Evr.) a 5 invaznich jedinců (S Amer.)- 5 nových cp úseků vhodných pro fylogenetiku Asteraceae- 34 SSR a 32 SNP lokusů
Aplikace NGS
Sekvenování genomů
► Ancient DNA
http://mammoth.psu.edu/howToSeqMammoth.html
▲ Rowe et al. 2011. Museum genomics: low-cost and high-accuracy genetic data from historical specimens. Molecular Ecology Resources 11, 1082–1092. genom 50 let starých historických preparátů Rattus norvegicus, Illumina, porovnání – namapování na známé genomy
Aplikace NGS
Hledání mikrosatelitních lokusů
► asi jediným řešením je 454 pyrosekvenování, protože ostatní metody dávají příliš krátké ready nedostatečné pro design primerů
► screening celého genomu, nebo možné kombinovat s vytvořením SSR-enriched library, která se následně sekvenuje
Lepais O, Bacles CFE 2011. Comparison of random and SSR-enriched shotgun pyrosequencing for microsatellite discovery and single multiplex PCR optimization in Acacia harpophylla F. Muell. Ex Benth. Mol. Ecol. Res. 11, 711–724. 454 pyrosekv., porovnávají frekvenci SSR získaných: sekvenaci genomu vs. obohacené knihovny = 0.5% vs. 2.2% celkového počtu sekvencí
Lepais O, Bacles CFE 2011. De Novo Discovery and Multiplexed Amplification of Microsatellite Markers for Black Alder (Alnus glutinosa) and Related Species Using SSR-Enriched Shotgun Pyrosequencing. Journal of Heredity102: 627-632.
Takayama et al. 2011. A simple and cost-effective approach for microsatellite isolation in non-model plant species using small-scale 454 pyrosequencing. Taxon 60: 1442-1449. z 10-20 tis. sekvencí → 63-284 SSR lokusů
Gardner et al. 2011. Rise of the machines – recommendations for ecologists when using next generation sequencing for microsatellite development. Mol. Ecol. Res. 11, 1093–1101. na 40 funkčních SSR lokusů je u rostlin potřeba asi 25 tis. sekvencí; pro bezobratlé asi 2x tolik sekvencí
Analýza společenstev1. Izolace celkové DNA vzorku
↓
2. PCR amplifikace úseku, který slouží jako marker
(= umožňuje rozlišit taxony společenstva, primery specificky amplifikují pouze zkoumanou tax. skupinu; prokaryota – 16S, eukaryota – LSU, SSU nrDNA)
↓3. Analýza směsi molekul PCR produktu
↓
454 pyrosekvenování ► metoda s nejdelšími ready, analýza amplikonů <600(-800?) bp► obrovské množství sekvencí na 1 vzorek (tisíce až desítky tisíc sekv.) →
překonává všechny ostatní metody
× nutné zvolit vhodně variabilní úsek (délková limitace!), počet analyzovaných vzorků je poněkud limitovaný (nutno řešit separaci vzorků – gasket, MIDs)
► projekt BarFrost: NGS vzorků z permafrostu (rostliny, houby, bezobratlí, až 10 tis. let BP)
Aplikace NGS
SNP
= Slovenské národné povstanie
… a nebo taky Single Nucleotide Polymorphism
SNP (single nucleotide polymorphism)
► Nejde o označení metody
► Obecně znamená přítomnost bodové mutace (substituce) v daném místě genomu
► Kodominantní, až 4 alely (ACGT)
► Nutno znát primery pro dané místo genomu
► Počet SNP lokusů velmi vysoký (~ desítky tisíc) a skutečně v celém genomu
► Téměr ideální marker, až půjde rychle a levně sledovat velké množství SNP lokusů najednou
SNP (single nucleotide polymorphism)► Zatím hlavně u modelových / užitkových organismů a jejich
nejbližších příbuzných» vyhledávání v databázích EST, celých genomů,…
► Aplikace na divoké organismy zatím hlavně v zoologii, v botanice zatím prakticky ne
► … ale za pár let ???
► zoologický příklad:Tokarska et al. 2009, Heredity 103: 326-332» genetická variabilita současné populace zubra a srovnání s
(mnohem větší) populací amerického bizona, cca 54 tis. SNP lokusech pro krávy (BovineSNP50 BeadChip, Illumina)
» úspěšná amplifikace cca 52 tis. SNP lokusů» z nich u zubra ~900 polymorfních (→ kodominantní data!)
Průtoková cytometrie
► Flow cytometry, FCM
► spíše cytologická než molekulární metoda» ale děláme ji u nás v laboratoři…
» umožňuje určit ploidii / počet chromosomů, což je obvykle nezbytné pro interpretaci výsledků molekulárních metod!
» vypovídá o genomu v nejhrubším měřítku• velikost• počet kopií chromosomů• lze odhadovat i zastoupení bazí (AT vs. GC) na úrovni celého
genomu
Průtoková cytometrie
► cytometrie = metoda umožňující sledovat vlastnosti optické částic (buňky, buněčná jádra)» intenzita fluorescence
» rozptyl světla
► průtoková = sledované částice v suspenzi, při průtoku měřící kyvetou
► velmi často používaná v medicíně (běžná diagnostická metoda)
► použití v botanice / zoologii jen výsekem možných aplikací
Vzorky
► suspenze sledovaných částic» krev, hemolymfa,…» voda (plantkton,…)» a u kytek co? jak to dostat z buněčné stany ?
• chemické narušení → protoplasty
• izolace jader
► izolace buněčných jader u rostlin (cca 5 min.)» nasekání tkáně žiletkou v izolačním pufru
• stabilizace jader (vhodné pH, osmolarita, antioxidanty,…)
• detergent (snižuje slepování jader)
» přefiltrování (tkanina 42 μm)» přidání fluorescenční barvy (pokud není součástí izolačního
pufru)
Vzorky
► Obvykle analyzované tkáně» čerstvé listy, stonky, květy,… apod.
» semena
» vysušené tkáně (silikagel)• nepredikovatelné posuny fluorescence, lze použít jen orientačně
– určení ploidie
» fixovaná jádra (glycerol apod.) ?
Průtokový cytometr
Průtokový cytometr
vzorek
zdroj světla» laser» UV lampa /
UV dioda
fluidika» pumpa» sheath fluid
kyveta
odpad
optika + počítač
Fluorescence
► barviva vázající se na DNA» propidium jodid (PI) – interkalační, nespecifické
» DAPI – vazba na AT páry
» příp. jiná barviva specifická pro GC páry (např. mitramycin)
► výsledek vždy porovnáván s vnitřním standardem» rostlina o známém obsahu DNA, zpracovávaná společně se
vzorkem
► zobrazujeme jako histogram» poměr průměrů / mediánů píků
» koeficient variance („šířka“ píků)
» počet buněk
Velikost genomu► poměr mezi fluorescencí vzorku a standardu
► absolutní» barvivo PI» vyjadřuje se v pg nebo Mbp,
1 pg = 978 Mbp» obvykle průměr ze 3 měření jedince
► relativní» barvivo DAPI» standard = 1» vhodná např. pro určení ploidie» přesnější a méně jedovaté
než PI
► porovnáním obou lze spočítat obsah bazí AT / GC
Centaurea weldeniana+
* Glycine max ‘Polanka’
Centaurea 157.92Glycine 189.46poměr 0.833
Glycine 2.50 pgCentaurea = 2.50 *
0.833= 2.08 pg
Velikost genomu
► (holoploidní) velikost genomu» C-hodnota
» 1C = velikost genomu gamet / gametofytu
» 2C = velikost genomu v somatických buňkách (sporofytu)
» měřením zjišťujeme obvykle 2C hodnotu (u cévn. rostlin)
► monoploidní velikost genomu» Cx-hodnota
» velikost genomu jedné průměrné chromosomové sádky
diploid: Cx = 2C / 2
triploid: Cx = 2C / 3
tetraploid Cx = 2C / 4
… atd.
Rozptyl světla
► Forward scatter, FSC » původní vlnová délka, v přímém směru» vypovídá o velikosti částic» v botanických aplikacích se nepoužívá
► Side scatter, SSC » původní vlnová délka, v
kolmém směru» vypovídá o velikosti a vnitřní
struktuře částic» používáme k odlišení
degradovaných jader a „vyčištění“ histogramu fluorescence
Výhody / nevýhody
Výhody► nedestruktivnost► obvykle nejsou potřeba speciální tkáně (× karyologie)► rychlost, statisticky robustní data na populační úrovni
» cca 100 vz. za den, někdy lze analyzovat více jedinců / vz.
► přesnost, detekce drobných rozdílů a vzácných cytotypů► cena
Nevýhody► většinou potřeba čerstvého materiálu► problémy se sekundárními metabolity, slizy,… + analýza pylu► omezená citlivost při vyšších chromosomových počtech (detekce
aneuplodie, B-chromosomy apod.)► stanovení chromosového počtu jen nepřímé
Aplikace v botanice
Analýza ploidního stupně► ploidii odhadujeme nepřímo z velikosti genomu,
nutná kalibrace klasickým počítáním!
► taxonomický znak » Centaurea phrygia – diploid, C. erdneri – tetraploid; morfologicky
ale velmi podobné
► biologie polyploidů» rozšíření cytotypů, geografické, ekologické,… rozdíly» detekce meziploidní hybridů a vzácných cytotypů (např. nových
polyploidů)» detailní studie smíšených populací (prostorové rozmístění, vazba
na mikrostanoviště, hybridizace, kompetice, změny zastoupení cytotypů v čase,…)
Aplikace v botanice
Velikost genomu► taxonomický znak (2C)
» odlišení taxonů se stejným počtem chromosomů, detekova-telné i drobné rozdíly, od 3 – 4 %) – např. Melampyrum
» „vystopování“ původu polyploidů (různé „součty“ možných předků)» skupiny příbuzných druhů (např. několik „základních“ Cx-hodnot,
které jsou stabilní mezi ploidiemi – Batrachium)
► obecnější biologické závislosti» redukce Cx hodnoty se stupněm ploidie» vztahy velikosti genomu k délce životního cyklu, prostředí (nadm.
výška, ostrovy, zeměpisná šířka), vlastnostem druhu (invazivnost,…)
ale pozor na design těchto studií, obvykle problematický
Aplikace v botanice
Reprodukční systém, hybridizace
► u krytosemenných dvojité oplození» embryo 2C (1C ♀ + 1C ♂)
» endosperm 3C (2 * 1C ♀ + 1C ♂)
► jiné poměry v případě odchylek(apomixie, neredukované gamety) » viz grafy – Sorbus (data M. Lepšího)
» hybridizace diploida a tetraploida,vzniklo 3x semeno na diploidovi:(a) hybrid nebo (b) autopolyploid ?
a) 2 * 1C(♀) + 2C(♂) = 4C
b) 2 * 2C(♀) + 1C(♂) = 5C
embryo 2C (2x)
endosperm 3C (3x)normální sexualita
Bellis perennis
embryo
2C (4x)
Bellis perennis
endosperm 6C (12x)pseudogamie, neredu-kované embryo i pyl
Další aplikace
► studium planktonu» detekce hlavních skupin (bakterie, sinice, zelené řasy)
» kombinace několika parametrů – velikost genomu, autofluorescence chlorofylů, specifické barvy pro bakterie,…
» lze i kvantitativně – stanovení počtu buněk / koncentrace► analýzy chromosomů, genomika► medicínské aplikace
» analýza buněčného cyklu (nádorová bujení apod.)
» přítomnost antigenů pro danou protilátku,…
► třídění buněk (sorting)