34
Metody molekulární biologie v ekologii a systematice rostlin 13. NGS, SNP, FCM Petr Koutecký & Jiří Košnar, 2011

Metody molekulární biologie v ekologii a systematice rostlin 13 . NGS, SNP, FCM

Embed Size (px)

DESCRIPTION

Metody molekulární biologie v ekologii a systematice rostlin 13 . NGS, SNP, FCM. Petr Koutecký & Jiří Košnar, 2011. Next Generation Sequencing - úvod. N ext G eneration S equencing (NGS) High-throughput Sequencing v jednom runu nezávisle sekvenuje tisíce až miliony molekul - PowerPoint PPT Presentation

Citation preview

Page 1: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Metody molekulární biologie v ekologii a systematice

rostlin

13. NGS, SNP, FCM

Petr Koutecký & Jiří Košnar, 2011

Page 2: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Next Generation Sequencing - úvod

Next Generation Sequencing (NGS)

High-throughput Sequencing

► v jednom runu nezávisle sekvenuje tisíce až miliony molekul

► poskytuje velké množství dat za nižší cenu než klasické (např. Sangerovo) sekvenování

► obvykle odlišné biochemické principy

► vyplatí se u vzorků s velkou komplexitou (složitostí) – genomy, vzorky společenstev, nebo pro nízce abundantní molekuly

► celková cena analýzy je ale stále relativně vysoká (min. desítky – stovky tisíc Kč)

► 454 pyrosequencing, Illumina, SOLiD, Ion Torrent a několik dalších nových metod

Page 3: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

454 pyrosequencing

princip 454 pyrosekvenování (*1996):

► po inkorporaci dNTP se odštěpí pyrofosfát (PPi)→ ATP sulfuryláza jej přemění na ATP → luciferáza za přítomnosti ATP přemění

luciferin na oxyluciferin→ záblesk(→ apyráza – degraduje neinkorp. dNTP a

ATP)

► v každém cyklu na templát pouštěn jen jeden typ dNTP» např. když se přidá T a vznikne záblesk, tak

na dané pozici je opravdu T

Page 4: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

454 pyrosequencing

► výška píku záblesku odráží počet inkorporovaných nukleotidů daného typu

delší homopolymerní sekvence → hlavní zdroj chyb 454 sekvenace

(454 je více chybující než klasická sekvenace)

► na rozdíl od Sangerova sekvenování je čitelný i úsek za sekv. primerem

Page 5: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

454 pyrosequencing► kde vzít molekuly DNA templátu na sekvenaci?

fragmenty DNA – genomická DNA, PCR produkt

na každý jednotlivý fragment DNA napojeny adaptory

adaptory vážou fragment na capture beads (1 fragment → 1 bead)

emulzní PCR (emPCR) – na každé bead proběhne klonální amplifikace fragmentu → namnožení daného typu molekuly DNA

Page 6: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

454 pyrosequencing

jednotlivé beads zapadnou do jamek pikotitrační destičky ...

... a jsou podrobeny cyklickému procesu pyrosekvenace

... zařízení snímá signál zvlášť pro každou dílčí jamku: v 1 jamce jen 1 bead → sekvenační signál z původně 1 fragmentu DNA (klonálně namnoženého do mnoha kopií pomocí emPCR)

Page 7: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

454 pyrosequencing► výstup:

► získají se sekvence o délce < 1000 bp, nejčastěji 700 bp (podle typu použité sequencing chemistry)

► počet získaných sekvencí - podle kapacity daného typu přístroje:

◄ Roche GS FLX (17 mil. Kč):

~ 1 000 000 sekvencí / run (~ 100 tis. Kč)

◄ Roche GS Junior (3.5 mil. Kč):

~ 100 000 sekvencí / run (~ desítky tis. Kč)

► vzorky se posílají komerčním servisním firmám

Page 8: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

454 pyrosequencing

► jak analyzovat víc vzorků najednou?

► předpokladem je odlišit jednotlivé sekvence = určit, kterému ze vzorků patří

a) fyzická separace jednotlivých vzorků (jen u GS FLX): pomocí gasket (těsnění) rozdělujícího pikotitrační destičku do několika regionů (2, 4, 8 a 16)

b) identifikace výstupních sekvencí pomocí připojení MID (= Multiplex Identifier) sekvence: může být součástí adaptorů napojovaných na DNA fragmenty, nebo součástí PCR primerů použitých na amplifikaci daného konkrétního vz.

► vede ke snížení počtu sekvencí na 1 vzorek, ale zároveň šetří peníze

Page 9: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Illumina (Solexa)Illumina Genome Analyzer II Workflow

Page 10: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Illumina (Solexa)

► možnost analýzy více vzorků najednou - 8 lanes:

• 7 na vzorky (každá až s 12 multiplex. vzorky)

• 1 na kontrolní Illumina vzorek

► výstup:

► získají se biliony sekvencí o délce 50-100 bp

nosič pro bridge amplification

Page 11: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

SOLid (Life Technologies - Applied Biosystems)

Sequencing by Oligonucleotide Ligation and Detection

► navázání adaptorů, emulzní PCR, beads navázány na glass slide

► po navázání primeru probíhá sekvenace ligací:• fluor. značené dinukleotidové sondy → pokud sonda sedí, je přiligována• po detekci ze sondy odštěpena fluor. část, opakování předchozího kroku• produkt odstraněn denaturací• další cyklus s primerem o (n-1) kratším

→ nová sekvenace vlákna

► biliony readů 50 bp, díky opakované sekvenaci vysoká spolehlivost čtení!

Page 12: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Ion Torrent (Life Technologies)

► emulzní PCR

► podobně jako při 454 postupně pouštěny jednotlivé typy dNTP

► velmi rychlé

► 100 tis. až miliony < 200 bp readů

► nejlevnější run (< 10 tis. Kč) i přístroj

princip Ion Torrent: navázání dNTP při prodlužování řetězce DNA vede k odštěpení H+ → detekována změna pH

homopolymerní sekvence (TT): jako u 454 – např. 2x vyšší pík

Page 13: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Aplikace NGS

Sekvenování genomů

► metodu je třeba zvolit zejména podle velikosti zkoumaného genomu: na malé (prokaryotní, cp nebo mt) genomy dostačuje i 454 pyrosekvenování

► hledání nových sekvenčních markerů – screening genomu, EST library

Doorduin et al. 2011.The Complete Chloroplast Genome of 17 Individuals of Pest Species Jacobaea vulgaris: SNPs, Microsatellites and Barcoding Markers for Population and Phylogenetic Studies. DNA Res. 18: 93–105.

- Illumina, chloroplastový genom 12 původních (Evr.) a 5 invaznich jedinců (S Amer.)- 5 nových cp úseků vhodných pro fylogenetiku Asteraceae- 34 SSR a 32 SNP lokusů

Page 14: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Aplikace NGS

Sekvenování genomů

► Ancient DNA

http://mammoth.psu.edu/howToSeqMammoth.html

▲ Rowe et al. 2011. Museum genomics: low-cost and high-accuracy genetic data from historical specimens. Molecular Ecology Resources 11, 1082–1092. genom 50 let starých historických preparátů Rattus norvegicus, Illumina, porovnání – namapování na známé genomy

Page 15: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Aplikace NGS

Hledání mikrosatelitních lokusů

► asi jediným řešením je 454 pyrosekvenování, protože ostatní metody dávají příliš krátké ready nedostatečné pro design primerů

► screening celého genomu, nebo možné kombinovat s vytvořením SSR-enriched library, která se následně sekvenuje

Lepais O, Bacles CFE 2011. Comparison of random and SSR-enriched shotgun pyrosequencing for microsatellite discovery and single multiplex PCR optimization in Acacia harpophylla F. Muell. Ex Benth. Mol. Ecol. Res. 11, 711–724. 454 pyrosekv., porovnávají frekvenci SSR získaných: sekvenaci genomu vs. obohacené knihovny = 0.5% vs. 2.2% celkového počtu sekvencí

Lepais O, Bacles CFE 2011. De Novo Discovery and Multiplexed Amplification of Microsatellite Markers for Black Alder (Alnus glutinosa) and Related Species Using SSR-Enriched Shotgun Pyrosequencing. Journal of Heredity102: 627-632.

Takayama et al. 2011. A simple and cost-effective approach for microsatellite isolation in non-model plant species using small-scale 454 pyrosequencing. Taxon 60: 1442-1449. z 10-20 tis. sekvencí → 63-284 SSR lokusů

Gardner et al. 2011. Rise of the machines – recommendations for ecologists when using next generation sequencing for microsatellite development. Mol. Ecol. Res. 11, 1093–1101. na 40 funkčních SSR lokusů je u rostlin potřeba asi 25 tis. sekvencí; pro bezobratlé asi 2x tolik sekvencí

Page 16: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Analýza společenstev1. Izolace celkové DNA vzorku

2. PCR amplifikace úseku, který slouží jako marker

(= umožňuje rozlišit taxony společenstva, primery specificky amplifikují pouze zkoumanou tax. skupinu; prokaryota – 16S, eukaryota – LSU, SSU nrDNA)

↓3. Analýza směsi molekul PCR produktu

454 pyrosekvenování ► metoda s nejdelšími ready, analýza amplikonů <600(-800?) bp► obrovské množství sekvencí na 1 vzorek (tisíce až desítky tisíc sekv.) →

překonává všechny ostatní metody

× nutné zvolit vhodně variabilní úsek (délková limitace!), počet analyzovaných vzorků je poněkud limitovaný (nutno řešit separaci vzorků – gasket, MIDs)

► projekt BarFrost: NGS vzorků z permafrostu (rostliny, houby, bezobratlí, až 10 tis. let BP)

Aplikace NGS

Page 17: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

SNP

= Slovenské národné povstanie

… a nebo taky Single Nucleotide Polymorphism

Page 18: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

SNP (single nucleotide polymorphism)

► Nejde o označení metody

► Obecně znamená přítomnost bodové mutace (substituce) v daném místě genomu

► Kodominantní, až 4 alely (ACGT)

► Nutno znát primery pro dané místo genomu

► Počet SNP lokusů velmi vysoký (~ desítky tisíc) a skutečně v celém genomu

► Téměr ideální marker, až půjde rychle a levně sledovat velké množství SNP lokusů najednou

Page 19: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

SNP (single nucleotide polymorphism)► Zatím hlavně u modelových / užitkových organismů a jejich

nejbližších příbuzných» vyhledávání v databázích EST, celých genomů,…

► Aplikace na divoké organismy zatím hlavně v zoologii, v botanice zatím prakticky ne

► … ale za pár let ???

► zoologický příklad:Tokarska et al. 2009, Heredity 103: 326-332» genetická variabilita současné populace zubra a srovnání s

(mnohem větší) populací amerického bizona, cca 54 tis. SNP lokusech pro krávy (BovineSNP50 BeadChip, Illumina)

» úspěšná amplifikace cca 52 tis. SNP lokusů» z nich u zubra ~900 polymorfních (→ kodominantní data!)

Page 20: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Průtoková cytometrie

► Flow cytometry, FCM

► spíše cytologická než molekulární metoda» ale děláme ji u nás v laboratoři…

» umožňuje určit ploidii / počet chromosomů, což je obvykle nezbytné pro interpretaci výsledků molekulárních metod!

» vypovídá o genomu v nejhrubším měřítku• velikost• počet kopií chromosomů• lze odhadovat i zastoupení bazí (AT vs. GC) na úrovni celého

genomu

Page 21: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Průtoková cytometrie

► cytometrie = metoda umožňující sledovat vlastnosti optické částic (buňky, buněčná jádra)» intenzita fluorescence

» rozptyl světla

► průtoková = sledované částice v suspenzi, při průtoku měřící kyvetou

► velmi často používaná v medicíně (běžná diagnostická metoda)

► použití v botanice / zoologii jen výsekem možných aplikací

Page 22: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Vzorky

► suspenze sledovaných částic» krev, hemolymfa,…» voda (plantkton,…)» a u kytek co? jak to dostat z buněčné stany ?

• chemické narušení → protoplasty

• izolace jader

► izolace buněčných jader u rostlin (cca 5 min.)» nasekání tkáně žiletkou v izolačním pufru

• stabilizace jader (vhodné pH, osmolarita, antioxidanty,…)

• detergent (snižuje slepování jader)

» přefiltrování (tkanina 42 μm)» přidání fluorescenční barvy (pokud není součástí izolačního

pufru)

Page 23: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Vzorky

► Obvykle analyzované tkáně» čerstvé listy, stonky, květy,… apod.

» semena

» vysušené tkáně (silikagel)• nepredikovatelné posuny fluorescence, lze použít jen orientačně

– určení ploidie

» fixovaná jádra (glycerol apod.) ?

Page 24: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Průtokový cytometr

Page 25: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Průtokový cytometr

vzorek

zdroj světla» laser» UV lampa /

UV dioda

fluidika» pumpa» sheath fluid

kyveta

odpad

optika + počítač

Page 26: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Fluorescence

► barviva vázající se na DNA» propidium jodid (PI) – interkalační, nespecifické

» DAPI – vazba na AT páry

» příp. jiná barviva specifická pro GC páry (např. mitramycin)

► výsledek vždy porovnáván s vnitřním standardem» rostlina o známém obsahu DNA, zpracovávaná společně se

vzorkem

► zobrazujeme jako histogram» poměr průměrů / mediánů píků

» koeficient variance („šířka“ píků)

» počet buněk

Page 27: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Velikost genomu► poměr mezi fluorescencí vzorku a standardu

► absolutní» barvivo PI» vyjadřuje se v pg nebo Mbp,

1 pg = 978 Mbp» obvykle průměr ze 3 měření jedince

► relativní» barvivo DAPI» standard = 1» vhodná např. pro určení ploidie» přesnější a méně jedovaté

než PI

► porovnáním obou lze spočítat obsah bazí AT / GC

Centaurea weldeniana+

* Glycine max ‘Polanka’

Centaurea 157.92Glycine 189.46poměr 0.833

Glycine 2.50 pgCentaurea = 2.50 *

0.833= 2.08 pg

Page 28: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Velikost genomu

► (holoploidní) velikost genomu» C-hodnota

» 1C = velikost genomu gamet / gametofytu

» 2C = velikost genomu v somatických buňkách (sporofytu)

» měřením zjišťujeme obvykle 2C hodnotu (u cévn. rostlin)

► monoploidní velikost genomu» Cx-hodnota

» velikost genomu jedné průměrné chromosomové sádky

diploid: Cx = 2C / 2

triploid: Cx = 2C / 3

tetraploid Cx = 2C / 4

… atd.

Page 29: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Rozptyl světla

► Forward scatter, FSC » původní vlnová délka, v přímém směru» vypovídá o velikosti částic» v botanických aplikacích se nepoužívá

► Side scatter, SSC » původní vlnová délka, v

kolmém směru» vypovídá o velikosti a vnitřní

struktuře částic» používáme k odlišení

degradovaných jader a „vyčištění“ histogramu fluorescence

Page 30: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Výhody / nevýhody

Výhody► nedestruktivnost► obvykle nejsou potřeba speciální tkáně (× karyologie)► rychlost, statisticky robustní data na populační úrovni

» cca 100 vz. za den, někdy lze analyzovat více jedinců / vz.

► přesnost, detekce drobných rozdílů a vzácných cytotypů► cena

Nevýhody► většinou potřeba čerstvého materiálu► problémy se sekundárními metabolity, slizy,… + analýza pylu► omezená citlivost při vyšších chromosomových počtech (detekce

aneuplodie, B-chromosomy apod.)► stanovení chromosového počtu jen nepřímé

Page 31: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Aplikace v botanice

Analýza ploidního stupně► ploidii odhadujeme nepřímo z velikosti genomu,

nutná kalibrace klasickým počítáním!

► taxonomický znak » Centaurea phrygia – diploid, C. erdneri – tetraploid; morfologicky

ale velmi podobné

► biologie polyploidů» rozšíření cytotypů, geografické, ekologické,… rozdíly» detekce meziploidní hybridů a vzácných cytotypů (např. nových

polyploidů)» detailní studie smíšených populací (prostorové rozmístění, vazba

na mikrostanoviště, hybridizace, kompetice, změny zastoupení cytotypů v čase,…)

Page 32: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Aplikace v botanice

Velikost genomu► taxonomický znak (2C)

» odlišení taxonů se stejným počtem chromosomů, detekova-telné i drobné rozdíly, od 3 – 4 %) – např. Melampyrum

» „vystopování“ původu polyploidů (různé „součty“ možných předků)» skupiny příbuzných druhů (např. několik „základních“ Cx-hodnot,

které jsou stabilní mezi ploidiemi – Batrachium)

► obecnější biologické závislosti» redukce Cx hodnoty se stupněm ploidie» vztahy velikosti genomu k délce životního cyklu, prostředí (nadm.

výška, ostrovy, zeměpisná šířka), vlastnostem druhu (invazivnost,…)

ale pozor na design těchto studií, obvykle problematický

Page 33: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Aplikace v botanice

Reprodukční systém, hybridizace

► u krytosemenných dvojité oplození» embryo 2C (1C ♀ + 1C ♂)

» endosperm 3C (2 * 1C ♀ + 1C ♂)

► jiné poměry v případě odchylek(apomixie, neredukované gamety) » viz grafy – Sorbus (data M. Lepšího)

» hybridizace diploida a tetraploida,vzniklo 3x semeno na diploidovi:(a) hybrid nebo (b) autopolyploid ?

a) 2 * 1C(♀) + 2C(♂) = 4C

b) 2 * 2C(♀) + 1C(♂) = 5C

embryo 2C (2x)

endosperm 3C (3x)normální sexualita

Bellis perennis

embryo

2C (4x)

Bellis perennis

endosperm 6C (12x)pseudogamie, neredu-kované embryo i pyl

Page 34: Metody molekulární biologie v ekologii a systematice rostlin 13 .  NGS, SNP, FCM

Další aplikace

► studium planktonu» detekce hlavních skupin (bakterie, sinice, zelené řasy)

» kombinace několika parametrů – velikost genomu, autofluorescence chlorofylů, specifické barvy pro bakterie,…

» lze i kvantitativně – stanovení počtu buněk / koncentrace► analýzy chromosomů, genomika► medicínské aplikace

» analýza buněčného cyklu (nádorová bujení apod.)

» přítomnost antigenů pro danou protilátku,…

► třídění buněk (sorting)