View
1.503
Download
4
Embed Size (px)
Citation preview
Cursos de Formación de la UAT (2012)
Plataforma de Genómica / Plataforma de Diagnóstico Molecular
“Tecnologías de alto rendimiento en genómica”
2ª Parte: Tecnologías de ultrasecuenciación y de enriquecimiento de secuencia.
Programa del curso
De Sanger hacia NGS
454 de Roche Cómo funciona Flujo de trabajo de la tecnología
Comparación con otros Sistemas NGS
Aplicaciones de las tecnologías de ultrasecuenciación. Estudio de quasiespecies virales mediante análisis de amplicones. Secuenciación de genomas “de novo”. Metagenómica RNAseq Aplicaciones de los arrays de captura de secuencia:
Análisis de exomas Estudio de mutaciones en leucemia mediante arrays de
captura de secuencia.
Análisis de datos de ultrasecuenciación (UEB)
Cualquier DNA puede ser secuenciado
M Tuberculosis
H5N1
C. elegansBarley
Arabidopsis
Maccaca
NeanderthalHIV
Tomato
Potato
HoneybeeMammut
S. cervisiae
James WatsonGrape wine
Genomas Secuenciados
Nature Reviews Genetics 9, 303-313, 2008
Figure 2. Vertebrate genomic sequence data. Phylogenetic tree representing species for which genomic sequence data are currently available Green indicates that BAC (bacterial artificial chromosome)-based sequence is available in targeted regions of the genome11, 15. Yellow represents 2X whole-genome shotgun assemblies17, and blue represents full-shotgun or near-complete genomic sequence assemblies.
Over the past years the genomes of some of the most impotant model organisms have been sequenced:
1953
1977
70´s
1987
1990
2003
2005
2010
2012
Francis Crick and James Watson
describen el modelo de la
doble hélice del DNA.
“ DNA sequencing by
chemical degradation ”
Maxam y Gilbert
ABI comercializa
el 1ª secuenciador automático,
ABI 370.
El NIH empieza
secuenciación
a gran escala de diversos
microorgs.
phi X 174 Primer genoma de
DNA completo secuenciado
11 genes en 5386 bases (cadena
sencilla)
FinalizaciónProyecto Genoma Humano (13 años)
Lanzamiento de SOLEXA (Illumina)
Secuenciación Genoma
Watson mediante
454/ROCHENature 452, 872-876 (17 April 2008).
Lanzamiento de SOLID
(ABI)
1000 Genomes Project
“Chain-terminator method”
Sanger et al. Método usado
durante los proximos 30 años
Lanzamiento de
GS20 (454 Life
Science)
GS FLX(ROCHE)
2008
2009
Helicos BioSciences
2006
2007
Cronología de la Secuenciación
GS FLX-Titanium(ROCHE)
GS FLX+ROCHE)
ddTTPddATPddGTP ddCTP
dTTP
dATPdGTP
dCTP
5´
3´ CGGTCAGCCTACGTATACAGACTCAGCGGTCAGCCTACGTATACAGACTCACGGTCAGCCTACGTATACAGACTCCGGTCAGCCTACGTATACAGACTCGGTCAGCCTACGTATACAGACCGGTCAGCCTACGTATACAGACGGTCAGCCTACGTATACAGCGGTCAGCCTACGTATACACGGTCAGCCTACGTATACCGGTCAGCCTACGTATACGGTCAGCCTACGTATCGGTCAGCCTACGTACGGTCAGCCTACGTCGGTCAGCCTACGCGGTCAGCCTACCGGTCAGCCTACGGTCAGCCTCGGTCAGCCCGGTCAGCCGGTCAGCGGTCACGGTCCGGTCGGCGC
1ª Generación Secuenciación
Método manual de Secuenciación SangerNucleótidos Modificados
Método automático de Secuenciación Sanger
Nucleótidos Modificados Marcados
3´…GCCAGTCGGATGCATATGTCTGAGTC…5´5´…CGGT
PolimerasaSecuencia molde:Primer:+
Electroforesis(1 Secuencia/Capilar)
ddGTP ddATP ddTTP ddCTP
3´..GCCAGTCGGATGCATATGTCTGAGTC..5´5´…CGGT
PolimerasaSecuencia molde:Primer:
+dTTP
dATPdGTP
dCTP
CGGTCAGCCTACCGGTCAGCCTACGGTCAGCCTCGGTCAGCCCGGTCAGCCGGTCAG
GCCTAC
(Marcaje radioactivo en el Primer o en uno de los 4 dNTPs en cada tubo)
Grupo fosfato
Base
H
Estrategia de Secuenciación a gran escala
Secuenciación de fragmentos largos de DNA.
El DNA se fragmenta en trozos al azar y se clonan en una biblioteca bacteriana.
El ADN de los clones bacterianos individuales se secuencian mediante Secuenciación Sanger automática.
La secuencia se ensamblan observando las regiones solapantes.
Los Gaps se pueden rellenar mediante paseos de cebadores.
1ª Generación Secuenciación
Sanger sequencing:- Long reads (500-1000 bp)- Low throughput (192 reactions/run)
1ª Generación Secuenciación
3.000 millones de dólares para secuenciar
3.000 nts (1$/nt)
Primer borrador Genoma Humano
2ª Generación Secuenciación
Los Instrumentos de secuenciación de 2ª generación son capaces de generar cientos de miles de reacciones de
secuencias en paralelo en un día como los generados por varios cientos de secuenciadores con capilares tipo
Sanger, a un coste por base leída más barato.
2004 2006-2009
Coste 0.01$/bp 0.0001$/bp
Capacidad/Instrumento/día 1.000.000 5.000.000.000˃
2ª Generación Secuenciación
Illumina
Life Technology
ROCHE
GS FLX 454
SOLiD™ 4 System 5500 System
5500xl System
SOLiD™ 3System Ion Torrent System
GS Junior 454GS FLX+ 454
HiSeq 2000 HiSeq 1000 HiScanSQ Genome Analyzer
IIx
MiSeqSolexa
Sanger vs 2ª Generación Secuenciación
1. Fragmentación de DNA 1. Fragmentación de DNA
2.Clonaje en Vectores; Transformación Bacterias; crecimiento y aislamiento vector DNA
2. Ligación de adaptadores in vitro y amplificación clonal
3. Ciclo Secuenciación
CTATGCTCG
Secuencia:Primer:
PolimerasadNTPsddNTPs marcados
Electroforesis(1 Secuencia/Capilar)
3. Secuenciación masiva en paralelo
4. Procesamiento imagen 4. Procesamiento imagen
Programa del curso
De Sanger hacia NGS
454 de Roche Cómo funciona Flujo de trabajo de la tecnología
Comparación con otros Sistemas NGS
Aplicaciones de las tecnologías de ultrasecuenciación. Estudio de quasiespecies virales mediante análisis de amplicones. Secuenciación de genomas “de novo”. Metagenómica RNAseq Aplicaciones de los arrays de captura de secuencia:
Análisis de exomas Estudio de mutaciones en leucemia mediante arrays de
captura de secuencia.
Análisis de datos de ultrasecuenciación (UEB)
GS 454 de ROCHE
GS FLX + GS Junior
PicoTiterPlateFLX+ (70x70mm)
1ª Generación3100 ABI
2ª Generación GS ROCHE
384p-Plates PicoTiterPlateJunior
GS 454 de ROCHE: Como funciona
96p-Plates
Formato de Placa
Multiplexar (MIDS; Tamaño amplicón; Primer)
N= num de muestras que puedo secuenciar en un run G= tamaño de lo que quiero secuenciar C= Coverage (C= N * L / G)
N= (GxC)/Mbp por región PTP
GasketsGS FLX+ Junior 454
¿Cúantas muestras se pueden secuenciar por run?
GS 454 de ROCHE: Como funciona
Multiplexar (MIDS; Tamaño amplicón; Primer)
70.000-100.000
2. Construcción Librería
3. Amplificación mediante emPCR
4. Secuenciación
GS FLX/Junior 454 Workflow
1.Calidad & CantidadMaterial de partida
gDNA, DNA plasmídico, RNA
Datos Obtenidos
1. Calidad & Cantidad Material de partida
gDNA, DNA plasmídico, RNA
1.1 Calidad mediante Chips Bioanalyzer; gel agarosa
1.2 Cuantificación mediante Picogreen (gDNA, amplicones) o Ribogreen (RNA)
y = 34,577x - 61,596R2 = 0,9994
0
5000
10000
15000
20000
0 200 400 600Lambda DNA (ng/mL)
Flu
ore
scen
ce
.
Fluorímetro FLx800
2. Construcción Librería
3. Amplificación mediante emPCR
4. Secuenciación
GS FLX/Junior 454 Workflow
1.Calidad & CantidadMaterial de partida
gDNA, DNA plasmídico, RNA
Datos Obtenidos
2. Construcción Librería
gDNA, DNA plasmídico RNA
PCR con Fusion Primers
FragmentaciónSelección Tamaño Ligación Adaptadores
Librería ShotgunLibrería Pair-EndLibrería cDNA
Librería Amplicones
Adaptador A (44 bases): Adaptador B (44 bases) Fusion Primers
Primer Amplificación Primer
Secuenciación4
nucleótidos“Key”
Primer Amplificación Primer
Secuenciación4
nucleótidos“Key”Biotina
Adaptador A Target
Adaptador B Target
Fuerzas de rotura hidrodinámicas
Orificio
gDNA
gDNA fragmentado
Librerías Shotgun
NEBULIZACIÓN
2.1 bar (30psi)
2. Construcción Librería: Fragmentación gDNA
Librerías Pair-End
HYDROSHEAR
DNA genómico Fragmentos de DNAde doble cadena
Rotura utilizando nitrógeno a alta presión
Nebulize
2. Construcción Librería: Fragmentación RNA
Librerías cDNA
RNA
Fragmentos de cDNAde doble cadena
Solución de Fragmentación de
RNA
First Strand Synthesis
Random
Primers
Second Strand Synthesis
2. Construcción Librería: Selección fragmentos
DNA 7500 Lab Chip
50pb-1000pb
gDNA Nebulizado:
gDNA fragmentado con Hydroshear:
300pb-1000pb
DNA 7500 LabChip
Tamaño medio de 500-600 nt (dep. del contenido en GC)Menos del 10% ≤ 300 nt, no adaptor dimers
Conc >0.2 ng/μl (Ribogreen ®)
RNA Pico 6000 LabChip
500pb-600 nt
AMPure beads SPRI (Solid Phase Reversible Immobilization)
Electroelución
Inmobilización Fragmentos y aislamiento de la Librería:
2. Construcción Librería
Melt Solution
4 tipos de productos resultan de la ligación
Los productos con Biotina (AB, BA, BB) se unen a bolas magnéticas que llevan estreptavidina. Los products AA son lavados y eliminados.
Mediante Melt Solution (NaOH0.1N) las cadenas no biotiniladas de cada fragmento de dsDNA son aisladas. Ambas cadenas de los fragmentos BB quedarán unidas a las bolas.
Sólo se aislan cadenas de DNA sencilla AB constituyendo la librería.
AB
BA
BB
AA
Num de Avogadro es 6.022x1023 (moléculas/mole)
328.3x109 (gramos/mole) es peso molecular medio de nts.
Perfil típico de una librería ssDNA (Agilent 2100 RNA Pico 6000 LabChip): Tamaño medio de 500-800 bp
Cuantificación mediante Ribogreen
Dilución de trabajo para emPCR
Molecules/μl =
2. Construcción Librería: Q&Q Librería
2. Construcción Librería
3. Amplificación mediante emPCR
4. Secuenciación
GS FLX/Junior 454 Workflow
1.Calidad & CantidadMaterial de partida
Datos Obtenidos
gDNA, DNA plasmídico, RNA
3. Amplificación mediante emPCR
-1 starting effective fragment per microreactor- ~106 microreactors per ml- All processed in parallel (Amplificación clonal)
High-speed shaker
Reacción de emPCR:
Enrequecimiento de beads con DNA:
% Enrequecimiento=
3. Amplificación mediante emPCR
DNA-beads/ml
Input beadsx100
% Recuperación=DNA-beads/ml
Input beadsx100
Recuperación de beads después de la emPCR:
Rotura y Recuperación Contaje
Melt
dsDNAUnión de Primer
marcado con Biotina a bolas de captura con
ssDNA
Adición de bolas magnéticas con estreptavidina
Melt
5-20% óptimo
65%, 85% óptimo
Antes de la emPCR:
emPCR Titulación sólo para GS FLX
¿Cuántas copias de librería por Beads de captura son óptimas?
Tubo Moléculas de Librería por Bead de Captura (cpb)
Vol Librería Diluida
1 2 1.2 µl
2 4 2.4 µl
3 8 4.8 µl
4 16 9.6 µl
1. Procesar 4 tubos emulsiones
2. Recuperación y enrequecimiento de cada tubo3. Contaje de las beads enriquecidas4. Escoger el ratio copia/bead con aproximadamente un 8% de enrequecimiento
2. Construcción Librería
3. Amplificación mediante emPCR
4. Secuenciación
GS FLX/Junior 454 Workflow
1.Calidad & CantidadMaterial de partida
Datos Obtenidos
gDNA, DNA plasmídico, RNA
4. Secuenciación
Metal coated PTP reduces crosstalk29 μm well diameter (20/bead)3,400,000 wells per PTP
Gaskets
Secuenciación mediante síntesisQuímica basada en la pirosecuenciación
Polimerasa añade nucleótidos (dATP)
Se libera pirofosfato (PPi)
Sulfurilasa crea ATP a partir del PPi
Luciferasa hidroliza ATP y usa luciferina para producir luz.
Light + oxyluciferin
Luciferina
Sulfurylase
Luciferase
4. Secuenciación
Nucleotides are flowed sequentially across the PTPone at a time (200 cycles à 4 bases)
Pyrophosphate signal generation upon complimentary nucleotide incorporation —dark otherwise
The CCD camera is generating a image after every flow
The signal strength is proportional to the number of nucleotides incorporated
Flujo de Reactivos
4. Secuenciación
4. Secuenciación
Flowgama y Base calling:
4. Secuenciación:Ejemplo
Especificaciones Sistemas GS FLX & GS Junior
GS FLX+ System GS Junior System
El futuro de la secuenciación 454
Programa del curso
De Sanger hacia NGS
454 de Roche Cómo funciona Flujo de trabajo de la tecnología
Comparación con otros Sistemas NGS
Aplicaciones de las tecnologías de ultrasecuenciación. Estudio de quasiespecies virales mediante análisis de amplicones. Secuenciación de genomas “de novo”. Metagenómica RNAseq Aplicaciones de los arrays de captura de secuencia:
Análisis de exomas Estudio de mutaciones en leucemia mediante arrays de
captura de secuencia.
Análisis de datos de ultrasecuenciación (UEB)
Comparación con otros Sistemas NGS
Cuadro resumen de las posibles combinaciones de estrategias en las diferentes plataformas de NGS
2ª NGS 3ª NGS
ABIROCHE
Illumina
3ª NGSRocheABIIllumina
Chemistry based onpirosequencing
Sample amplified byemulsion PCR
Read length 250-500 bp
>1 million reads per run
400-600 Mb of sequence
~10 hours run
GS FLX 454
Chemistry based onreversible terminators
Sample amplified by solidphase amplification
Read length 2x100 bp
3 billions reads per run
600 Gb of sequence
2-11 days run
HiSeq 2000-Illumina ABI SOLID 5500xl
Chemistry based onsequencing by ligation
Sample amplified byemulsion PCR
Read length 50-100 bp
100-500 million reads per run
50-100 Gb of sequence
4-8 days run
Comparación Plataformas NGS
EQUIPO ROCHE GS FLX 454
ILLUMINA HISEQ 2000
ABI 5500XL SOLID
Coste del equipo 450.000 $ 690.000 $ 251.000 $
Coste de los reactivos por run*
6.200 $ 23.470 $ 10.503 $
Coste por Mb 12 $ 0,07 $ 0,04 $
Fuente: http://www.molecularecologist.com/next-gen-fieldguide/
Comparación Plataformas secuenciación
Comparación Plataformas secuenciación
Comparación Plataformas secuenciación
Aplicaciones
Comparación Plataformas secuenciación
Next Generation Genomics: World Map of High-throughput Sequencers
Ejemplos de Genomas humanos secuenciados
Nature Reviews Genetics 11, 31-46 (January 2010)
Comparación Plataformas secuenciación
1ª Generación 2ª Generación
SCIENCE Vol 323 2 JANUARY 2009
John Eid,John Eid,** Adrian Fehr, Adrian Fehr,** Jeremy Gray, Jeremy Gray,** Khai Luong, Khai Luong,** John Lyle, John Lyle,** Geoff Otto, Geoff Otto,** Paul Peluso,Paul Peluso,** David Rank, David Rank,** Primo Baybayan, Brad Bettman, Arkadiusz Bibillo, Primo Baybayan, Brad Bettman, Arkadiusz Bibillo, Keith Bjornson, Bidhan Chaudhuri, Frederick Christians, Ronald Cicero, Keith Bjornson, Bidhan Chaudhuri, Frederick Christians, Ronald Cicero, Sonya Clark, Ravindra Dalal, Alex deWinter, John Dixon, Mathieu Foquet, Sonya Clark, Ravindra Dalal, Alex deWinter, John Dixon, Mathieu Foquet, Alfred Gaertner, Paul Hardenbol, Cheryl Heiner, Kevin Hester, David Holden, Alfred Gaertner, Paul Hardenbol, Cheryl Heiner, Kevin Hester, David Holden, Gregory Kearns, Xiangxu Kong, Ronald Kuse, Yves Lacroix, Steven Lin, Paul Gregory Kearns, Xiangxu Kong, Ronald Kuse, Yves Lacroix, Steven Lin, Paul Lundquist, Congcong Ma, Patrick Marks, Mark Maxham, Devon Murphy, Insil Lundquist, Congcong Ma, Patrick Marks, Mark Maxham, Devon Murphy, Insil Park, Thang Pham, Michael Phillips, Joy Roy, Robert Sebra, Gene Shen, Jon Park, Thang Pham, Michael Phillips, Joy Roy, Robert Sebra, Gene Shen, Jon Sorenson, Austin Tomaney, Kevin Travers, Mark Trulson, John Vieceli, Jeffrey Sorenson, Austin Tomaney, Kevin Travers, Mark Trulson, John Vieceli, Jeffrey Wegener, Dawn Wu, Alicia Yang, Denis Zaccarin, Peter Zhao, Frank Zhong, Wegener, Dawn Wu, Alicia Yang, Denis Zaccarin, Peter Zhao, Frank Zhong, Jonas Korlach, Stephen Turner.Jonas Korlach, Stephen Turner.
Real-Time DNA Sequencing from Single Polymerase Molecules
MENLO PARK, Calif., Feb 23, 2010 Pacific Biosciences, a private company developing a disruptive technology platform for real-time detection of biological events at single molecule resolution, today announced the 10 institutions that have purchased its Single Molecule Real Time (SMRT(TM)) DNA sequencing system as part of the company's early access program in North America.
Eleven Leading Companies Support Launch of Third-generation DNA Sequencing
Press Release
Pacific Biosciences Announces Early Access Customers for Its Single Molecule Real Time System
http://www.pacificbiosciences.com
3ª Generación Secuenciación
Programa del curso
De Sanger hacia NGS
454 de Roche Cómo funciona Flujo de trabajo de la tecnología
Comparación con otros Sistemas NGS
Aplicaciones de las tecnologías de ultrasecuenciación. Estudio de quasiespecies virales mediante análisis de amplicones. Secuenciación de genomas “de novo”. Metagenómica RNAseq Aplicaciones de los arrays de captura de secuencia:
Análisis de exomas Estudio de mutaciones en leucemia mediante arrays de
captura de secuencia.
Análisis de datos de ultrasecuenciación (UEB)
PAUTAS PARA EL DISEÑO EXPERIMENTAL DE UN ESTUDIO DE ULTRASECUENCIACIÓN
Pautes para el Diseño experimental de un estudio de ultrasecuenciación
EXPERIMENTAL DESIGN QUALITY SAMPLES COLLECTION
SAMPLE PROCESSING
DATA ANALYSIS
RESULTS CHECKING
SEQUENCING
EXPERIMENTS
Statistics and Bioinformatics (UEB)
UCTS
Researcher
UCTS WORKFLOW
UEB UCTS
Others
Programa del curso
De Sanger hacia NGS
454 de Roche Cómo funciona Flujo de trabajo de la tecnología
Comparación con otros Sistemas NGS
Aplicaciones de las tecnologías de ultrasecuenciación. Estudio de quasiespecies virales mediante análisis de amplicones. Secuenciación de genomas “de novo”. Metagenómica RNAseq Aplicaciones de los arrays de captura de secuencia:
Análisis de exomas Estudio de mutaciones en leucemia mediante arrays de
captura de secuencia.
Análisis de datos de ultrasecuenciación (UEB)
Fin