Upload
xrbiotech
View
137
Download
6
Tags:
Embed Size (px)
Citation preview
Interroga)ng RNA heterogeneity RNASeq in the ENCODE project
[email protected] Centre de Regulació Genòmica, Universitat Pompeu Fabra
2001: la culminació del projecte The Human Genome
23/07/13 3
23/07/13 4
5
The ENCyclopedia Of DNA Elements
23/07/13 6
ENCODE Project
• The genome (DNA sequence) is constant across highly diverse cell types
• Genome ac)vity is different across cell types • The ENCODE project aZempts to characterize the ac)ve regions of the genome in as many cell types/condi)ons as possible
7
ENCODE Timeline
8 Elise Feingold,NHGRI
2007 Results of ENCODE Pilot Phase on 1% of the human genome published
4 June
23/07/13 9
ENCODE assays
A user's guide to the encyclopedia of DNA elements (ENCODE). The ENCODE ConsorBum. PlOS Biology, 2011
Chip-seq (~150) RNA-seq (~100) Dnase-seq (~100)
Next Genera)on Sequecing
• Genomic sequencing • cDNA to RNA. RNASeq
– Transcriptome characteriza)on
• DNA bound to proteins. ChIPSeq – Transcrip)on Factors – Histone modifica)ons
• DNA modifca)ons. i.e. MethylSeq. – DNA methyla)on
• and many others…
11
ENCODE Uniform Analysis Pipeline
Mapped reads from produc)on (Bam)
Uniform Peak Calling Pipeline (SPP, PeakSeq)
IDR Processing, QC and Blacklist Filtering
Mo)f Discovery Stats, GSC enrichments, etc.
Signal Aggrega)on over peaks
Signal Genera)on (read extension and mappability correc)on)
Segmenta)on
Poor reproducibility Good reproducibility
Rep1
Rep2
Self Organising Maps
ChromHMM/Segway
Anshul Kundaje, Qunhua Li, Michael Hoffman, Jason Ernst, Joel Rozowsky, Pouya Kheradpour
Irreproducible Discovery Rate (IDR)
If one re-ran the experiment, what is the probability one would observe the same element at this rank or better Uses ranked element lists from two replicates, and makes the assumption that there is noise at the bottom of the rank
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
! !
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
! !
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
! !
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!!
!
!!
!
!
! !!!
!!!
!! !
!
!
!
!
!!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
! !!
!
!
!
!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!!
!
! !!! !
!
!!! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!! ! !
! !
!
!
!
!
!
!!!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
! !
!
!! !
!
!
!
!
!
!
!
!
!
!
! !
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!
!!!
!
!
!!
!
!
!
!
!!!
!
!
!
!
!
!
!
!! !
!
!!
!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
! !
! !
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!!
!
!!
!
!
!
!
!
!!
!
!
!!
!
!
! !
!
!
!
!!!
!
!
!
!
!!
!
!
!!
!
!
!
!
!
!! !
!
!
!
!
!
!
!
!
!
!
!!
! !!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!!
!
!
!
! !!
!
!
!!
!
!
!
!
!!!
!
!
!
! !
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!!
!!!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!! !
! !
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
! !!
!
!
!
!!
!
!
!
!
!
!!
! !
!
!
!
!
!!
!
!
!
!
!
!
!!
!
!
!
!
!
!!! !
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!!
!
!
!!
!!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!! !
!
!
! !
!
!
!
!
!
!
!!
!
!!
!
!
!!! !
!
!
!
!
!!
!
!
!!
!
!
!
!
! !
!
!
!!
!
!
!
!
!
!
!
!!!!
!
!
! !
!
!
!
!
!
!
!!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
! !
!
!!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!!!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !!!
!
!
!
!!!
!
!
! !!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!!!
! !!!
!
!
!
!!
!! !
!
!
!
!
!!
!
!!
!!
!!!
!!
!
!
!!!
!
!
!
!
!!
!
!
!
!
!
!
!
! !
!!!
!
! !!
!
!
!
!!!! !
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
! !
!
!
!! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!!
!
!
!!
!
!
!
!
!
!
!! !!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!! !!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!!!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!!
!
!!
!
!
!
!
!!
!!
!
!
!
!!
!!
!
!
!
!
!!
!!!!
! !
!
!
!
!
!
!
!
!
!
! !!
!
!
!
!!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
! !
!
!!!
!!!
!
!
!
!
!
!
!
!
!
!!
!
!!
! !
!
!
!
!!
!!
! !
!
!
!
! !
!!
!
!
!!
!
!!!
!
!
!
!!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !!
!
!!
!!
!
!
!!
!
!!!!
!
!
!
!
!
!
!
!
!
!
!
!
!! !
!
!
!
!
! !!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!!!
!
!
!
!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!!
!
!
!
!!
!
!
! ! !!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!!
!
!!
!
!
!
!
!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!
!!
!
!
!
!
!
!!!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!! !
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!!
!
!
!
!
!!
!!
!
!!
!! !
! !
!!
!
!
!!
!!
!
!! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
! !
!
!
!!
!
!
!!!
!
!!
!
!
!
!
!!
! !!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!!
!
!
!
!!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!!! !
!
!!!
!
!
!
!
!
!
!
! !
!
!
!!
! ! ! !
!! !
!!
!
! !!
!
!
!
!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
! !!
!
!
!
!!
!!!
!!
!
!
!
!!
!! !
!!!
!
!!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!!!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
! !!
!
!!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!! !
!
! !
!
!
!
!
!
!
!
!
!
!
! !!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
! !!
!
!
!
!!!
!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!!!!
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!!
!
!!
!
!
!
!
!
!
!
!
!!!
!
!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!
!!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!! !
!
!
!
!
!
! !
!
!!
!!
!!!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!!
!
!
!
!!
!
!
!
!!
!
!
!
!
!
!!
!
!
!!
!
!
!
!
!
!
!!!
!
!
!
!
!!
!
!
!
! !
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
! !
!
!!
!
! !
!
!
!!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!!
!
!
!
!
!!!
!
!
!!
!
!
!!
!
!
!
!!
!!
!!
!
!
!
!
!!
! !
!!!
!
!!
!
!!
!!
! !!
! !
!!
!
!
!
!
!
!
! !
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!! !
!
!!
!
!
!
!
!
!!
!
!
!
!
!
!
! !
!
!
! !!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
! !
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!! !
!!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
! !
!
!!
!
!
!!
!
! !
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!!
!
!
!
!
!
!!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
! !
!
!
!
!
!
!
!!
! !!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!!
!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!!
!!
!
!!
!
!!
!
!
!
! !
!!
!
!
!!
!
!!
!!
!
!
!
! !
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!!
!!
!
!
!
!!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!!
!
!
!
!
!!
!!
!
!
!!
!
!! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!!!
!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!!
!
!
!!!
!
!
!
!
!!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
! !
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
! !
!
!
!
!!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!!!
!!
!
!
!
!
!
!
! !!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!!
! !
!
!
! !
!
!
!
!
!!
!
!
!!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
! !! !
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!!!
!
!
!
!
! !
!!!
!
!!!
!
!
!!! !
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
! !
!
!!
!
!
!!
!
!
!! !
!
!!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
! !
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
! !
!! !!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
! !!
!
!
!
! !
!
!!
!
!
!
!
!
!
!
!
!
!! !
!
!
!
!
!
!
!
!
!
!!
!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!!
!!
!!
!
!!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!!!
!!
!
!
!
!
!
!!
!
!!!
!
!
!!
!
!
!
!!
!
!
!!
!
!
!!!
!
!
!
!
!
! !
!
! !
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!!
!
!
!
!
!
!! !
!
!!
!
!!
!
!
!!
!
! !
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!!!!
!
!
!
!
!
!
!
!!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!
!
!!
!
!
!!
!
!
!
!!
!
! !!
!
!
!
!
!!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!! !
!
!
!
!!
!
!
!
!
!
!
!
!!
!!
!
!! !
!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
! !
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !!
!!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!! !
!
!
!! !
!!
!
!
!
!
!
!!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!!
!
!
!
!
!
! !
! !
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!!
!
!
!
!!
!
!
!
!
!
!!!
!
!
!
!!
! !
!!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
! !!
!
!
!
!
! !
!!
!
!
!
!
!
!
!
!
!!
!!!
!
!
!
!
!!
!
!
! !
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
! !!!
!
!!! !
!
!
!
!
!
!!
!
! !!
!
!
!! !
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
! !
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!!
!
!
!
!!
!!
!!
!
!
!
!
!
!
!!
!!
!
!
!
!
! !
!
! ! !
!
!
!
!
!
!
!
!
!!
!
!
!!!
!
!
!
!
!
!
!
!
!
! ! !
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!!!! !!
!
!! !
!
!!
!!
!
!
!
!
!
!
!!
!
!!!!!
!
!
!
!
!!
!!
!
!! !
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!!
!
!!
!
!
!!!
!
!!! !!!
!
! !
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
! !
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!!!
!
! !
!!
!!
!
!!
!! !
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!! !
!
!!
!!
!!! !
!!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
! !
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!!
!
!
!
!
!
!!
!
!
!
!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!!!
!
!!
!
!!!
!
!!!
!
!
!
!
!
!
!!
! !
!
!
!!
!
!
!
!!
!
!
!
!!
!
!!!
!
!
!
!
!
!!
!
!
!
!!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!!!!!
!
!
!!!
!
!!
!
!
!
!!
!!!!!
!
!
!
!
!
!!
!
!
!
!
!
!
! !
!
!
!
!!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
! !
!
! !
!
!
!!
!!
!!
!
!
!
!
!!!
!
! !!
!
!
!
!! !!
!!
!
!
!
!!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
! !!
!
!
!
!! !
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!!
!
!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!
!
!
!
!!
!
!
!
! !
!
!
!
!
!!
!!
!
!
!
!
!!
!!
!
!
!
!
!!!
!
!
!!
!!! !
!
!! !
!
! !
!!
!
!
!
!!!
!
!
!
!
!
! ! !
!
!!
!!
!!!
! !
!
!
!
!
!!
!
!!
!
!
!!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!!
! !!
!
!! !!
!!!
!
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!!!
!
!
!!!
!
!
!
!!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
! !
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!
!!!
!
!
! !
!
!
!
!!
!
!!
!!
!
!!!
!
!
!
!!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
! !
!!
!
!
!
!!
!
!!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!!
! !!!
!
!
!!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
! !
!
!
!! !
!
!
!
!
!
!
!
! !
!
!! !
!
!
!
!
!!
!! !
!
!!!
!
!
!
! !
!!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!!!
!!
! !
!
!
!
!
!
!
!
!
!
!
!
!! !
!
!!
!
!
! !
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!!
!!
!!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!!
!
!
!!!
!
!
!!
!
!!!
!
!
!
!
!
! !
!
!
!!
!!
!
!
!!
!
!
!!
!!
!
!
!
!
!!
!!!
!
!
!
!
!
!
!
!
!
!
!!!
!!
!
!! !
!
!
!
!
!!
!
!
!
!
!
!
!!
!!
!
!! !
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
! !
!
!
!! !!
!
!
!
!
!!
!
!!
!
!
!
!
!
!!
!
!!!
!
!!!
!!!
!
!
!
!
!
!
!
!
! !
!
!
!
!
!
!!
!
!
!
! !
!
!
!
!
!!
!
!!
!
!
!
!!
!!
!!!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!
!
!
!
!
!! !
!
!
!
!!!
!
!
!
!!
!
! !
!
!
!
!!
!!
!
!
!! !!! !
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!!
!
!
!
!
!
!
!!
!!
!
!
!
! !!
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
! !
!
!
!
!
!!
!!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
! !!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!!
!
!
!
!!
!!
!
!!
!!
!!
!
!
!!
!!
!
!
!
!
!!
!!
!
!!
!!
!!
!
!
!
!
!
!
!
!
!
!
!! !
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!
!!
!!
!
! !
!
!
!
!!!
!
!
! !
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!!
!
!
!
!
!!
!!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!!!
!
!
!
!
!!
!
!
!!
!
!
!
! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!!!
!
!
!!!
!
!
!
!!
!! !
!!
!
!
!
!
!
!
!
!
!!!
!
!
!!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!!
!
!
!
!
!
!
!!
!
!
!!!
!
!
!!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!!
! ! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
! !
!
!
!
!
!!
!
!!
!
!
! !
!
!
!
!
!
!
!
!
!!
!
!
!
!
!!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!!
!
!!
!
!
!!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
! !
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!!
!
!!
!
!
!
!
!! !
!
!
!
!
!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!!
!
!
!
!
!
!!
!
!!
!
!
!
!
!!!
!
!
! !
! !!
!
!
!
!
! !
!!
!
!!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!!
!!
!
!!!
!
!
!
!
!
!
!
!
!
! !
!
!
!
!!
!
!
!
!
!
!
!
!!!
!
!
!
!
!
!
!
! !
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!!!
!
!
!
!
!!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!!
!
!
!
!
!
!
!
!!
!
!
!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
1e+01 1e+03 1e+05 1e+07
1e
+0
11
e+
03
1e
+0
51
e+
07
Score Repl1S
co
re R
ep
l2
Chip-seq Dnase-seq RNA-seq
Ben Brown, Qunhau Li, Peter Bickel
14
15
17
Graur et al., 2013, Genome Biology and Evolu1on
This absurd conclusion was reached through various means, chiefly • (1) by employing the seldom used “causal role” defini)on of
biological func)on and then applying it inconsistently to different biochemical proper)es,
• (2) by commijng a logical fallacy known as “affirming the consequent,”
• 3) by failing to appreciate the crucial difference between “junk DNA” and “garbage DNA,”
• (4) by using analy)cal methods that yield biased errors and inflate esBmates of func)onality,
• (5) by favoring sta)s)cal sensi)vity over specificity, and • (6) by emphasizing sta)s)cal significance rather than the
magnitude of the effect. Here, we detail the many logical and methodological transgressions involved in assigning func)onality to almost every nucleo)de in the human genome.
18
19
Raw genome coverage of elements Element Type Coverage CumulaBve
Coverage
Exons 3% 3%
Chip-‐seq bound mo)fs 4.5% 5%
DNaseI Footprints 5.7% 9%
Chip-‐seq bound regions 8.1% 12%
DNaseI HS regions 15.2% 19.4%
Histone Modifica)ons (*) 44% 49%
RNA 62% 80%
(* excluding broad marks) 20
21
22
ENCODE Publica)ons
Mike Pazin,NHGRI
RNA in the ENCODE project
23/07/13 23
July 23, 2013 24
RNA (as the first phenotype)
• Transcrip)on to RNA and subsequent processing is the first step in the unfolding of the intruc)ons encoded in the DNA.
• There is a one-‐to-‐one correspondence between the RNA content of the cell and the cellular phenotype (which is obviolusly not true for the DNA)
• The phenotypic effects of the varia)ons in the DNA are ul)mately mediated by varia)ons in the RNA content of cell.
The ENCODE RNA assays (CSHL, CalTech)
23/07/13 25 Carrie Davis, CSHL
The ENCODE RNASeq pipeline • Reads mapped to genome and transcriptome using STAR (CSHL)—an splice aware RNASeq mapper
• Independent from the annota)on (GENCODE) – Splice Sites – RNASeq con)gs – Cufflinks (CalTech) genes and transcripts models – In all cases, use IDR to select reproducible elements across the replicates
• GENCODE quan)a)on – Quan)fica)on of exons, genes and transcripts using the Flux Capacitor (CRG)
– In all cases, use IDR to select reproducible elements across replicates
23/07/13 26
hHp://genome.ucsc.edu/ENCODE/
The RNA dashboard (hZp://genome.crg.cat/encode_RNA_dashboard)
23/07/13 27
Julien Lagarde Maik, Roder
The ENCODE RNASeq
23/07/13 28 Carrie Davis, CSHL
Red: propor)on of nucleo)des in genomic domains covered by RNASeq con)gs
29
ENCODE RNASeq cumulaBve coverage of the Human Genome
Sarah Djebali
Expression of coding vs long non coding genes.
Angelika Merkel
23/07/13 31
23/07/13 32
Expression of coding vs long non coding genes.
Angelika Merkel
Quantitative models of Transcription - Histones
Xianjun Dong, Zhiping Weng
H3k79me2
H3k9ac
Quantitative models of Transcription - TFs
Chao Cheng, Mark Gerstein
−4 −2 0 2 4 6 8
−5
05
10
CAGE PolyA+ K562 Cytosol
Predicted expression (log2)
Me
asu
red
exp
ressio
n (
log
2)
R = 0.81 (R2 = 0.64)RMSE = 2.56Classification: AUC = 0.90Rrgression: R = 0.62 (R2 = 0.38; RMSE = 3.06)
Relative importance of TFs
Cla
ssific
atio
n
02
06
0
YY1
ETS
1
MYCM
AX
ELF
1
E2F
4
EGR1
E2F
6JU
N
REST
TAL1
MXI1
SP1
ZBTB
7A
BCLA
F1
MAFK
GABPA
USF1
THAP1
CEBPB
GAT
A2FO
S
ATF3
BCL3
FOSL1
SRF
USF2
SPI1
ZBTB
33
ZNF27
4
GAT
A1
ZNF26
3SP2
NFYA
SIX
5
NRF1
NR2C
2
NFY
B
JUND
NFE
2
Re
gre
ssio
n
01
00
02
50
0
YY1
E2F
4
ETS
1
MYC
ELF
1
RESTJU
N
EGR1M
AXFO
S
ZNF27
4
ZBTB
7A
NFYA
TAL1
GABPA
MXI1SIX
5
THAP1
ZNF26
3
NFY
B
NR2C
2
GAT
A1
NRF1
SP2
E2F
6
BCLA
F1
GAT
A2SP1
BCL3
SPI1
USF2
CEBPB
USF1
ATF3
FOSL1
MAFK
ZBTB
33SRF
JUND
NFE
2
YY1, E2F4, ETS1
−4 −2 0 2 4 6 8
−5
05
10
CAGE PolyA+ K562 Cytosol
Predicted expression (log2)
Me
asu
red
exp
ressio
n (
log
2)
R = 0.81 (R2 = 0.64)RMSE = 2.56Classification: AUC = 0.90Rrgression: R = 0.62 (R2 = 0.38; RMSE = 3.06)
Relative importance of TFs
Cla
ssific
atio
n
02
06
0
YY1
ETS
1
MYCM
AX
ELF
1
E2F
4
EGR1
E2F
6JU
N
REST
TAL1
MXI1
SP1
ZBTB
7A
BCLA
F1
MAFK
GABPA
USF1
THAP1
CEBPB
GAT
A2FO
S
ATF3
BCL3
FOSL1
SRF
USF2
SPI1
ZBTB
33
ZNF27
4
GAT
A1
ZNF26
3SP2
NFYA
SIX
5
NRF1
NR2C
2
NFY
B
JUND
NFE
2
Re
gre
ssio
n
01
00
02
50
0YY1
E2F
4
ETS
1
MYC
ELF
1
RESTJU
N
EGR1M
AXFO
S
ZNF27
4
ZBTB
7A
NFYA
TAL1
GABPA
MXI1SIX
5
THAP1
ZNF26
3
NFY
B
NR2C
2
GAT
A1
NRF1
SP2
E2F
6
BCLA
F1
GAT
A2SP1
BCL3
SPI1
USF2
CEBPB
USF1
ATF3
FOSL1
MAFK
ZBTB
33SRF
JUND
NFE
2
Tilgner et al., Splicing occurs predominantly during transcrip)on Genome Research, 2012 23/07/13 36
RNA processing
July 23, 2013 37
23/07/13 38
Evidence for co-‐transrip)onal splicing
23/07/13 39
Khodor, Y.L. et al. Nascent-‐seq indicates widespread cotranscriptional pre-‐mRNA splicing in Drosophila. Genes Dev 25, 2502-‐12 (2011). Ameur, A. et al. Total RNA sequencing reveals nascent transcription and widespread co-‐transcriptional splicing in the human brain. Nat Struct Mol Biol 18, 1435-‐40 (2011).
complete Splicing Index (coSI)
40
a b
c
d e
€
COSI =a + b + c
a + b + c + d + e
The CoSI, Complete Splicing Index, measures the degree of comple)on of splicing of a given exon based on RNASeq reads. CoSI=1, means that all RNASeq reads mapping to the exon support the splicing of the exon. CoSI =0 means all reads support the exon not being spliced
coSI in the polyA+ cytosolic RNA
41
coSI in the chroma)n associated RNA
42
43
coSI in the polyA+ cytoslic RNA
44
coSI in the chroma)n associated RNA
45
coSI in polyA-‐ nuclear RNA
46
coSI in polyA+ nuclear RNA
snRNAs involved in splicing enriched in the chroma)n frac)on
47
Processing of RNA through cell compartments
48
CoSI
lncRNAs are spliced less efficiently than protein coding genes
23/07/13 49
Summary
• The ENCODE project is producing a very rich set of RNASeq assays across mul)ple cell lines, cell compartments, and RNA classes.
• Interroga)on across cellular and subcellular compartments provides useful informa)on on the dynamics of RNA processing within the cell.
• RNASeq allows measuring of individual isoforms. – Many new ques)ons can be stated
23/07/13 50
23/07/13 51
acknowledgements
23/07/13 52
Current Group