Upload
antiplastics
View
1.185
Download
6
Embed Size (px)
Citation preview
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
自己紹介名前: 露崎弘毅 (つゆざき こうき)所属: 東京理科大学大学院 薬学研究科 D2専門: バイオインフォマティクス、システムバイオロジー
緑膿菌バイオフィルム形成
抗生物質
薬物耐性?
BioCHackathon
@antiplastics
@dritoshi @chikudaisei
@chalkless
ItoshiNikaido
RIKEN
GotaMorota
UW-medison
KokiTsuyuzaki
TUS
TakeruNakazato
DBCLS
Bioconductorのパッケージを開発するハッカソン
遺伝子アノテーション
ゲノムワイドな実験(オミックス)
RNA-seqChIP-seq
DNA MicroarraySNP array
CAGESAGE
自分が興味ある遺伝子のリスト
HNRNPRZNF436TFEA3ASAP3E2F2ID3
GALEHMGCLFUCA1CNR2
...
アノテーション = 注釈をつける
こいつらは一体何者?
どんな機能に関わっているか
どこのパスウェイか
どんな転写因子結合サイトを有するか
MeSHMedical Subject Headings
PubMedの注釈情報
MeSHによる遺伝子アノテーション
2344562123521515535153155123135761646667
...
CancerStem CellInternetSoftware
USA...
Gene PubMed MeSH
HNRNPRZNF436TFEA3ASAP3E2F2
...
GeneとMeSHを対応づける
gendoogene2pubmed
LicensedPubMed
これまで開発に携わったパッケージ
MeSH.db: MeSHデータ全般
org.MeSH.XXX.db: 119生物種のGeneID-MeSHIDの対応関係
meshr: MeSHエンリッチメント解析
metaSeq: RNA-seqメタアナリシス
MeSH関連
今後の予定
metaSeqはBioconductor2.13 (2013/10/15)に公開
MeSH関連はBioconductor 2.14 (2014/4/XX) にて公開予定
JSBi2013 (2013/10/29-31)でmetaSeqはポスター発表で、MeSHR関連については、BioHackコンペディションhttps://github.com/dbcls/jsbi2013/wiki/BioHackにて話す予定
RNA-seq (1/2)
© 2011 DBCLS Licensed under CC 表示 2.1 日本
次世代シーケンサー(NGS)
シーケンシング
マッピング
定量化参照ゲノム
e.g., hg19 (UCSC), GRCh37 (Ensembl)
... ATGCATGCTACGAAGCT ...
GCTACGAA
GCTACGAA
Gene XのmRNA
PCR増幅断片化
AAAAAAAAAA
GCTGTACACGTCAAACTC
CAGCTGCAC ACACTGCACCCCACACTTTGCATGCTA
CTCAGAAC
Gene Xには2つのリードがマップされた!
TGCATGCTA
ショートリード
RNA-seq (2/2)
統計解析
DESeqedgeR
cuffdiff ...
© 2011 DBCLS Licensed under CC 表示 2.1 日本
対象群 (無処置) 処置群 (薬物投与)
C_1 C_2 C_3 T_1 T_2 T_3
1/2-BSRNA4 2 1 2 1 3 4
A1BG 0 2 1 0 0 1
A1BG-AS1 23 12 42 1 2 4
ZZZ3 12 12 32 124 104 96
tAKR 21 32 41 10 12 58
p-value
0.67
0.35
0.04
0.02
0.11
q-value
0.53
0.32
0.020
0.012
0.25
FDR制御
BHQ-value
LFDR
e.g., 30000行 (遺伝子数) × 6列 (サンプル数) 発現変動遺伝子 (DEGs)(q < 0.1)
“meta”-analysisとは?meta-analysis = analysis of analysis
どのデータからも検出される再現性が高いDEGsを取得する事ができる
C_1 C_2 C_3 T_1 T_2 T_31/2-
BSRNA42 1 2 1 3 4
A1BG 0 2 1 0 0 1A1BG-AS1 23 12 42 1 2 4
ZZZ3 12 12 32 124 104 96tAKR 21 32 41 10 12 58
C_1 C_2 C_3 T_1 T_2 T_31/2-
BSRNA43 2 1 2 2 4
A1BG 0 5 4 1 1 2A1BG-AS1 19 10 31 3 4 4
ZZZ3 32 21 31 86 35 64tAKR 21 46 24 14 56 21
C_1 C_2 C_3 T_1 T_2 T_31/2-
BSRNA43 4 6 2 5 3
A1BG 4 2 2 3 2 2A1BG-AS1 21 21 36 5 5 4
ZZZ3 21 21 25 152 135 112tAKR 20 30 41 21 21 53
+ +
StudyA StudyB StudyC
DEGs
出所が異なる(e.g., 異なる機関)から出たRNA-seqデータを統合して解析する
p値の統合Fisher’s method
p1p2p3p4
meta-p統合 Χ^2検定
w1 × Z1
Stouffer’s method(重み付け有り)
p値の統合
p1p2p3p4
Z1Z2Z3Z4
w2 × Z2w3 × Z3w4 × Z4
meta-p統合 Z検定
Z
重み付け変換
サンプルサイズによる重み付け
乳癌データにおけるエンリッチメント解析の結果
4つの乳癌研究のメタアナリシス
データによっては有意にならないものもある
統合によりどのデータでも安定して有意にできている
パッケージ化NOISeq
metaSeq
まとめ
メタアナリシスとは複数の研究データの統合解析
metaSeqでRNA-seqのメタアナリシスができる
Bioconductor page : http://www.bioconductor.org/packages/devel/bioc/html/metaSeq.html
GitHup page : https://github.com/kokitsuyuzaki/metaSeq