Upload
ngominh
View
214
Download
0
Embed Size (px)
Citation preview
© 2012 Illumina, Inc. All rights reserved.Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
シーケンスのためのDesign Studioでのトラブルシュート-TSCAについて
シニアテクニカルアプリケーションサイエンティスト酒井名朋子
2
本日のOutline
Design の過程
Design Studioでの言葉の定義
• Score• Coverage
Coverageを改善する
• SNPs• Specificity• GC content/ homopolymers• Cross binding
3
本日のOutline
Design の過程
Design Studioでの言葉の定義
• Score• Coverage
Coverageを改善する
• SNPs• Specificity• GC content/ homopolymers• Cross binding
4
アンプリコンのサイズを選択する(150, 175, 250, 425bp)– ターゲット領域におけるProbeの間隔を決定するパラメターとなります
ターゲット領域を入力する
– 位置情報(Coordinate)や遺伝子名を入力
– それぞれのターゲットサイズ: 1bp- 24kb– 各ターゲットの累積最大値: 650kb
隣り合うターゲット
– 近すぎるターゲットに対するWarining: 2つのターゲット領域が指定したアンプリコンサイズより小さい場合にはMergeされる
– Probeの設計領域 : coordinates +1アンプリコン 分の長さまで設計領域と定義
– ターゲット領域をMergeすることでプローブ数を抑え、Designを改善させる
ProjectがDSにSubmitされると・・
– ターゲット領域において既知の変異やGC含量、リピート配列等がチェックされ
– ターゲット領域にProbeを充てる
cross binding、 overlap 、特異性についてProbe QCを行う
– DesignStudio はGapを埋めるために数度再設計を行う
– 最終Probeセットが計算され、結果として表示される
ターゲット配列
TSCA Design の過程について
250bp 250bp
Probe design される領域
ex: アンプリコン250bpの場合
5
Design Studioでの言葉の定義
ターゲット名ターゲット位置情報(Coordinate)
ターゲットをカバーするために必要なア
ンプリコン数
SNPs を避けるかどうかのOption
ProbeによりカバーされるSNPs
アンプリコンによりカバーされる領域の割合%
Design 結果のスコア
6
Scoreとは
– Design Score: AmpliconがWorkするかどうかを示すin silicoでの成功率
Probeと領域に存在するSNP、 GC 含量、 特異性を元に算出
DesignStudio からはDesign StudioのProbe QCを通ったプローブのみを結果として表示
設計が難しい領域はScoreが下がる
Coverage とは
– ターゲット領域がアンプリコンによりカバーされる割合
– Probeが設計できないとCoverageが低くなる
SNPs 特異性
GC 含量/ホモポリマー
ProbeのCross binding
Design Studioでの言葉の定義
7
本日のOutline
Design の過程
Design Studioでの言葉の定義
• Score• Coverage
Coverageを改善する
• SNPs• Specificity• GC content/ homopolymers• Cross binding
8
SNPが存在するとアルゴリズムがProbeをデザインしづらくなる
– 特にAvoid SNPのOptinをONにした場合
SNPsが原因でCoverageが低くなる
* * * * * *** * *SNPの位置はdbSNP131 で定義されたもの
9
SNPが存在するとアルゴリズムがProbeをデザインしづらくなる
– 特にAvoid SNPのOptinをONにした場合
SNPsが原因でCoverageが低くなる
Avoid SNPs を“Yes”にすると: ターゲット領域の一部のみしかカバーされないことがある
X X X X X X X X
10
SNPが存在するとアルゴリズムがProbeをデザインしづらくなる
– 特にAvoid SNPのOptinをONにした場合
SNPsが原因でCoverageが低くなる
Avoid SNPs を“OFF”にすると: SNP にかかわらずProbeが設計されるのでカバーされる領域が増える
16
Mean Coverageの0.2x以上でカバーされている領域
Mean Coverageの0.2x以下でカバーされている領域
Coverage
アンプリコン
でカバーされている
ターゲット領域の割合
MeanCoverageの0.2x
SNPがProbeの設計に及ぼす影響
Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない
– Coverage Uniformityに関するスペック: 80% 以上のターゲット領域がMean Coverageのx0.2以上でカバーされる必要がある
MeanCoverage
17
Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない
– Coverage Uniformityに関するスペック: 80% 以上のターゲット領域がMean Coverageのx0.2以上でカバーされる必要がある
“Avoid SNPS”をNoにすることでProbe設計の自由度が増す
– しかしProbes はDesign Studioで持っている QCをパスする必要がある
SNPはProbeのハイブリ効率に影響がない場合もある
– 参照元のdbSNP 131が正しくAnnotateしていない、出現頻度が低いSNPまで登録されている
– プローブ長は22-30ntと比較的短い
SNPに影響されるターゲットはシーケンス深度(Depth)を増やして読むことが望ましい
SNPがProbeの設計に及ぼす影響
18
特異性が低い: ターゲット外の配列をたくさん含んでいる
– 最終的にターゲットサイトから外れます
ターゲット領域を移動、拡張する
– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある
特異性が低くCoverage が上がらない場合
19
特異性が低い: ターゲット外の配列をたくさん含んでいる
– 最終的にターゲットサイトからは外れる
ターゲット領域を移動、拡張する
– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある
特異性が低くCoverage が上がらない場合
20
特異性が低い: ターゲット外の配列をたくさん含んでいる
– 最終的にターゲットサイトから外れる
ターゲット領域を移動、拡張する
– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある
特異性が低くCoverage が上がらない場合
21
特異性が低い: ターゲット外の配列をたくさん含んでいる
– 最終的にターゲットサイトから外れる
ターゲット領域を移動、拡張する
– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある
特異性が低くCoverage が上がらない場合
✔
25
GC含量が高い場合、もしくはホモポリマー(特定塩基の繰り返し)が存在する場合はProbeが設計できない
特異性を上げるための改善と同様、ターゲット領域の拡張、移動、領域を分割して再入力
GC 含量、ホモポリマーが原因でCoverageが低い場合
…GGCCCGCCCGG AAAAAAAAAAAAA
26
GC含量が高い場合、もしくはホモポリマー(特定塩基の繰り返し)が存在する場合はProbeが設計できない
特異性を上げるための改善と同様、ターゲット領域の拡張、移動、領域を分割して再入力
どのようにGC含量ホモポリマーが問題と特定するか?
DesignStudioからUCSC Genome Browserにジャンプ
GC 含量、ホモポリマーが原因でCoverageが低い場合
…GGCCCGCCCGG AAAAAAAAAAAAA
29
Cross bindingとは: Oligo pool中で2つ以上のProbeがお互いにアニールしてしまう
– Probe-Probeが相互にハイブリ
Cross Bindingを起こしているProbeの一つがDesign中に削除される
ターゲット領域をカバーするためのProbeの数が減る
Probe のCross Bindingが原因でCoverage が低い場合
30
Coverageが低い原因はProbe
か?ターゲット領域か?
Isolate the target of interest into its own project
Still low coverage?
Difficulty due to target itself
Improved coverage?
Try expanding region
coordinatesTry targeting in a separate project
Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか
*By removing other probes, we can narrow in on the cause of low coverage
31
Coverageが低い原因はProbeか?ターゲット
領域か?
Projectを当該ターゲット領域だけにしてみる
Still low coverage?
Difficulty due to target itself
Improved coverage?
Try expanding region
coordinates
Try targeting in a separate
project
Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか
*ほかのターゲット領域を除く
32
Coverageが低い原因はProbeか?ターゲット
領域か?
Projectを当該ターゲット領域だけにしてみる
まだCoverageが低い場合
ターゲット領域の問題
Improved coverage?
Try expanding region
coordinates
Try targeting in a separate
project
Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか
*ほかのターゲット領域を除く
33
Coverageが低い原因はProbeか?ターゲット
領域か?
Projectを当該ターゲット領域だけにしてみる
まだCoverageが低い場合
ターゲット領域の問題
Coverageが改善した場合
ターゲット領域を拡大する
ターゲットを別Projectで入力
してみる
Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか
*ほかのターゲット領域を除く
38
Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか
DesignStudio にてDesignを始めるためには最小16アンプリコン必要Projectサイズが小さい方が結果が早く帰って来る
39
Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか
例で使用したターゲットでは54% から 73%に改善Probeが少ない方が当該ターゲットはCoverageが良い
Original Projectでターゲット領域を拡張してみる
40
まとめ
Design の過程
• amplicon sizeを選択する
• 領域をに入力する
• DS でプローブを作りデザインプールを結果として返す
Design Studioでの言葉の定義
• Score: design score, AmpliconがWorkするかどうかのin silicoでの評価
• Coverage: アンプリコンがカバーするターゲット領域の割合
Coverageを改善する
• SNPs: “avoid SNPs” を “no”にする
• Specificity: ターゲット領域を拡張、移動する
• GC 含量/ ホモポリマー: ターゲット領域を拡張、移動、分割する
• Cross binding: 1ターゲットのみを取り出しProbeとターゲットの原因を切り分ける
41
Technical Bulletin: How DesignStudio works for TSCA– https://icom.illumina.com/MyIllumina/Bulletin/rEc70eUsskSDF31s-qdCQQ/how-
design-studio-works-for-tsca
FAQ and troubleshooting tech note– http://www.illumina.com/documents/products/other/faq_tsca_designstudio.pdf
TSCA support page– http://support.illumina.com/sequencing/sequencing_kits/truseq_custom_amplicon.ilm
n
TSCA data sheet– http://www.illumina.com/documents/products/datasheets/datasheet_truseq_custom_a
mplicon.pdf
Technical Support Webinars– http://support.illumina.com/training/sequencing.ilmn
参考資料