41
© 2012 Illumina, Inc. All rights reserved. Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners. シーケンスのための Design Studioでのトラブルシュート -TSCAについて シニアテクニカルアプリケーションサイエンティスト 酒井名朋子

-TSCAについて - イルミナ株式会社 | 遺伝研究をサ … bindingとは: Oligo pool中で2つ以上のProbeがお互いにアニールしてしま う – Probe-Probeが相互にハイブリ

  • Upload
    ngominh

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

© 2012 Illumina, Inc. All rights reserved.Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.

シーケンスのためのDesign Studioでのトラブルシュート-TSCAについて

シニアテクニカルアプリケーションサイエンティスト酒井名朋子

2

本日のOutline

Design の過程

Design Studioでの言葉の定義

• Score• Coverage

Coverageを改善する

• SNPs• Specificity• GC content/ homopolymers• Cross binding

3

本日のOutline

Design の過程

Design Studioでの言葉の定義

• Score• Coverage

Coverageを改善する

• SNPs• Specificity• GC content/ homopolymers• Cross binding

4

アンプリコンのサイズを選択する(150, 175, 250, 425bp)– ターゲット領域におけるProbeの間隔を決定するパラメターとなります

ターゲット領域を入力する

– 位置情報(Coordinate)や遺伝子名を入力

– それぞれのターゲットサイズ: 1bp- 24kb– 各ターゲットの累積最大値: 650kb

隣り合うターゲット

– 近すぎるターゲットに対するWarining: 2つのターゲット領域が指定したアンプリコンサイズより小さい場合にはMergeされる

– Probeの設計領域 : coordinates +1アンプリコン 分の長さまで設計領域と定義

– ターゲット領域をMergeすることでプローブ数を抑え、Designを改善させる

ProjectがDSにSubmitされると・・

– ターゲット領域において既知の変異やGC含量、リピート配列等がチェックされ

– ターゲット領域にProbeを充てる

cross binding、 overlap 、特異性についてProbe QCを行う

– DesignStudio はGapを埋めるために数度再設計を行う

– 最終Probeセットが計算され、結果として表示される

ターゲット配列

TSCA Design の過程について

250bp 250bp

Probe design される領域

ex: アンプリコン250bpの場合

5

Design Studioでの言葉の定義

ターゲット名ターゲット位置情報(Coordinate)

ターゲットをカバーするために必要なア

ンプリコン数

SNPs を避けるかどうかのOption

ProbeによりカバーされるSNPs

アンプリコンによりカバーされる領域の割合%

Design 結果のスコア

6

Scoreとは

– Design Score: AmpliconがWorkするかどうかを示すin silicoでの成功率

Probeと領域に存在するSNP、 GC 含量、 特異性を元に算出

DesignStudio からはDesign StudioのProbe QCを通ったプローブのみを結果として表示

設計が難しい領域はScoreが下がる

Coverage とは

– ターゲット領域がアンプリコンによりカバーされる割合

– Probeが設計できないとCoverageが低くなる

SNPs 特異性

GC 含量/ホモポリマー

ProbeのCross binding

Design Studioでの言葉の定義

7

本日のOutline

Design の過程

Design Studioでの言葉の定義

• Score• Coverage

Coverageを改善する

• SNPs• Specificity• GC content/ homopolymers• Cross binding

8

SNPが存在するとアルゴリズムがProbeをデザインしづらくなる

– 特にAvoid SNPのOptinをONにした場合

SNPsが原因でCoverageが低くなる

* * * * * *** * *SNPの位置はdbSNP131 で定義されたもの

9

SNPが存在するとアルゴリズムがProbeをデザインしづらくなる

– 特にAvoid SNPのOptinをONにした場合

SNPsが原因でCoverageが低くなる

Avoid SNPs を“Yes”にすると: ターゲット領域の一部のみしかカバーされないことがある

X X X X X X X X

10

SNPが存在するとアルゴリズムがProbeをデザインしづらくなる

– 特にAvoid SNPのOptinをONにした場合

SNPsが原因でCoverageが低くなる

Avoid SNPs を“OFF”にすると: SNP にかかわらずProbeが設計されるのでカバーされる領域が増える

11

SNPsが原因でCoverageが低くなる

12

SNPsが原因でCoverageが低くなる

13

SNPsが原因でCoverageが低くなる

14

SNPsが原因でCoverageが低くなる

“Avoid SNP” を “No”にすると:• Gapが減る• カバーされる領域が増える• カバーされるターゲット数が増える

15

Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない

SNPがProbeの設計に及ぼす影響

16

Mean Coverageの0.2x以上でカバーされている領域

Mean Coverageの0.2x以下でカバーされている領域

Coverage

アンプリコン

でカバーされている

ターゲット領域の割合

MeanCoverageの0.2x

SNPがProbeの設計に及ぼす影響

Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない

– Coverage Uniformityに関するスペック: 80% 以上のターゲット領域がMean Coverageのx0.2以上でカバーされる必要がある

MeanCoverage

17

Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない

– Coverage Uniformityに関するスペック: 80% 以上のターゲット領域がMean Coverageのx0.2以上でカバーされる必要がある

“Avoid SNPS”をNoにすることでProbe設計の自由度が増す

– しかしProbes はDesign Studioで持っている QCをパスする必要がある

SNPはProbeのハイブリ効率に影響がない場合もある

– 参照元のdbSNP 131が正しくAnnotateしていない、出現頻度が低いSNPまで登録されている

– プローブ長は22-30ntと比較的短い

SNPに影響されるターゲットはシーケンス深度(Depth)を増やして読むことが望ましい

SNPがProbeの設計に及ぼす影響

18

特異性が低い: ターゲット外の配列をたくさん含んでいる

– 最終的にターゲットサイトから外れます

ターゲット領域を移動、拡張する

– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある

特異性が低くCoverage が上がらない場合

19

特異性が低い: ターゲット外の配列をたくさん含んでいる

– 最終的にターゲットサイトからは外れる

ターゲット領域を移動、拡張する

– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある

特異性が低くCoverage が上がらない場合

20

特異性が低い: ターゲット外の配列をたくさん含んでいる

– 最終的にターゲットサイトから外れる

ターゲット領域を移動、拡張する

– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある

特異性が低くCoverage が上がらない場合

21

特異性が低い: ターゲット外の配列をたくさん含んでいる

– 最終的にターゲットサイトから外れる

ターゲット領域を移動、拡張する

– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある

特異性が低くCoverage が上がらない場合

22

特異性が低くCoverage が上がらない場合

23

特異性が低くCoverage が上がらない場合

領域を拡張してみる

24

特異性が低くCoverage が上がらない場合

領域を拡張することでDesign Studioが特異性の高いProbeをデザインでき、ターゲット領域の

Coverageをあげることができる

25

GC含量が高い場合、もしくはホモポリマー(特定塩基の繰り返し)が存在する場合はProbeが設計できない

特異性を上げるための改善と同様、ターゲット領域の拡張、移動、領域を分割して再入力

GC 含量、ホモポリマーが原因でCoverageが低い場合

…GGCCCGCCCGG AAAAAAAAAAAAA

26

GC含量が高い場合、もしくはホモポリマー(特定塩基の繰り返し)が存在する場合はProbeが設計できない

特異性を上げるための改善と同様、ターゲット領域の拡張、移動、領域を分割して再入力

どのようにGC含量ホモポリマーが問題と特定するか?

DesignStudioからUCSC Genome Browserにジャンプ

GC 含量、ホモポリマーが原因でCoverageが低い場合

…GGCCCGCCCGG AAAAAAAAAAAAA

27

GC 含量、ホモポリマーが原因でCoverageが低い場合

28

GC 含量、ホモポリマーが原因でCoverageが低い場合

29

Cross bindingとは: Oligo pool中で2つ以上のProbeがお互いにアニールしてしまう

– Probe-Probeが相互にハイブリ

Cross Bindingを起こしているProbeの一つがDesign中に削除される

ターゲット領域をカバーするためのProbeの数が減る

Probe のCross Bindingが原因でCoverage が低い場合

30

Coverageが低い原因はProbe

か?ターゲット領域か?

Isolate the target of interest into its own project

Still low coverage?

Difficulty due to target itself

Improved coverage?

Try expanding region

coordinatesTry targeting in a separate project

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

*By removing other probes, we can narrow in on the cause of low coverage

31

Coverageが低い原因はProbeか?ターゲット

領域か?

Projectを当該ターゲット領域だけにしてみる

Still low coverage?

Difficulty due to target itself

Improved coverage?

Try expanding region

coordinates

Try targeting in a separate

project

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

*ほかのターゲット領域を除く

32

Coverageが低い原因はProbeか?ターゲット

領域か?

Projectを当該ターゲット領域だけにしてみる

まだCoverageが低い場合

ターゲット領域の問題

Improved coverage?

Try expanding region

coordinates

Try targeting in a separate

project

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

*ほかのターゲット領域を除く

33

Coverageが低い原因はProbeか?ターゲット

領域か?

Projectを当該ターゲット領域だけにしてみる

まだCoverageが低い場合

ターゲット領域の問題

Coverageが改善した場合

ターゲット領域を拡大する

ターゲットを別Projectで入力

してみる

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

*ほかのターゲット領域を除く

34

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

35

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

36

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

37

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

38

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

DesignStudio にてDesignを始めるためには最小16アンプリコン必要Projectサイズが小さい方が結果が早く帰って来る

39

Probe のCross Bindingが原因でCoverage が低い場合どのようにCross Bindingが問題と特定するか

例で使用したターゲットでは54% から 73%に改善Probeが少ない方が当該ターゲットはCoverageが良い

Original Projectでターゲット領域を拡張してみる

40

まとめ

Design の過程

• amplicon sizeを選択する

• 領域をに入力する

• DS でプローブを作りデザインプールを結果として返す

Design Studioでの言葉の定義

• Score: design score, AmpliconがWorkするかどうかのin silicoでの評価

• Coverage: アンプリコンがカバーするターゲット領域の割合

Coverageを改善する

• SNPs: “avoid SNPs” を “no”にする

• Specificity: ターゲット領域を拡張、移動する

• GC 含量/ ホモポリマー: ターゲット領域を拡張、移動、分割する

• Cross binding: 1ターゲットのみを取り出しProbeとターゲットの原因を切り分ける

41

Technical Bulletin: How DesignStudio works for TSCA– https://icom.illumina.com/MyIllumina/Bulletin/rEc70eUsskSDF31s-qdCQQ/how-

design-studio-works-for-tsca

FAQ and troubleshooting tech note– http://www.illumina.com/documents/products/other/faq_tsca_designstudio.pdf

TSCA support page– http://support.illumina.com/sequencing/sequencing_kits/truseq_custom_amplicon.ilm

n

TSCA data sheet– http://www.illumina.com/documents/products/datasheets/datasheet_truseq_custom_a

mplicon.pdf

Technical Support Webinars– http://support.illumina.com/training/sequencing.ilmn

参考資料