47
© 2013 Illumina, Inc. All rights reserved. Illumina, IlluminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, NuPCR, SeqMonitor, Solexa, TruSeq, TruSight, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners. Sequence Analysis Viewer (SAV) MiSeqRun結果を評価する 小林 孝史 イルミナ株式会社 テクニカルアプリケーション サイエンティスト

Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

© 2013 Illumina, Inc. All rights reserved.Illumina, IlluminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, NuPCR, SeqMonitor, Solexa, TruSeq, TruSight, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.

Sequence Analysis Viewer (SAV)でMiSeqのRun結果を評価する

小林 孝史イルミナ株式会社

テクニカルアプリケーションサイエンティスト

Page 2: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

2

Sequence Analysis Viewer (SAV)とは?イルミナが頒布している「ランの状況をモニターするソフトウェア」です。→個別のクラスター由来の配列を参照できるわけではありません。

Page 3: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

3

Sequence Analysis Viewer (SAV)とは?

SAVをインストールできるPCの条件

WindowsXP/Vista/7が必要。

イルミナ株式会社のホームページからダウンロードが可能です(次ページ以降参照、MyIlluminaのアカウントは必要ではありません)http://support.illumina.com/sequencing/sequencing_software/sequencing_analysis_viewer_sav/downloads.ilmn

MiSeqやHiSeqでは購入時にSAVがインストールされています。

Page 4: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

4

SAVのダウンロード、およびセットアップイルミナのwebsiteに行く (www.illuminakk.co.jp)→サポート、シーケンサー「ソフトウェア」をクリック

Page 5: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

5

SAVのダウンロード、およびセットアップSequencing Analysis Viewerをダブルクリック

Page 6: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

6

SAVのダウンロード、およびセットアップ

Downloadを選択

Page 7: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

7

SAVのダウンロード、およびセットアップ

ユーザーガイド

インストーラー

ZIP形式のインストーラー( 新のもの)をダウンロードください

Page 8: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

8

SAVを使用する目的

A)ランが正常に行われたかを評価したい。

B) fastqファイルなど大きなサイズのファイルを送る前に、ランの状態を共同研究者と情報共有したい。

C) テクニカルサポートにランの診断を依頼したい。

ランのモニターに必要なファイルは下記の3つです。:D:¥Illumina¥MiSeqOutput¥<Run_Folder>(MiSeqの場合)DあるいはE:¥Illumina¥HiSeqTemp¥<Run_Folder>(HiSeqの場合)の中の①InterOp フォルダー (フォルダーごと必要です)②Runparameters.xml③Runinfo.xml

上記のファイルはBaseSpaceでも簡単に共有可能です。

Page 9: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

9

Analysisタブランフォルダーを設定(Full Path)してRefresh

Page 10: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

10

Imagingタブ

Page 11: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

11

Summaryタブ

Page 12: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

12

Quality Scoreの分布

Page 13: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

13

%>=Q30:ラン中全サイクルにおいてQ30以上でベースコールされた塩基の割合まず%>=Q30の割合を見てランの状況を見極める。

Quality Score (Q score)

Page 14: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

14

なぜQ30 で評価するのか?

Q Score = Phredクオリティスコア

ベースコールにおけるエラー率の予測指標

Phredというプログラムで算出

Q30=Quality Score 30

%>=Q30 はラン全体の平均値を示す

– ラン全体の値、リード毎、サイクル毎ではない。

%>= Q30 の値は様々な要因に左右される

– %>=Q30 が良ければRunは成功

PhredScore

% Error Error の確率

Q10 10% 1 in 10

Q20 1% 1 in 100

Q30 0.1% 1 in 1,000

Q40 0.01% 1 in 10,000

Ewing B, Hillier L, Wendl MC, Green P (1998). "Base-calling of automated sequencer traces using phred. I. Accuracy assessment".Genome Res. 8 (3): 175–185.

Page 15: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

15

それぞれの装置における %>=Q30の仕様(PhiXを使用したデータです)

1x35bp 2x50bp 2x100bp 2x150bp 2x250bp 2x300GAIIx ≥90% ≥85% ≥80% N/A N/A N/A

HiSeq High

Output

≥90% ≥85% ≥80% N/A N/A N/A

HiSeq Rapid Run

≥90% ≥85% ≥80% ≥75% N/A N/A

MiSeq(MCS2.3)

≥90% ≥85% ≥80% ≥80% ≥75% ≥70%

一般的にランのサイクル数が長くなるとQ scoreは低下します。

Page 16: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

16

良好なQ Scoreを得るためには

適度なクラスター密度を持つこと→Bulletinを参照ください:– https://my.illumina.com/MyIllumina/Bulletin/DuMEdxXEKUeuxZo

uJdr7TA/cluster-density-specifications-for-illumina-sequen

サンプルの塩基バランスが良いこと(偏りのない配列)

Page 17: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

17

サイクル毎のQ30 の見方サイクル毎のQ30 以上のQ scoreでベースコールされた塩基の割合

Page 18: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

18

サイクルごとの%>=Q30の推移

良好なラン

→Read後半まで高い%>=Q30を維持

Page 19: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

19

Sequence Analysis Viewer: Data By Lane

Page 20: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

20

適正なクラスター密度を狙って実験を行う

適正なクラスター濃度でないと、Q scoreが低くなったり

% Cluster Passing Filter (% Cluster PF)が得られない可能性があります

Software Version

RecommendedCluster Density

(K/mm2)HCS 1.4 (and later) 200-850SCS 2.8 (and later) 100-800MCS 2.0 (and later) 50-960

クラスター密度(Cycle1-4のデータで算出される)

Cluster PFの数値(後で説明)

Page 21: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

21

クラスター密度が高すぎると…

オーバークラスター(クラスターができすぎ)

適正なクラスター密度

隣のクラスターとの距離を保てる隣のクラスターと区別できない(Q score低下)正しいクラスター密度が計算できない

Page 22: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

22

Saturated!→Q scoreが低くなる!

クラスター密度が高すぎると…

Page 23: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

23

Sequence Analysis Viewer: Data By Cycle

Page 24: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

24

V1 reagent (販売終了)HiSeqの波形に似ている

V3 reagentV2 reagent

MiSeqの場合はReagentのバージョンによってIntensityのカーブが異なる→シグナルを取得する時間がそれぞれで異なるため

MiSeqの試薬バージョンにより波形が異なります

Page 25: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

25

試薬の送液不良

品質低下など

短いライブラリー

一時的なフォーカス外し

Readの後半まで

インテンシティーが

なだらかに上昇する

順調なラン

SAVの結果からできるトラブルシュート(MiSeq, V2試薬を使用)

Case2Case1

Page 26: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

26

Intensity取得に不具合があったサイクルの特定

1塩基表示に切り替え(この場合はG)

→当該サイクルのThumbnail imagesを見てみる

Page 27: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

27

流路の不具合の例

Page 28: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

28

FWHM:フォーカスがうまく取れているかの指標

Page 29: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

29

FWHMとは?

FWHM :Full Width Half Max– Intensityが最大値の半分の時のクラスターの幅

数値はライブラリーの長さなどに依存します。

ぼんやりとした大きなクラスター 明るくシャープなクラスター

Page 30: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

30

数値はライブラリーの長さなどに依存します。→急激な数値の変化がある場合は正常にランが行われていない可能性があります。

FWHMとは?

Page 31: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

31

%Base:それぞれのサイクルの塩基のばらつき

Page 32: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

32

偏りのある塩基配列(PCR断片など)塩基のばらつきのよい配列(全ゲノムなど)

塩基のばらつきに注意してクラスター密度を決定する

偏りのある塩基配列の場合は、PhiXを入れたり密度を小さくするなど工夫が必要。

詳しくは…

Page 33: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

33

Sequence Analysis Viewer: Flowcell Chart

Page 34: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

34

Sequence Analysis Viewer: Qscore Heatmap

Page 35: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

35

% Cluster Passing Filter

Page 36: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

36

% Cluster Passing Filter

Pass Filterしたクラスターとは?

– Chastity Filteringをパスしたクラスター、

クラスター上のシグナルの「純度」によりフィルタリング

– PFしないリード:

Chastity<0.6のサイクルが25サイクルまでに2サイクル以上検出

完全に重なったようなクラスタは、このフィルタによるフラグの有無で、選択することができる

クラスター密度(Cycle1-4のデータで算出される)

Cluster PFの数値(Cycle1-25で算出される)

Page 37: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

37

Run の結果を評価するー Phasing/Prephasing

Page 38: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

38

Run の結果を評価するーPhasing/Prephasing

PhasingとPrephasing– 1クラスター中の数分子のサイクルの進みと遅れ (通常~0.2-0.5%)

Page 39: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

39

Phasing と Prephasingについて

一つのクラスターを形成するライブラリー鎖(1000分子ほど)のうち、

低い%(通常~0.2-0.5%)のライブラリーは正しく反応が生じていないものがある。

Phasing Prephasing

AAC C C C C

G

一つのクラスターの中のライブラリー

Page 40: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

40

PhasingとPrephasingの意義

PhasingとPrephasingは酵素反応や試薬Deliveryの失敗を補正する

– 試薬のライン中でのコンタミ(Washが不十分)

– 試薬の品質(使用期限)

– 室内温度

– 装置のFC・Reagent Chiller温度

バランスの悪い塩基配列の場合計算ができない

Page 41: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

41

おまけ)イルミナ・テクニカルサポートにSAVデータの診断を依頼する

1. デスクトップシェア(GoToAssistシステム)を使用して、イルミナから装置にリモート接続させていただき直接データを拝見させていただく。

→MiSeqなどの装置がインターネットに接続されている必要がある。(イルミナのwebsiteなど一般的なwebsiteが閲覧できれば可能です)

2. SAVでランを参照するのに必要なファイルをテクニカルサポートまで送付いただく。

D:¥Illumina¥MiSeqOutput¥<Run_Folder>の中の下記4ファイルを送付ください。InterOpフォルダーRunparameters.xmlRuninfo.xmlSampleSheet.csv

3. BaseSpaceでランをシェアいただく。SAVデータをダウンロードして送付いただく。

Page 42: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

42

BaseSpaceからSAVデータをダウンロードする

Page 43: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

43

BaseSpaceからSAVデータをダウンロードする

Page 44: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

44

BaseSpaceからデータをシェアする

Page 45: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

45

このアドレスをメールに添付して送付いただく

BaseSpaceからデータをシェアする

Page 46: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

© 2013 Illumina, Inc. All rights reserved.Illumina, IlluminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, NuPCR, SeqMonitor, Solexa, TruSeq, TruSight, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.

Thank You!

Page 47: Sequence Analysis Viewer (SAV) - Illumina, Inc....Analysisタブ ランフォルダーを設定(Full Path)してRefresh 10 Imaging タブ 11 Summaryタブ 12 Quality Scoreの分布

47

SAV Support Page:– http://support.illumina.com/sequencing/sequencing_software/sequen

cing_analysis_viewer_sav.ilmn

SAV User Guide:– http://support.illumina.com/documents/documentation/Software_Doc

umentation/SAV/SequencingAnalysisViewer_UserGuide_15020619D.pdf

TechSupport Bulletin Board (on MyIllumina):– https://my.illumina.com/Home/Index

Ewing B, Hillier L, Wendl MC, Green P. (1998): Base-calling of automated sequencer traces using phred. I. Accuracy assessment. Genome Res. 8(3):175-185

Additional Resources