Upload
trandung
View
215
Download
0
Embed Size (px)
Citation preview
実習の手順(161011)
★ 本日の手順の概要
クラスター解析する 階層クラスタリングする ヒートマップを作成する
★ クラスター解析する
注目遺伝子の行番号を調べる 遺伝子発現データセットをエクセルで開く。 データセットのシート上で、Ctrl+Fを押す。 注目した遺伝子の IDを入力して検索し、何番目のデータか覚える。
例えば「AT1G56650」は 3957行目なので、データの順番では 3956番目(1行目は列ラベル:実験 ID)。
遺伝子発現データのテキストファイルをデスクトップに置く。 拡張子が「.txt」のファイルを置く。
注意:解凍した場合、フォルダの中にテキストファイルができている場合がある。
階層クラスタリングする Rを起動する。 データセットをRに入力する。
「atgenx <- read.table (file="C:/Users/tyo23047/Desktop/atgenx4biostat16.txt",header=TRUE,row.names=1,sep="\t")」 「tyo23047」の部分は自分のアカウント番号に変える。 「\t」の部分はR上では「\(バックスラッシュ)t」となる。
データが無事に入力されたことを確認する。 「atgenx[1:10,1:6]」
上から 10遺伝子、左から 6実験分を表示する。 データの一部を取り出して変数(電卓のメモリ機能)に入力する
「x <- atgenx[3946:3966,1:237]」 注目遺伝子の±10遺伝子の範囲を選ぶ。 注目遺伝子のデータの順番が 3956番目の場合、3946~
3966。 階層クラスタリングのために遺伝子間の距離を計算する。
「d <- dist(x)」
この値が小さいほど遺伝子間は似ていることになる(距離が近い)。
「dist」は distanceの略。 階層クラスタリングを実行する。
「h <- hclust(d)」 このコマンドでは実行しただけでグラフ化まではしない。 「hierarchical clustering」の略。
階層クラスタリングの結果をグラフ化する。 「plot(h,hang=-1)」
括弧中の一つ目はクラスタリングの結果の変数。 括弧中の二つ目は階層クラスターの形。
ヒートマップを作成する 「y <- t(x)」
縦横を逆にする(これをしないとヒートマップが書けない、原因不明)。
「hm <- heatmap(y,col=rev(heat.colors(256)))」 括弧の中身
一つ目:取り出したデータ 二つ目:色の設定(省略可) 発現量が大きくなるにつれ、黄色から赤に変わる。
グラフのウインドウの「ファイル」→「別名で保存」→Pngと進み、PNG画像をデスクトップに保存する。
階層クラスタリングとヒートマップの結果から、今回選んだ実験条件について、注目遺伝子と発現傾向が似ている遺伝子を調べる。
★ Rの操作上の注意事項 「>」の表示に戻れないとき
「ESC」キーを押すと戻れる。 「+」が表示されるとき
「)」(丸括弧閉じる)を入力すると、「>」に戻れる。 場合によっては何回か入力する必要がある。