37
情報処理装置「生命」の 設計図を読み解く 大林武 (東北大・情報) [email protected]

第63回情報科学談話会(大林 武 准教授)

Embed Size (px)

Citation preview

Page 1: 第63回情報科学談話会(大林 武 准教授)

情報処理装置「生命」の設計図を読み解く

大林武 (東北大・情報) [email protected]

Page 2: 第63回情報科学談話会(大林 武 准教授)

自己紹介(大林武)

生物学 情報科学

11年 4年 7年東工大・生命

(千葉大・薬)東大・医科研 東北大・情報

バイオ インフォ マティクス

Page 3: 第63回情報科学談話会(大林 武 准教授)

Bioinformatics / Computational Biology

Biology Informatics

Bioinformatics

Computational Biology

Biology Chemistry

Biochemistry

Chemical Biology

Page 4: 第63回情報科学談話会(大林 武 准教授)

もくじ細胞システムの解明へ

遺伝子ネットワーク

情報処理システム

システムの進化

Page 5: 第63回情報科学談話会(大林 武 准教授)

111010001001

000000111101

変換器

利用者のニーズ

情報処理システム

入力

出力

目的

様々な

トランジスタ

NANDゲート, NORゲート

CPU / GPU / FPGA

制御装置 / 演算装置 / レジスタ

半導体

原子

Software

Page 6: 第63回情報科学談話会(大林 武 准教授)

細胞システム

グルコース濃度が上昇

タンブリングの抑制

変換器

子孫繁栄

入力

出力

目的

変動環境での

タンパク質(遺伝子)

Pathway

タンパク質複合体

アミノ酸

タンパク質ドメイン

原子

Genome

Page 7: 第63回情報科学談話会(大林 武 准教授)

遺伝子型と表現型の関係性

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

Page 8: 第63回情報科学談話会(大林 武 准教授)

システムの複製

複合体

機能

Protein Protein Protein Protein

複合体 複合体

Pathway Pathway

捕食者対応力増殖速度表現型

ゲノム配列

複合体

Protein Protein Protein Protein

複合体 複合体

Pathway Pathway

捕食者対応力増殖速度

ゲノム配列遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

ゲノムのコピー

Page 9: 第63回情報科学談話会(大林 武 准教授)

変化するゲノム

複合体

機能

Protein Protein Protein Protein

複合体 複合体

Pathway Pathway

捕食者対応力増殖速度表現型

ゲノム配列

ゲノムの変化

複合体

Protein Protein Protein Protein

複合体 複合体

Pathway Pathway

捕食者対応力増殖速度

ゲノム配列遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

Page 10: 第63回情報科学談話会(大林 武 准教授)

もくじ細胞システムの解明へ

遺伝子ネットワーク

情報処理システム

システムの進化

Page 11: 第63回情報科学談話会(大林 武 准教授)

細胞システムの研究アプローチ

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝学

逆遺伝学

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

Page 12: 第63回情報科学談話会(大林 武 准教授)

要素は決定できる

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

次々と決定されている ゲノム配列からほぼ決定できる

遺伝学

逆遺伝学

Page 13: 第63回情報科学談話会(大林 武 准教授)

ヒトゲノムの一部

CCCTGTGGAGCCACACCCTAGGGTTGGCCAATCTACTCCCAGGAGCAGGGAGGGCAGGAGCCATCTATTGCTTACATTTGCTTCTGACACAACTGTGTTCACTAGCAACTCAAACAGACACCATGGTGCACCTGACACCTGAGGAGAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAACGTGGATGAAGTTGGTGGTGAGGCCCTGGGCAGGTTGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCATGTGGAGACAGAGAAGACTCTTGGGTTTCAGATAGGCACTGACTCTCTCTGCCTATTGGTCTATTTTCCCACCCTTAGGCTGCTGGTGGTCTACCCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCACTCCTGATGCTGTTATGGGCAACCCTAAGGTGAAGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTG

11番染色体: ヘモグロビンβサブユニット

Page 14: 第63回情報科学談話会(大林 武 准教授)

ゲノムプロジェクト

# Gene: Protein-coding genes in Ensembl release 53 Icon: LSDB icon

Yeast1996年

6,698

1998年Nematode

20,176

2000年Fly

2001年Human

21,416

2002年Mouse

23,117

2004年Rat

22,59314,141# Genes

# Genes

20000~30000の遺伝子で生物が作られている

2000年Arabidopsis

30,53527,025

Rice2004年

Popula

45,555

2006年Tomato

2012年

35,00035,434

Grape

2007年 2008年

29,035

Lotus

Page 15: 第63回情報科学談話会(大林 武 准教授)

Vertebrate Genomes in Ensembl DB

2015-11-08

Page 16: 第63回情報科学談話会(大林 武 准教授)

DNA配列解読速度の爆発的上昇

http://www.ncbi.nlm.nih.gov/pubmed/19360079

パソコンの進歩よりも遥かに速い速度で発展している

Page 17: 第63回情報科学談話会(大林 武 准教授)

機能モジュールをどう推定するか?

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

Page 18: 第63回情報科学談話会(大林 武 准教授)

もくじ細胞システムの解明へ

遺伝子ネットワーク

情報処理システム

システムの進化

Page 19: 第63回情報科学談話会(大林 武 准教授)

代謝ネットワーク

H

Hエタノール アセトアルデヒド

ADH

酢酸

ALDH

Page 20: 第63回情報科学談話会(大林 武 准教授)

細胞情報を担う3タイプの分子

出典: Molecular Biology of THE CELL 5th

設計図

伝令

機能の実体

DNA

RNA

タンパク質

Page 21: 第63回情報科学談話会(大林 武 准教授)

アルコール代謝遺伝子の発現パターン

ADH1B

ALDH2

NCBI GEO: GSE2361

肝臓で発現している

Page 22: 第63回情報科学談話会(大林 武 准教授)

活動量データから友人関係を推定できる

http://ics.t.u-tokyo.ac.jp/ja/スマート活動量計データからの人間関係可視化/

東京大学 情報理工学研究科 下坂研究室

Page 23: 第63回情報科学談話会(大林 武 准教授)

一次代謝系,二次代謝系とも共発現する

グルコシノレート

メチオニン

CYP79F1

REF2

SUR1

UGT74B1

SOT17

MAM1

BCAT4PGI

PFK

FBA

TIM

GAPC

PGK

iPGAM

ENO

PK

ピルビン酸

グルコース6P

MR < 30

Page 24: 第63回情報科学談話会(大林 武 准教授)

長い生合成経路

クロロフィル a

グルタミン酸

全般的に共発現しているが 調節の鍵遺伝子がある

CRD1

GUN5

PORC

CHLD

CHLM

CHLI

CHLGPPOX

HEMC

HEMB

LIN2

HEME

HEMA

HEML

Protoporphyrin IX

MR < 50

Page 25: 第63回情報科学談話会(大林 武 准教授)

基質の供給経路が複数ある場合

スクアレン

HDRHDSISPFCDPMEKISPDDXRDXPS1

HMG

MVD

MK

MVA1

ACAT2

SQS1

FPS1

共発現はパスウェイ間の繋がりを表す

メバロン酸経路 非メバロン酸経路

アセチルCoA ピルビン酸

IPPIPP

MR < 100

Page 26: 第63回情報科学談話会(大林 武 准教授)

複数の代謝系の関係性

ADT

MEE17

CM 4CLC4H

PALコリスミ酸TS

IGPS

TRP1

AS

トリプトファン

PSP

PSAT

PGDH

3PG

PAI

EMB1144EPSPSSK

MEE32

DHS

E4P PEP

DQS

クマロイルCoA

MR < 30共通経路はどちらのパスウェイとも共発現している

Page 27: 第63回情報科学談話会(大林 武 准教授)

遺伝子間関係の評価

本当に関係しているのか?

再現性 既知機能と無矛盾

ゲノム配列と無矛盾

比較する共発現の質 システムノイズの問題

生物種特異的 既知機能の限界

ゲノム情報の複雑さ

Page 28: 第63回情報科学談話会(大林 武 准教授)

DHCR7と共発現する遺伝子(ヒト)

Page 29: 第63回情報科学談話会(大林 武 准教授)

共発現が他種でサポートされない例

Page 30: 第63回情報科学談話会(大林 武 准教授)

もくじ細胞システムの解明へ

遺伝子ネットワーク

情報処理システム

システムの進化

Page 31: 第63回情報科学談話会(大林 武 准教授)

システム進化の研究に向けて

システム構造

ゲノム理解

システム動態

ACGTACGATCGTACAGCTAGCTAGCTCAGC

ゲノム配列ACGTACGATCGTACAGCTAGCTAGCTCAGC

ACGTACGATCGTACAGCTAGCTAGCTCAGC

Page 32: 第63回情報科学談話会(大林 武 准教授)

階層構造の推定

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

Okamura et al (PLoS One 2015)

Page 33: 第63回情報科学談話会(大林 武 准教授)

Lineage-Specific Coexpression

Xylan Arabinan

Glucan Cellulose

Monocot DicotOsa-m Zma-m Ath-m Gma-m

Osa-r Zma-r Ath-r Gma-r

Cellulose Synthase 6

Unknown Protein

Glycoside Hydrolase 9

Monocot Dicot1980 3509 201 3208529 14523 7 1179

Monocot Dicot9 16 11407 947615 300 5565 3459

Monocot Dicot5578 4854 9 3061176 1776 107 75

Monocot Dicot16 12 97 305101 42 30 28

Monocot Dicot127 106 3595 395723 69 5487 3049

Coex Platforms

Glycoside Hydrolase 3

Monocot plants Dicot plants

Substrate Substrate

Gene co-expression is evolving to acquire lineage-specific cellular functions.

Aoki et al (PCP 2016)

Page 34: 第63回情報科学談話会(大林 武 准教授)
Page 35: 第63回情報科学談話会(大林 武 准教授)

Gene Coexpression Databases

http://coxpresdb.jp http://atted.jp http://alcodb.jp

Animals PlantsAlgae

Medical EnvironmentalFood Biofuel

Page 36: 第63回情報科学談話会(大林 武 准教授)

Users of ATTED-II, COXPRESdb

Based on Google Analytics

Country Yearly citation

0

25

50

75

100

125

Y2007 Y2014

(Session)

Page 37: 第63回情報科学談話会(大林 武 准教授)

まとめ細胞システムの解明に向けて

遺伝子ネットワーク

情報処理システムとしての生物

システムの進化