89
1 生生生生 生生生生生生 生生生 生生 生生生生生生生生 生生生生生 [email protected]

生物資訊 介紹及其應用

  • Upload
    tiana

  • View
    92

  • Download
    0

Embed Size (px)

DESCRIPTION

生物資訊 介紹及其應用. 王憶卿 老師 國立臺灣師範大學 生命科學系 [email protected]. 基因是什麼?. http://bioinfo.life.nthu.edu.tw/bioinfo.htm. 基因是什麼?. 1 、基因為生物體的遺傳資訊,它通常存在於生物體的 DNA 或 RNA 中。 2 、 DNA 它有四個不同的次單元我們稱這些次單元為鹼基 (bases) ,它們分別是 A 、 T 、 C 、和 G 。. http://mod.life.nthu.edu.tw/bioinfo/hgp/. 基因是什麼?. - PowerPoint PPT Presentation

Citation preview

Page 1: 生物資訊 介紹及其應用

1

生物資訊介紹及其應用

王憶卿 老師國立臺灣師範大學 生命科學系

[email protected]

Page 2: 生物資訊 介紹及其應用

2

基因是什麼?

http://bioinfo.life.nthu.edu.tw/bioinfo.htm

Page 3: 生物資訊 介紹及其應用

3

基因是什麼?1 、基因為生物體的遺傳資訊,它通常存在於生物體的 DNA 或 RNA 中。2 、 DNA 它有四個不同的次單元我們稱這些次單元為鹼基 (bases) ,它們分別是 A 、 T 、 C 、和 G 。

http://mod.life.nthu.edu.tw/bioinfo/hgp/

Page 4: 生物資訊 介紹及其應用

4http://mod.life.nthu.edu.tw/bioinfo/hgp/

3 、對於所有細胞而言,鹼基的順序提供了生命的密碼。 4 、 DNA 透過轉錄、轉譯…等作用,產生各種蛋白質以進 行各項生理反應。

5 、在單一條 DNA 中,決定鹼基的 排列順序的方法我們 稱之為定序 (sequencing) 。

基因是什麼?

Page 5: 生物資訊 介紹及其應用

5

核酸序列 (DNA sequence)

……..ATCGGTGCGTGCATGCAGTGCAGTGCATGCAACCGTATATTAATCCCACTGTTTAAAACTGGTTCATCAGAATTTATATTTTTTTCTTTCCTCCCTTTTGAATTTTACTTATGACAGAGGAAGTATTGACCCATGACTTTTTAAACATAATTTATATTTATACTGGTCAATAATGAAGGTTTTTTTTTATTATTAAA GAACTTGATTTTATAATTCT……...

攜帶遺傳訊息之生命之書

Adenine ( 腺嘌呤 )

Guanine ( 鳥糞嘌呤 )

Cytosine ( 胞嘧啶 )

Thymine ( 胸腺嘧啶)

Page 6: 生物資訊 介紹及其應用

6

Sequenced Genomes by time

First viral genome (Sanger et al., 1977):Фx174 5386 bases, 11 genes

First Eukaryotic Chromosome (Oliver et al., 1992): chromosome3 of budding yeast

315 kb, 182 predicted ORF

Human genome project (HMG) 開始 1994

First complete genome of free-living organism (Fleischmann et al., 1995): Haemophilus influenzae Rd

1.8 Mb

First eukaryotic genome (Goffeau1 et al., 1996): budding yeast

Page 7: 生物資訊 介紹及其應用

7

人類基因體計畫2001 年 2 月人類基因體草圖公布

Page 8: 生物資訊 介紹及其應用

8

Page 9: 生物資訊 介紹及其應用

9

基因序列的數量- 根據美國國家生物技術資訊中心( NCBI )於 2003 年 8 月 的統計,目前共有 140,000 種生物的基因序列於基因 資料庫中,而且並以每個月 1700 種物種的速度增加中。

-NCBI 於 2003 年 8 月的統計, Genbank 資料庫中有超過 33.9 billion nucleotide bases 從 27.2 million individual sequences. 並以每 15 個月成長一倍的速度增加中。

Page 10: 生物資訊 介紹及其應用

10

後基因體世代 定序之成本不斷降低

USD$1/base…. USD$0.5/base ….USD$0.1 /base 1990……………1997………………2002………..

研究重心轉向宏觀的資訊理解與解讀 功能性基因體學 (Functional Genomics) 結構基因體學 (Structural Genomics) 蛋白質體學 (Proteomics) 生物資訊 (Bioinformatics) 代謝體學 (Metabolomics) 細胞體學 (Cellomics)

Page 11: 生物資訊 介紹及其應用

11

生物資訊淘金熱--- 在人類基因組中尋寶

- 隨著 Human Genome Project 而來的大量資訊堆積如山,如果這是一個寶山,那麼如何從這個寶山中挖出金礦,就全憑誰擁有最先進的挖礦工具。在這個媲美人類登陸月球的大計 畫中,生物資訊學( bioinformatics )絕對占有重要的一席。生物資訊學包含這些挖礦工具的設計與整合。少了它,這個寶山只是一堆石礫與沙土而 已。

( 轉自 Sciscape 網站 )

Page 12: 生物資訊 介紹及其應用

12

為什麼用生物資訊 [Why?]

-- 將計算機研究方法應用在生物學上的問題,原因包括:

1. 生物方面的資訊量有爆炸性的成長,迫切需要運用電腦來從事資訊的分類與取得。

2. 資料開採 (data mining)─藉由已知生物間基因或蛋白序列資料異同的比較,可演繹序列彼此功能與功能之間的關係,依循這個理論而衍生出的歷程,稱之為 data mining 。

Page 13: 生物資訊 介紹及其應用

13

什麼是生物資訊學 [What?]

定義 從資訊的角度來理解生物 ( 生命 ) 用資訊的技術來分析生物 ( 生命 )

用資訊理論與技術來儲存 , 整理 , 分析 , 整合生命科學資料的學問 跨領域 : 統計 , 數學 , 物理學 , 資訊科學 ,….. 應用性 預測性 巨觀

Page 14: 生物資訊 介紹及其應用

14

生物資訊跨領域研究生命科學與醫學

Life SciencesMedicine

生物資訊

Bioinformatics數理理論 Mathematics,Statistics

資訊科學InformationScience andTechnology

在領域的匯集處,充滿著機會

Page 15: 生物資訊 介紹及其應用

15

生物資訊學之內涵 Database Software Algorithm User interface Result Display Data retrieval Data comparison

Biological Questions Sequence analyses Structure simulation Gene prediction

Page 16: 生物資訊 介紹及其應用

16

Database-- 基因的寶庫

Page 17: 生物資訊 介紹及其應用

17http://bioinfo.life.nthu.edu.tw/bioinfo.htm

基因資料庫的重要性

Page 18: 生物資訊 介紹及其應用

18

基因資料庫的重要性生物資料庫就是存放大量生物分子序列與資訊的資料庫

http://bioinfo.life.nthu.edu.tw/bioinfo.htm

Page 19: 生物資訊 介紹及其應用

19

基因資料庫的重要性1 、利用定序結果對基因資料庫進行搜尋,比對出可能的生 物或基因。2 、可利用基因庫中各式生物的基因序列,找出演化的證據 或同源性關係,找出分類的依據。3 、利用生物資訊工具,可幫助科學家找出基因庫中可能的 基因所在位置。

4 、可以瞭解各式生物基因表現調節的相關性,進一步調控 基因的表現。

解出各種生物之基因密碼,將會是解開神祕且多樣生命的第一步。

Page 20: 生物資訊 介紹及其應用

20

Web Resource

– 虛擬世界的寶藏

Page 21: 生物資訊 介紹及其應用

21

Major bio-database on the web

Nucleotides GenBank http://www.ncbi.nlm.nih.gov/ EMBL http://www.ebi.ac.uk/embl/ DDBJ http://www.ddbj.nig.ac.jp/

Proteins SwissProt http://tw.expasy.org/sprot/ PIR http://pir.georgetown.edu/ UniProt http://www.expasy.uniprot.org/index.shtml

3D structures– PDB http://www.rcsb.org/pdb/ Other…

Page 22: 生物資訊 介紹及其應用

22

世界三大核酸序列資料庫

NCBI 、 EMBL 、 DDBJ 每天透過網路進行資料交換

Page 23: 生物資訊 介紹及其應用

23

National Center for Biotechnology Information

美國國家生物技術資訊中心( NCBI )所建構的 GenBank 已成為現今世界上最大且蒐羅最完整的生物序列資料庫。

Page 24: 生物資訊 介紹及其應用

24

人類基因的寶庫

Page 25: 生物資訊 介紹及其應用

25

• NCBI 的 GenBank允許研究者將核酸資料上傳,並透過電腦的全自動系統,給予編號及連結,公開給全世界的研究人員免費使用。

• NCBI 不止有 GenBank 這個核酸資料庫 ( 一級資料庫 ) ,還有許多加值資料庫 (二級資料庫 ) 及序列比對系統。

• NCBI 的資料搜尋主要分成兩大系統: Entrez and BLAST ,利用這強力搜尋系統對各資料庫進行搜尋比對。

Page 26: 生物資訊 介紹及其應用

26

NCBI主要分成兩大系統: Entrez and BLAST

http://www.ncbi.nlm.nih.gov/Entrez/index.html

Entrez: 整合型檢索系統

NCBI簡介

Page 27: 生物資訊 介紹及其應用

27

NCBI簡介NCBI主要分成兩大系統: Entrez and BLAST

BLAST: 序列比對系統

http://www.ncbi.nlm.nih.gov/BLAST/

Page 28: 生物資訊 介紹及其應用

28

• 自從 2003/4/12 加拿大 British Columbia Genome Centre之科學家首將 SARS RNA病毒的完整基因體序列定序出來之後,科學家有了很好的基礎從事 SARS 研究。

The new england journal of medicine. 348(20), 1948-1951, 2003.

1 、冠狀病毒因在電子顯微鏡

下,其病毒表面有棘狀突

起 (spike glycoprotein) 而得

名。

2 、 SARS Coronavirus 為已知

最大的 RNA病毒,約有接

近三萬個鹼基。Let’s go!

生物資訊如何輔助生物醫學研究:以 SARS 基因體分析為例

Page 29: 生物資訊 介紹及其應用

29

NCBI-Entrez

Page 30: 生物資訊 介紹及其應用

30

NCBI-Entrez

Page 31: 生物資訊 介紹及其應用

31

NCBI-Nucleotide

Page 32: 生物資訊 介紹及其應用

32

NCBI-Nucleotide

Page 33: 生物資訊 介紹及其應用

33

NCBI-Nucleotide

Page 34: 生物資訊 介紹及其應用

34

DNA 序列比對

使用時機:

1 、利用定序 (sequencing) 所得的一段特定 DNA

序列,來尋找可能的生物或基因。

2 、比對不同生物或類似生物之間的同源性

(homology) 關係。

3 、比對序列與序列之間的相似性或相異性。

--BLAST--

Page 35: 生物資訊 介紹及其應用

35

BLAST: 序列比對系統

Page 36: 生物資訊 介紹及其應用

36

blastp compares an amino acid query sequence against a protein sequence database

blastn compares a nucleotide query sequence against a nucleotide sequence database

blastx compares a nucleotide query sequence translated in all reading frames against a protein sequence database

tblastn compares a protein query sequence against a nucleotide sequence database dynamically translated in all reading frames

tblastx compares the six-frame translations of a nucleotide query sequence against the six-frame translations of a nucleotide sequence database. Please note that tblastx program cannot be used with the nr database on the BLAST Webpage.

-- 要利用 BLAST比對序列時,系統可分為” blastn” 、 “ blastp” 、” blastx” 、” tblastn” 及” tblastx” ,使用時機如下:

BLAST: 序列比對系統

Page 37: 生物資訊 介紹及其應用

37

Nudeotide-Nudeotide BLAST (blastn):比對未知序列

http://www.ncbi.nlm.nih.gov/BLAST/

NCBI-BLAST

Page 38: 生物資訊 介紹及其應用

38

NCBI-BLAST(blastn)

Page 39: 生物資訊 介紹及其應用

39

NCBI-BLAST (blastn)Result

Page 40: 生物資訊 介紹及其應用

40

NCBI-BLAST (BLAST 2)

http://www.ncbi.nlm.nih.gov/BLAST/

Align two sequences (bl2seq) :比對二條已知序列相似度

Page 41: 生物資訊 介紹及其應用

41

NCBI-BLAST (BLAST 2)

台灣大學 TW1(AY291451)

港大 HKU-39849(AY278491)

差異?

Page 42: 生物資訊 介紹及其應用

42

NCBI-BLAST (BLAST 2)

Page 43: 生物資訊 介紹及其應用

43

NCBI-BLAST (BLAST 2)

Page 44: 生物資訊 介紹及其應用

44The New England Journal of Medicine, 348:20; 1953-1966, 2003

演化樹分析–多序列比對技術

Page 45: 生物資訊 介紹及其應用

45

基因體註解• SARS 之 RNA genome 定序後,首要之工作即是把序列上之基因位置及功能標示來。這項工作稱為基因體註解 (genome annotation) 。

• 此項基因體註解工作,需仰賴資料庫中其他冠狀病毒之基因功能註解,由序列的相似性及區域來推斷 SARS病毒中重要的結構蛋白 (Structure protein) ,如 spike potein (S) , small membrane protein (E) , membrane protein (M) ,以及聚合脢等非結構蛋白 (NSPs) 之基因位置。

Page 46: 生物資訊 介紹及其應用

46

SARS 基因體註解-UCSC Genome Browser

created by the Genome Bioinformatics Group of UC Santa Cruz

Page 47: 生物資訊 介紹及其應用

47

SARS 基因體註解 -NCBI

Page 48: 生物資訊 介紹及其應用

48

SARS 基因體註解 -CDC

THE LANCET • Published online May 9, 2003

• Predicted polymerase protein (1a and 1b)• spike potein (S)• small membrane protein (E)• Membrane protein (M) • nucleocapsid protein (N)

Page 49: 生物資訊 介紹及其應用

49

Swiss-Prot - 最正確的蛋白質資料庫

Page 50: 生物資訊 介紹及其應用

50

SARS-Spike glycoprotein

Page 51: 生物資訊 介紹及其應用

51

GeneScape: Protein-protein Interactions- glycoprotein

Page 52: 生物資訊 介紹及其應用

52

GeneScape: Protein-protein Interactions- glycoprotein

Page 53: 生物資訊 介紹及其應用

53

PDB-3D structures database

The RCSB PDB is supported by funds from the National Science Foundation (NSF), the National Institute of General Medical Sciences (NIGMS), the Office of Science, Department of Energy (DOE), the

National Library of Medicine (NLM), the National Cancer Institute (NCI), the National Center for Research Resources (NCRR), the

National Institute of Biomedical Imaging and Bioengineering (NIBIB), and the). 

Page 54: 生物資訊 介紹及其應用

54

PDBPost-fusion hairpin conformation of the sars coronavirus

spike glycoprotein

Page 56: 生物資訊 介紹及其應用

56

Alzheimer's disease

Pathway-KEGG

Page 57: 生物資訊 介紹及其應用

57

PubMed-文獻搜尋系統

Page 58: 生物資訊 介紹及其應用

58

Biosinica--生命科學網路資源之集成

http://lsl.sinica.edu.tw/Bioinformatics/Bioinf/index.php

Page 59: 生物資訊 介紹及其應用

59

DNA RNA Protein

replication

transcription translation

RNA

cDNA Microarray

Page 60: 生物資訊 介紹及其應用

60

mRNA Represent Gene Function

When measure the level of a mRNA, we are monitoring the activity of a gene.

Thus, if we can understand all the level of mRNAs, we can study the expression of whole genome.

Microarray takes the advantage of getting over 10000 of blotting data in a single experiment, which makes monitoring the genome activity possible.

Page 61: 生物資訊 介紹及其應用

61

mRNA Represent Gene Function

When measure the level of a mRNA, we are monitoring the activity of a gene.

Thus, if we can understand all the level of mRNAs, we can study the expression of whole genome.

Microarray takes the advantage of getting over 10000 of blotting data in a single experiment, which makes monitoring the genome activity possible.

Page 62: 生物資訊 介紹及其應用

62

mRNA Levels Compared in Many Different Contexts

Different tissues, same organism (brain v. liver)

Same tissue, same organism (tumor v. non-tumor)

Same tissue, different organisms (wild-type v. mutant)

Time course experiments (development) Other special designs (e.g. to detect

spatial patterns).

Page 63: 生物資訊 介紹及其應用

63

Cell A Cell B

Hybridizaton to chip

Labeled cDNA from geneX

Spot of geneX with complementary sequence of colored cDNA

This spot shows red color after scanning.

Idea of Microarray

63

Page 64: 生物資訊 介紹及其應用

64

cDNA Microarray Schema

Nature Genetics supplement 21: 10 (1999)

green red

Page 65: 生物資訊 介紹及其應用

65

Scan

Over 10,000 Hybridization Could Be Down at One Time

Page 66: 生物資訊 介紹及其應用

66

Red: up regulate in test cell Green: down regulateYellow: equal levelBlack: no express gene in both samples

Red: test sampleGreen: control sample

Page 67: 生物資訊 介紹及其應用

67

This machine can make 48 microarrays simultaneously.

67

Array Fabrication Spotting

Page 68: 生物資訊 介紹及其應用

The Workflow of Microarray

Array

Hybridized Array

Hybridization

Scanning

Plate

Array Fabrication

Plate PreparationRNA extraction

Labeled cDNAwith Cy3 and Cy5 dyes

cDNA synthesis and labeled

sample

Data analyses *bioinformatics!!!

Page 69: 生物資訊 介紹及其應用

69

Green intensity

Green background

Green b.g.-corrected

Ctrl Ctrl Ctrl Data Data DataD x A - PSLBkgd sDxA D x A - PSLBkgd sDxA Ratio (sDxA): Data / Ctrl

A_1_1 59358.75 512.92 58845.83 50953.13 1779.913 49173.22 0.835628 YAL003W translation elongation factor eef1betaA_1_2 1209.19 512.92 696.271 2522.345 1779.913 742.4323 1.066298 YAR053W hypothetical proteinA_1_3 1948.2 512.92 1435.28 3100.152 1779.913 1320.239 0.919848 YBL078C essential for autophagyA_1_4 4940.806 512.92 4427.886 6670.604 1779.913 4890.691 1.104521 YAL008W protein of unknown functionA_1_5 1485.59 512.92 972.671 2916.086 1779.913 1136.173 1.168096 YAR062W putative pseudogeneA_1_6 32642.03 512.92 32129.11 42304.13 1779.913 40524.22 1.261293 YBL087C 60s large subunit ribosomal protein l23.eA_1_7 6919.441 512.92 6406.521 8540.246 1779.913 6760.333 1.055227 YAL014CA_1_8 2698.301 512.92 2185.382 4314.47 1779.913 2534.557 1.159778 YAR068W strong similarity to hypothetical protein yhr214w- aA_1_9 7167.958 512.92 6655.038 7379.286 1779.913 5599.373 0.841374 YBL100C questionable orfA_1_10 5470.062 512.92 4957.142 6953.799 1779.913 5173.886 1.043724 YAL025C nuclear viral propagation proteinA_1_11 27879.49 512.92 27366.57 33746.9 1779.913 31966.99 1.168103 YBL002W histone h2b.2A_1_12 2589.613 512.92 2076.693 4385.568 1779.913 2605.655 1.254713 YBL107C hypothetical proteinA_1_13 6196.245 512.92 5683.326 8840.475 1779.913 7060.562 1.242329 YDR044W coproporphyrinogen iii oxidaseA_1_14 34737.1 512.92 34224.18 36129.62 1779.913 34349.7 1.003668 YDR134C strong similarity to flo1p, flo5p, flo9p and ylr110cA_1_15 34035.35 512.92 33522.43 27128.53 1779.913 25348.62 0.756169 YDR233C similarity to hypothetical protein ydl204wA_1_16 1638.381 512.92 1125.461 2988.042 1779.913 1208.129 1.073453 YDR048C questionable orfA_1_17 3873.718 512.92 3360.799 4955.141 1779.913 3175.228 0.944784 YDR139C ubiquitin- like proteinA_1_18 2433.625 512.92 1920.706 3502.406 1779.913 1722.493 0.896802 YDR252W strong similarity to egd1p and to human btf3 proteinA_1_19 1800.736 512.92 1287.816 3011.855 1779.913 1231.942 0.956613 YDR053W questionable orfA_1_20 1296.689 512.92 783.77 2636.549 1779.913 856.6356 1.092968 YDR149C questionable orfA_1_21 3453.24 512.92 2940.32 4968.026 1779.913 3188.113 1.084274 YDR260C hypothetical proteinA_1_22 10731.55 512.92 10218.63 9307.246 1779.913 7527.333 0.736629 YDR056C hypothetical proteinA_1_23 6191.309 512.92 5678.39 8808.398 1779.913 7028.485 1.23776 YDR152W weak similarity to c.elegans hypothetical protein cet26e3A_1_24 3589.998 512.92 3077.078 4420.744 1779.913 2640.831 0.858227 YDR269C questionable orfA_1_25 27568.34 512.92 27055.42 20856.2 1779.913 19076.29 0.705082 YGL189C 40s small subunit ribosomal protein s26e.c7A_1_26 1956.182 512.92 1443.262 3150.716 1779.913 1370.803 0.949795 YGL261C strong similarity to members of the srp1/ tip1 family

Red intensity

Red b.g.

Red b.g.-corrected

(R. b.g.-c)/(G. b.g.-c)

Systematic nameGene function

Convert Feature Into Numeric Value

69

Page 70: 生物資訊 介紹及其應用

70

Microarray Data Classification

Prediction:

Gene ValueD26528_at 193D26561_cds1_at -70D26561_cds2_at 144D26561_cds3_at 33D26579_at 318D26598_at 1764D26599_at 1537D26600_at 1204D28114_at 707

Class Sno D26528 D63874 D63880 …ALL 2 193 4157 556ALL 3 129 11557 476ALL 4 44 12125 498ALL 5 218 8484 1211AML 51 109 3537 131AML 52 106 4578 94AML 53 211 2431 209…

Data Miningand analysis

Newsample

Microarray chips Images scanned by laser

Datasets

Page 71: 生物資訊 介紹及其應用

71

DescriptionGenebankaccession

No.

6 hFold Change

24 hFold Change

48 hFold Change

72 hFold Change

Group 1

caspase 10, apoptosis-related cysteine protease U60519 - - - 0.471

CASP8 and FADD-like apoptosis regulator U97075 - - - 0.355

nucleoside diphosphate kinase type 6 (inhibitorof p53-induced apoptosis-alpha) AF051941 - - - 0.376

Group 2

caspase 3, apoptosis-related cysteine protease U13738 - 2.301 - -

CASP8 and FADD-like apoptosis regulator AF005775 - 2.272 - -

Group 3

caspase 9, apoptosis-related cysteine protease U60521 - - 2.519 -

Group 4

caspase 4, apoptosis-related cysteine protease Z48810 2.615 - 2.796 2.819

Group 5

inhibitor of apoptosis protein AAF19819 - - - 5.249

caspase 7, apoptosis-related cysteine protease U67319 - - - 2.19

caspase 4, apoptosis-related cysteine protease U28976 - - - 2.603

Group 6

CASP8 and FADD-like apoptosis regulator AF015450 - - - 6.912

Fold Changes Table

71

Page 72: 生物資訊 介紹及其應用

72

SOM & K Mean By GeneSpring

Page 73: 生物資訊 介紹及其應用

73

DNA Array Profiling for Lymphoma Classification

Nature 403: 503 (2000)

Page 74: 生物資訊 介紹及其應用

74

Microarray Potential Applications

Biological discovery new and better molecular diagnostics new molecular targets for therapy finding and refining biological pathways Mutation and polymorphism detection

Recent examples molecular diagnosis of leukemia, breast

cancer, ... appropriate treatment for genetic

signature potential new drug targets

Page 75: 生物資訊 介紹及其應用

75

Microarray Limitations Cross-hybridization of sequences with high

identity Chip to chip variation True measure of abundance? Does mRNA levels reflect protein levels?

Generally, do not “prove” new biology - simply suggest genes involved in a process, a hypothesis that will require traditional experimental verification.

What fold change has biological relevance? Need cloned EST or some sequence knowledge

-- rare messages may be undetected Expensive!! Not every lab can afford experiment repeat. The real limitation is Bioinformatics

Page 76: 生物資訊 介紹及其應用

76

Functional genomic Databases-- single nucleotide polymorphism

-- (SNP)

Page 77: 生物資訊 介紹及其應用

77

Consequences of MutationConsequences of MutationGenetic Variability:

adaptation, evolution e.g., SNP

Deleterious mutation:Germ cells -- hereditary diseaseSomatic cells -- malfunctioning of

genes malignancies atherosclerosis,

etc.

Page 78: 生物資訊 介紹及其應用

78

Haplotype diversity across populations

1. Cosmopolitan haplotypes account for 70% of chromosomes.

2. Low haplotype diversity within blocks

3. 90% chromosomes carry one of the 4 or 5 common haplotypes.

Page 79: 生物資訊 介紹及其應用

79

Genotypes vs PhenotypesGenotype Databases Phenotype Databases

Association

linkage(Genome Projects) (Phenome Projects)

79

Page 80: 生物資訊 介紹及其應用

80

HYPOTHESIS: Common Variation / Common Disease

Since common polymorphisms (mostly SNPs) comprise the vast majority of variation among humans, it is very likely that they control the majority of common genetically influenced phenotypic variation (including risk to common disease)

Examples: APOE4 and Alzheimer’s Disease INS-VNTR and IDDM

Page 81: 生物資訊 介紹及其應用

81

SNP and Pharmacogenomics

Nature 405:857 (2000)

Page 82: 生物資訊 介紹及其應用

82

Potential of Pharmacogenomics

ARGHG 2:9 (2001)

Page 83: 生物資訊 介紹及其應用

台灣師大「生物資訊學程」學程時間表學程總計為必修 15 學分、選修專業課程 I 、 II 至少修二科(共 23~ 27 學分)

學期 必修(基礎課程)

第一年上 細胞及分子生物學 (3 學分 )

第一年下 生物資訊學導論( 3 學分)生物資訊應用程式語言 (3 學分 )

暑假 生物資訊學專題研究( 2 學分)第二年上 生物資訊學專題研究(續)生物資訊演算法( 3 學分)

第二年下 生物資訊學專題演講( 1 學分)

選修(專業課程)

生物醫藥科技倫理( 2 學分) 資料庫理論及處理( 2 學分) 計算機概論( 3 學分) 功能基因體學( 2 學分)

功能基因體學之生物實驗( 1 學分) 生物物理( 3 學分) 結構生物學( 2 學分) 影像處理( 3 學分)

分子模擬( 3 學分) 生物資訊統計學( 2 學分) 資料探勘( 3 學分) 圖形識別( 3 學分)

專業課程 I :功能基因體學領域、專業課程 II :資訊學領域 83

Page 84: 生物資訊 介紹及其應用

功能基因體學之生物實驗之開課情形

1. DNA sequencing 3. cDNA microarray2. Genotyping 4. Proteomics analysis

實驗主題:

Sequencer/genotyper cDNA microarray analyzer 2D-gel electrophoresis system

Page 85: 生物資訊 介紹及其應用

85

Page 86: 生物資訊 介紹及其應用

86

Page 87: 生物資訊 介紹及其應用

87

End...

Thanks !

Page 88: 生物資訊 介紹及其應用

88

生物資訊公司 -Celera 公司總部位於美國馬里蘭州 1998 由 Craig Venter 成立,預計用 shut-gun 的方法及高

速的定序儀,在 2001 年完成人類基因圖譜 利基與特色如下

Celera 之定位: High-throughput 及 Bioinformatics 1999 Celera 果蠅染色體基因序列完成 shut-gun 定序 ( 1

20Mbp) 2001/2 HGP and Celera 共同宣布人類基因草圖已解開 2001 年 , Celera 中有 200 個 程式設計師,其中 30 人

(跨領域的成員組合)專門研究核心演算法。 Celera 目前已轉向新藥開發。

Page 89: 生物資訊 介紹及其應用

89

生物資訊公司 -deCode Genetics 公司總部位於雷克亞未克 ,冰島 (Reykjavik, Iceland)

Web :http://www.decodegenetics.com/ 利基與特色如下

冰島 30 萬人口之族群基因 (Icelandic population genetics) 遺傳性疾病在一個同質性高的族群中之分布資料 完整的醫療,病歷資料 (since 1915) 完整族譜資料 (genealogical records, since 1560) 冰島議會通過將以上資料委交 deCode 為該國科學及經濟善加利用。

核心技術 生物資訊,藥物基因體學 (pharmacogenomics) 高速基因型定型設施 (high throughput genotyping facility)