76
Introdução a bioinformática e a biologia computacional Itamar Leite de Oliveira Universidade Federal de Juiz de Fora Instituto de Ciências Exatas Departamento de Ciência da Computação

Introdução a bioinformática e a biologia computacional

  • Upload
    ojal

  • View
    55

  • Download
    1

Embed Size (px)

DESCRIPTION

Introdução a bioinformática e a biologia computacional. Itamar Leite de Oliveira. Universidade Federal de Juiz de Fora Instituto de Ciências Exatas Departamento de Ciência da Computação. O QUE É BIOINFORMÁTICA?. Bioinformática é uma das áreas de pesquisa que - PowerPoint PPT Presentation

Citation preview

Page 1: Introdução a bioinformática e a biologia computacional

Introdução a bioinformática e a

biologia computacional

Itamar Leite de Oliveira

Universidade Federal de Juiz de ForaInstituto de Ciências ExatasDepartamento de Ciência da Computação

Page 2: Introdução a bioinformática e a biologia computacional

O QUE É BIOINFORMÁTICA?

Bioinformática é uma das áreas de pesquisa quemais cresce em Ciência da Computação.

Ela surgiu a partir de um boom no processo de seqüenciamento de DNA, que gerou um enormevolume de dados que agora precisam ser analisadospara gerar informações úteis.

Page 3: Introdução a bioinformática e a biologia computacional

Características principais da Bioinformática

Interdisciplinaridade - Área associada a: - Biologia - Química - Bio-física - Estatística - Matemática

- Computação

Cooperação - Open source / open code

Page 4: Introdução a bioinformática e a biologia computacional

Áreas da computação em que se pode

atuar na BIOINFORMÁTICA

- - Bancos de DadosBancos de Dados- Data Mining Data Mining - Redes Neurais Redes Neurais - Aprendizagem de MáquinaAprendizagem de Máquina- Processos Estocásticos Processos Estocásticos - - Algoritmos e CombinatóriaAlgoritmos e Combinatória- Visualização / Realidade VirtualVisualização / Realidade Virtual

Page 5: Introdução a bioinformática e a biologia computacional

Estrutura do DNA

G

C

A

T C

GT

A

|||

||| ||

||

DNA

Page 6: Introdução a bioinformática e a biologia computacional

Dógma Central da Biologia Molecular

mRNAGene (DNA) Proteína

Século 21Genoma Transcriptoma Proteoma

Page 7: Introdução a bioinformática e a biologia computacional

Estrutura 3-D do DNA

Page 8: Introdução a bioinformática e a biologia computacional

Tipos RNAs

Page 9: Introdução a bioinformática e a biologia computacional

Transcrição do DNA

• A síntese dos diferentes tipos de RNA, a partir de um molde de DNA, usando as regras da complementaridade, é um processo denominado Transcrição do DNA– A informação genética contida num segmento do DNA, é

reescrita em uma fita simples de RNA – Esta fita apresenta uma seqüência de ribonucleotídios

complementar a uma das fitas da dupla hélice de DNA (fita molde) e idêntica àidêntica à seqüência da outra fita (fita codificadora), com substituição de T por U

Page 10: Introdução a bioinformática e a biologia computacional

A Unidade de Transcrição

Diz-se que as seqüências que antecedem o ponto de início localizam-se à montante (upstream) e as que o sucedem localizam-se à jusante (downstream)A posição das bases é numerada nos dois sentidos, a partir do ponto de início, ao qual se atribui o valor +1. Os valores aumentam (valor positivo) à jusante e diminuem (valor negativo) à montante

Page 11: Introdução a bioinformática e a biologia computacional

Processamento Pós-Transcricional

Page 12: Introdução a bioinformática e a biologia computacional

Sítios de splicing

Splicing

DNA

Transcriçãodoador

mRNAintronexon

receptor

Page 13: Introdução a bioinformática e a biologia computacional

Expressão Gênica – TranscriçãoExpressão Gênica – Transcrição

T G C A G C T C C G G A C T C C A T . . . RNA Polimerase

promotor Transcrição

DNA

mRNA

A

T

Page 14: Introdução a bioinformática e a biologia computacional

Expressão Gênica – TranscriçãoExpressão Gênica – Transcrição

T G C A G C T C C G G A C T C C A T . . . RNA Polimerase

promotor Transcrição

A C G A G G C C U G A G G U A . . .

DNA

mRNA

C G U

Page 15: Introdução a bioinformática e a biologia computacional

Código Genético

• Código Genético mapeamento dos códons nos aminoácidos– 64 códons– 20 aminoácidos

– 3 códons de parada

aminoácidos mapeados por mais de um códon

Degeneração do código genético

Page 16: Introdução a bioinformática e a biologia computacional

Código Genético

T C A GT Phe

PheLeuLeu

SerSerSerSer

TyrTyr

ParadaParada

CysCys

ParadaTrp

TCAG

C LeuLeuLeuLeu

ProProProPro

HisHisGlnGln

ArgArgArgArg

TCAG

A IleIleIle

Met

ThrThrThrThr

AsnAsnLysLys

SerSerArgArg

TCAG

G ValValValVal

AlaAlaAlaAla

AspAspGluGlu

GlyGlyGlyGly

TCAG

1a b

ase

no c

ódon

2a base no códon

3a base no códon

Page 17: Introdução a bioinformática e a biologia computacional

Expressão Gênica – TraduçãoExpressão Gênica – Tradução

T G C A G C T C C G G A C T C C A T . . . RNA Polimerase

promotor Transcrição

A C G U C G A G G C C U G A G G U A . . .

DNA

mRNA

Tradução

His

RibossomoA C

Gcódon

Page 18: Introdução a bioinformática e a biologia computacional

Expressão Gênica – TraduçãoExpressão Gênica – Tradução

T G C A G C T C C G G A C T C C A T . . . RNA Polimerase

promotor Transcrição

A C G U C G A G G C C U G A G G U A . . .

DNA

mRNA

Tradução RibossomoHis

LeuGliSerSer

Cis

Page 19: Introdução a bioinformática e a biologia computacional

Tamanho de Genomas

Organismo Genoma Data Genes Est.

H.influenzae 1.8 Mb 1995 1.740

S.cerevisiae 12.1 Mb 1996 6.034

C.elegans 97 Mb 1998 19.099

A.thaliana 100 Mb 2000 25.000

D.melanogaster 180 Mb 2000 13.061

H.sapiens 3000 Mb 2003 25.000

Page 20: Introdução a bioinformática e a biologia computacional

Transcriptoma• Coleção completa de todos os possíveis

mRNAs de um organismo. • Regiões de um genoma de um organismo

que são transcritas em RNA mensageiro.

GenomaConjunto de genes de um organismo

Page 21: Introdução a bioinformática e a biologia computacional

Proteoma

• A coleção completa de proteínas que podem ser produzidas por um organismo.

• Podem ser estudadas estaticamente (soma de todas as proteínas possíveis) ou dinamicamente (todas proteínas encontradas num determinado momento)

Page 22: Introdução a bioinformática e a biologia computacional

Do DNA ao Genoma

Watson e Crick modelo do DNA

primeira sequencia de

proteína1955

1960

1965

1970

1975

1980

1985

Primeira estrutura de uma proteína

Page 23: Introdução a bioinformática e a biologia computacional

Primeiro rascunho do

genoma humano

Primeiro genoma bacterial

Hemophilus Influenzae

Genoma da levedura

1995

1990

2000

Page 24: Introdução a bioinformática e a biologia computacional

O Projeto Genoma HumanoIniciado em 1986 Terminado em 2003

Objetivos eram: • Identificar todos os genes no DNA humano, • Determinar as 3 bilhões de sequencias de pares

de bases que formam o DNA humano • Melhorar as ferramentas de análise de dados e

desenvolver novas

Page 25: Introdução a bioinformática e a biologia computacional

A eraA era “pós-genômica”“pós-genômica”

Objetivo: compreender as redes funcionais de um célula viva

Anotação GenômicaComparativa

Genômicaestrutural

Genômica funcional

Page 26: Introdução a bioinformática e a biologia computacional

Anotação

Open reading frames

Sítios Funcionais

Estrutura, funções

Page 27: Introdução a bioinformática e a biologia computacional

CCTGACAAATTCGACGTGCGGCATTGCATGCAGACGTGCATGCGTGCAAATAATCAATGTGGACTTTTCTGCGATTATGGAAGAACTTTGTTACGCGTTTTTGTCATGGCTTTGGTCCCGCTTTGTTCAGAATGCTTTTAATAAGCGGGGTTACCGGTTTGGTTAGCGAGAAGAGCCAGTAAAAGACGCAGTGACGGAGATGTCTGATG CAATAT GGA CAA TTG GTT TCT TCT CTG AAT .................... TGAAAAACGTA

Page 28: Introdução a bioinformática e a biologia computacional

CCTGACAAATTCGACGTGCGGCATTGCATGCAGACGTGCATGCGTGCAAATAATCAATGTGGACTTTTCTGCGATTATGGAAGAACTTTGTTACGCGTTTTTGTCATGGCTTTGGTCCCGCTTTGTTCAGAATGCTTTTAATAAGCGGGGTTACCGGTTTGGTTAGCGAGAAGAGCCAGTAAAAGACGCAGTGACGGAGATGTCTGATG CAATAT GGA CAA TTG GTT TCT TCT CTG AAT .................................

.............. TGAAAAACGTA

Sítio de ligação TFpromotor

Ribosome binding SiteORF=Open Reading FrameCDS=Coding Sequence

Tran

script

ion

Star

t Site

Page 29: Introdução a bioinformática e a biologia computacional

GenômicaComparativa

Comparação do genoma inteiro

Conclusões sobre as redesreguladoras

Page 30: Introdução a bioinformática e a biologia computacional

GenômicaFuncional

Perfis, considerando o todo o genoma, dos:• Níveis de mRNA• Níveis de proteínas

Co-expressão de genes e/ou proteínas

Page 31: Introdução a bioinformática e a biologia computacional

Compreensão das funções dos genes e outras partes do genoma

Page 32: Introdução a bioinformática e a biologia computacional

GenômicaFuncional

Identificação de iterações proteína-proteína

Redes de interações

Perfis, considerando o todo o genoma, de:• Níveis de mRNA• Níveis de proteínas

Co-expressão de genes e/ou proteínas

Page 33: Introdução a bioinformática e a biologia computacional

A large network of 8184 interactions among 4140 S. Cerevisiae proteins

Uma rede de iterações pode ser construídapara todas as proteínas num organismo

Page 34: Introdução a bioinformática e a biologia computacional

GenômicaEstrutural

Descobrir a estrutura de todas as proteínas codificadas num genoma

Page 35: Introdução a bioinformática e a biologia computacional

Estrutura de Proteína

Page 36: Introdução a bioinformática e a biologia computacional

Bioinformática no DCC

• Núcleo de Bioinformática (NuBio) – ICE– Helio F. Dos Santos (D. Química)– Carlos Cristiano (DCC)– Itamar L. Oliveira (DCC)– Ilaim C. Jr (DCC)– Kelle Bellozzi (DCC)– Wagner Arbex (EMPRABA GL)– Lobosco (DCC)

FIOCRUZ - BH

• Financiado pela FAPEMIG

Page 37: Introdução a bioinformática e a biologia computacional

Reações BioquímicasReações Bioquímicas

Page 38: Introdução a bioinformática e a biologia computacional

Rede metabólica

Page 39: Introdução a bioinformática e a biologia computacional

Enzimas (proteínas)

Page 40: Introdução a bioinformática e a biologia computacional

Enzimas

Page 41: Introdução a bioinformática e a biologia computacional
Page 42: Introdução a bioinformática e a biologia computacional
Page 43: Introdução a bioinformática e a biologia computacional
Page 44: Introdução a bioinformática e a biologia computacional
Page 45: Introdução a bioinformática e a biologia computacional
Page 46: Introdução a bioinformática e a biologia computacional
Page 47: Introdução a bioinformática e a biologia computacional
Page 48: Introdução a bioinformática e a biologia computacional

Lei de ação de das massas• A velocidade de uma reação química

é proporcional a probabilidade de colisões das moléculas

S1 + S2 2P

A velocidade da reação:dP/dt = v = v+ - v- = k+S1S2 – k-

P2

k+ e k-: constantes da reação (fator de proporcionalidade)

Page 49: Introdução a bioinformática e a biologia computacional

Cinética de Reações Enzimáticas

Page 50: Introdução a bioinformática e a biologia computacional

Cinética de Reações Enzimáticas

Page 51: Introdução a bioinformática e a biologia computacional

Cinética de Reações Enzimáticas

Page 52: Introdução a bioinformática e a biologia computacional

Cinética de Reações Enzimáticas

Page 53: Introdução a bioinformática e a biologia computacional

Cinética de Reações Enzimáticas

Page 54: Introdução a bioinformática e a biologia computacional

Cinética de Reações Enzimáticas

Page 55: Introdução a bioinformática e a biologia computacional

Equação de Michaelis-Menten:

][3 Tmáx EkV

Cinética de Reações Enzimáticas

Page 56: Introdução a bioinformática e a biologia computacional

[E] = cte

[S] = V0 linear

[S] = V0

V0 = Vmáx

Influência do Substrato

Page 57: Introdução a bioinformática e a biologia computacional

Gráfico substrato e produto

Page 58: Introdução a bioinformática e a biologia computacional

Parâmetros Cinéticos

Page 59: Introdução a bioinformática e a biologia computacional

Parâmetros CinéticosLineweaver-Burk

Page 60: Introdução a bioinformática e a biologia computacional

Equação Michaelis-Menten

Curva: possui a mesma forma para a maioria das enzimas;

Expressa pela Equação de Michaelis e Menten;

Hipótese: limitante: quebra de ES E + P.

Page 61: Introdução a bioinformática e a biologia computacional

Inibidores Competitivos

Forma estrutural = substrato competição;

Porcentual de inibição concentrações e afinidade pela enzima.

Page 62: Introdução a bioinformática e a biologia computacional

Inibidores Competitivos

Equação de Michaelis e Menten

Lineweaver-Burk

SKIK

SVV

Im

máx

1

SVK

IK

VV máx

Im

máx

1111

Page 63: Introdução a bioinformática e a biologia computacional

Inibidores Não-Competitivos

Ocupa outro sítio ES, EI e EIS;

[S] = não leva todas as E produtiva;

Vmáx e Km normal.

Page 64: Introdução a bioinformática e a biologia computacional

Inibidores Não-Competitivos

Equação da velocidade:

Lineweaver-Burk

IIm

máx

KIS

KIK

SVV11

ImáxImáx

m

KI

VSKI

VK

V11111

Page 65: Introdução a bioinformática e a biologia computacional

Biologia Computacional

Page 66: Introdução a bioinformática e a biologia computacional

Matriz Estequiométrica

Elementos básicos:• compostos ou espécies

bioquímicas • concentrações dos compostos• reações ou processos de

transporte

Page 67: Introdução a bioinformática e a biologia computacional

Matriz Estequiométrica

Matriz estequiométrica total

0000

:kvjv

lb

ixS

kvjv

ix:N

Matriz estequiométrica dos metabólitos internos

Page 68: Introdução a bioinformática e a biologia computacional

Parte superior da glicólise da Saccharomyces cerevisiae

Glicose Glic-6-P Fruc-6-P Fruc-1,6-P2ATP

ADP

ATP ADP ATP ADPv1

v2

v3

v4 v5

ADP ATPv6

ATP ADPv7

ATP + AMP 2ADPv8

v1:Glicose + ATP -> ADP + Glic-6-Pv2:Glic-6-P + ATP -> ADPv3:Glic-6-P <-> Fruc-6-Pv4:Fruc-6-P + ATP -> Fruc-1,6-P2 + ADPv5:Fruc-1,6-P2 -> nullv6:ADP -> ATPv7:ATP -> ADPv8:ATP + AMP_i <-> 2ADP

7 metabólitos

8 reações

-1 0 0 0 0 0 0 0 -1 -1 0 -1 0 1 -1 -1 1 1 0 1 0 -1 1 2 1 -1 -1 0 0 0 0 0 0 0 1 -1 0 0 0 0 0 0 0 1 -1 0 0 0 0 0 0 0 0 0 0 -1

Page 69: Introdução a bioinformática e a biologia computacional

Simulação DinâmicaBalanço para os metabólitos

internos:

n

jjij

i vdtdx

1

Nvx

dtd

ij é o coeficiente estequiométrico do metabólito interno i na reação j

• velocidade da reação: px,fv j

Matricial

Page 70: Introdução a bioinformática e a biologia computacional

Simulação DinâmicaSimulação

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.50

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

time (min)

mM

ATPADPGluc-6-PFruc-6-PFruc-1,6-P2AMP

i

Page 71: Introdução a bioinformática e a biologia computacional

Análise de Fluxo Metabólico (AFM)

Determina os fluxos desconhecidos (internos) dados alguns fluxos conhecidos (medidos). Particionando a equação abaixo segundoesta classificação (conhecidosdesconhecidos)

0Nv

0vv

NN

c

x

c

x

obtém-se

rearranjando

ccxx vNvN

Page 72: Introdução a bioinformática e a biologia computacional

Análise de Fluxo Metabólico (AFM)

Resíduo:

determinado (solução única):

0r sobredeterminado (solução única):

ccxx vNNv #Solução:

ccxx vNvN r

mínima é r indeterminado (várias soluções):

mínima com 0 xvr

ccxx vNvN

Repetindo a eq. da AFM:

Page 73: Introdução a bioinformática e a biologia computacional

Análise de Balanço de Fluxo (ABF)

Restrições de balanço

0NvRestrições de capacidade

jjj vvv max,min,

Restrições Termodinâmicas

Reações irreversíveis:

Reações reversíveis:

0min v maxv

minv e maxv

n

jjjvZ

1

e

Page 74: Introdução a bioinformática e a biologia computacional

Rede metabólica daC. acetobutylicum

20 reações

25 metabólitos

11 internos

14 externos

v16

Glicose GlicerolGDH-3-P

NADH NAD+

ATPADP

2ATP 2ADP

(2)

PIR

Acetil-CoA

FdOx

FdRed

NAD+

NADHH2CoA

Lactato

NADHNAD+

AcAcetil-CoA

(2)

CoA2Glicose

1,75NADH

29,7ATP

ADPATP

Acetato

ADPATP

CoA

Etanol

2NAD+2NADH

Acetona

Butirato Butyril-CoA

2NADH

2NAD+

Butanol

2NAD+2NADHATP ADP

CoA

CoA

LactatoExt

AcetatoExt

ButiratoExt

v1 v2

v3

v4

v5 v6

v7

v8

v9 v10

v11

v12 v13

v14 v15

CoA

v17

v18

v19

v20

3Biomassa

Análise de Balanço de Fluxo (ABF)

Page 75: Introdução a bioinformática e a biologia computacional

Maximizar H2

maxZ H2min v2 = 0max v1 = 8.72 v2 = 0

v1 = 8.72v2 = 0v3 = 17.44v4 = 17.44v5 = 17.44v6 = 34.88v7 = 0v8 = 8.72v9 = 0v10 = 0v11 = 0v12 = 8.72v13 = 0v14 = 8.72v15 = 0v16 = 0v17 = 26.16v18 = 0v19 = 0v20 = 0

8,72 0

17,44

17,44 17,44 34,88

0

8,72

0

0

7,720

8,72 0

0

0

0

0

26,16

0

Análise de Balanço de Fluxo (ABF)

Page 76: Introdução a bioinformática e a biologia computacional

Biologia Computacional no DCC• Projetos de Pesquisa: Ferramentas Computacionais

Aplicadas a Modelos Complexos da Fisiologia de Células Cardíacas– Carlos Cristiano– Itamar L. Oliveira– Marcelo Lobosco– Rodrigo Weber– Ciro Barbosa– Ana Paula C. Silva

• Financiado pela FAPEMIG• Outros 2 submetidos ao CNpQ