60
Introduc ¸˜ ao Bioinform ´ atica Biologia Sist ˆ emica Grafos Redes Biol ´ ogicas Conclus ˜ ao Redes Biol ´ ogicas Ney Lemke [email protected] Departamento de F´ ısica e Biof´ ısica 2008

Apresentação BGA 2008

  • Upload
    nlemke

  • View
    742

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Biologicas

Ney [email protected]

Departamento de Fısica e Biofısica

2008

Page 2: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Outline

1 Introducao

2 Bioinformatica

3 Biologia Sistemica

4 Grafos

5 Redes BiologicasRedes MetabolicasRedes IntegradasAplicacoes em Humanos

6 Conclusao

Page 3: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Equipe

Ney LemkeMarcio Luis Acencio - Estudante de Doutorado - FapespLuiz Augusto Bovolenta - Laboratorista Bolsista - FapespTiago Felipe Andrade - Bolsista CNPqGuilherme Germek - Bolsista CNPqPedro Rafael Costa - ICDaniel Nolli - EstagioMilena Giglioli - Estagio

Page 4: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Projetos

Caracterizacao e Simulacao de Redes MetabolicasCaracterizacao de Redes IntegradasDeterminacao de Essencialidade de GenesPromotores em procariotosAnalise de sequencias DNADiseassome e Morbidade de Genes HumanosRede Integrada para o Cancer

Page 5: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Objetivo

Apresentar as principais redes biologicas e algumasferramentas matematicas e computacionais que permitemcaracteriza-las e determinar sua relevancia biologica.Este trabalho e guiado por uma perspectiva pragmatica, ouseja visamos extrair informacao relevante utilizandoabordagens nao reducionistas que sejam robustas o suficientepara lidar com dados com baixa confiabilidade.

Page 6: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Estrategia

Introduzir conceitos relevantes para analise de grafosaleatorios e sua aplicacao em Bioinformatica.Apresentacao das principais redes biologicas e dealgumas analises recentes.

Page 7: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Uma pitada de Epistemologia

O objetivo principal dos cientistas eexpandir o campo de aplicacao daciencia.A pesquisa se organiza em torno detemas centrais com metodologiasdefinidas e com seus proprioscriterios de qualidade.A natureza do processo implica queareas diferentes acabem pordisputar o mesmo terreno, sao estasregioes onde surgem os avancos.

Page 8: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Avancos Recentes

Determinacao da estrutura de proteınas e de suadinamica.Genomas completos.Redes de Interacao.Informacao detalhada sobre atividade genica para muitosgenes em varios instantes de tempo.Paralelizacao de experimentos envolvendo danos a genes,crescimento em diferentes meios de cultura.Tecnicas estatısticas, computacionais e matematicas cadavez mais sofisticadas.

Page 9: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Outline

1 Introducao

2 Bioinformatica

3 Biologia Sistemica

4 Grafos

5 Redes BiologicasRedes MetabolicasRedes IntegradasAplicacoes em Humanos

6 Conclusao

Page 10: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Bioinformatica

A Bioinformatica e uma area depesquisa que integra a Cienciada Computacao, a Matematica,a Estatıstica, a Biologia e aFısica para:

fornecer subsıdios para aexploracao de dadosexperimentais biologicos,

a modelagem e asimulacao de sistemasbiologicos e

para fornecer umarcabouco teorico que nospermita compreender osseres vivos e sua relacaocom o meio ambiente.

Page 11: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

A beleza das coisas simples

De um ponto de vista pragmatico, algumas areas onde aBioinformatica atua:

Deteccao de homologia em sequencias,Montagem de Genomas Completos,Montagem de Bancos de Dados,Especificacao de Ontologias eAnalise de dados de Micro-arranjos.

Page 12: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Modelagem e Simulacao

Redes biologicas e comparacao com dados experimentais;Dinamica e estrutura de proteınas e suas interacoes;Membranas Celulares e de celulas inteiras;Desenvolvimento de organismos.

Page 13: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Outline

1 Introducao

2 Bioinformatica

3 Biologia Sistemica

4 Grafos

5 Redes BiologicasRedes MetabolicasRedes IntegradasAplicacoes em Humanos

6 Conclusao

Page 14: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

O discurso do metodo - Descartes

Aceitar apenas aquilo que temos confianca que everdadeiroDividir as coisas em quantas parcelas for necessariasA partir dos conceitos mais simples construir os objetosmais complexos”... fazer ... enumeracoes tao completas ...que eu tivesse acerteza de nada omitir”

Page 15: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Reducionismo - Holismo

A Biologia Molecular vemadotando uma abordagemreducionista, o que lhe per-mitiu inumeraveis avancos.Os problemas interessantesque podem ser tratados comesta abordagem estao se es-gotando. Assim para tra-tar problemas abertos ne-cessitamos de abordagensque consigam integrar dadosbiologicos em modelos naoreducionistas e quantitativos.

Page 16: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Teoria Geral dos Sistemas

Proposta por Ludwig BertalanffyProcura por leis universais que descrevem sistemascompostos por unidades intergentes.

“...there exist models, principles, and laws that apply togeneralized systems or their subclasses, irrespective of theirparticular kind, the nature of their component elements, and therelationships or ”forces”between them. It seems legitimate toask for a theory, not of systems of a more or less special kind,but of universal principles applying to systems in general.”

Page 17: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Biologia Sistemica

”The reductionist approach has successfully identified most ofthe components and many of the interactions but, unfortunately,offers no convincing concepts or methods to understand howsystem properties emerge...the pluralism of causes and effectsin biological networks is better addressed by observing, throughquantitative measures, multiple components simultaneouslyand by rigorous data integration with mathematical models”Science

Page 18: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Biologia Sistemica

”Systems biology...is about putting together rather than takingapart, integration rather than reduction. It requires that wedevelop ways of thinking about integration that are as rigorousas our reductionist programmes, but different....It meanschanging our philosophy, in the full sense of the term”Denis Noble

Page 19: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Denis Noble

1 Biological functionality is multi-level2 Transmission of information is not one way.3 DNA is not the sole transmitter of inheritance.4 The theory of biological relativity: there is no privileged

level of causality5 Gene ontology will fail without higher-level insight6 There is no genetic program

Page 20: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Denis Noble

1 There are no programs at any other level2 There are no programs in the brain3 The self is not an object4 There are many more to be discovered; a genuine ’theory

of biology’ does not yet exist

Page 21: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Outline

1 Introducao

2 Bioinformatica

3 Biologia Sistemica

4 Grafos

5 Redes BiologicasRedes MetabolicasRedes IntegradasAplicacoes em Humanos

6 Conclusao

Page 22: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Historia

Erdos e Renyi (1960)Kauffman (1969)Barabasi (2000)Strogatz (2001)Barabasi et al (2002,2003, 2004, . . .)

Page 23: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Conceitos Basicos

VerticesArestasGrafos DirecionadosGrafos Bipartidos

Page 24: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Conectividade

Page 25: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Distribuicao de Conectividade

Em muitos grafos de interesse a distribuicao dasconectividades obedece a uma lei de potencia. Ou seja afrequencia com que esperamos encontrar um nodo comconectividade k e P(k) ∼ k−γ . γ e um numero entre 2 e 3tipicamente.

Page 26: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Distancia

Distancia em grafos sao medidas como o numero de nodosque visitamos se nos deslocamos de um nodo ate o outro.Metricas usuais sao o caminho medio e o diametro, que e adistancia dos dois nodos mais distantes em um grafo.

Page 27: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Clusterizacao

Em muitas redes se o nodo A e conectado a B e B e conectadoa C entao e altamente provavel que exista uma aresta entre Ce A. Este fenomeno pode ser caracterizado pela metrica:

C(k) =2ni

k(k − 1)(1)

onde ni e o numero de nodos ligando os primeiro-vizinhos donodo i .

Page 28: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Dano

O dano e uma medida da influencia de um nodo na topologiada rede. A sua definicao depende do grafo em questao.

Page 29: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Hipotese de Kauffman

Os sistemas biologicossao formados por muitaspartes interagentes. Adeterminacao de todos osparametros que compoemeste sistema e inviavel doponto de vista pratico. Paradescrever estes sistemasteoricamente devemos con-siderar ensembles compropriedades estatısticassemelhantes.

Page 30: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Modelos de Grafos

Page 31: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Outline

1 Introducao

2 Bioinformatica

3 Biologia Sistemica

4 Grafos

5 Redes BiologicasRedes MetabolicasRedes IntegradasAplicacoes em Humanos

6 Conclusao

Page 32: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Enzimas

Em qualquer organismo a maior parte das reacoes envolvendocompostos “pequenos” ocorre com probabilidades muito baixassem a ajuda de um catalizador.

Page 33: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Redes Metabolicas

As redes metabolicas sao o conjunto de reacoes quımicasenvolvendo metabolitos de baixo peso molecular e suascorrespondentes enzimas que ocorrem em um organismo.

Page 34: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Mapas Metabolicos

Historicamente as redes metabolicas tem sido divididas emmapas metabolicos, subconjunto de reacoes que possuialguma funcao. Tradicionalmente a bioquımica tem seconcentrado em analisar estes mapas.

Page 35: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Redes metabolicas

Page 36: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Kegg

Kyoto Enciclopedia of Genes and Genomes

Page 37: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Metodologia

SequenciamentoAnotacaoConstrucao das RedesAnaliseSimulacao em larga escala

Page 38: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Descricao de Redes Metabolicas

GrafosCompostos como quantidades homogeneas e contınuasCompostos como quantidades homogeneas e discretasCompostos como quantidades nao homogeneas ediscretas

Page 39: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Qual e a melhor?

A representacao usando grafos e a mais imprecisa mas elapode ser obtida de forma razoavelmente confiavel dos dadosexperimentais. As demais excluindo alguns poucos exemplosnao podem ser ainda ser determinados atraves deexperimentos de larga escala.

Page 40: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Barabasi - 2000

H. Jeong, R. Tombor, R. Albert, Z. N. Oltval e A.-L.Barabasi,“The large-scale organization of metabolic networks”, Nature,407, 651,(2000).Os compostos sao representados por nodos enquanto asreacoes sao representadas por arestas.

Page 41: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Resultados

Page 42: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Problema

Determinar as enzimas mais importantes de um organismoconhecendo apenas a rede metabolica.

Page 43: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Importancia=Letalidade

Usualmente relacionamos importancia com letalidade.Experimentos usando mutagenese sistematica e silenciamentoviral identificaram um numero substancial de enzimasessenciais da E. coli e esta informacao foi diponibilizadapublicamente.

Page 44: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Dano

Quando uma determinada enzima deixa de atuar,eventualmente compostos deixam de ser produzidos.Definimos dano, d , como sendo o numero de compostos quedeixam de ser produzidos se uma determinada enzima naoatua.

Page 45: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Representacao

O grafo e direcionado e possui dois tipos de nodos. Um tiporepresenta reacoes quımicas e o outro um metabolito. Estegrafo e um grafo bipartido direcionado. As aresta entremetabolitos e reacoes e direcionado ao metabolito se ele forum produto e na direcao contraria se ele for um metabolito.Reacoes reversıveis sao tratadas separadamente.

Page 46: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Representacao usando grafos

Page 47: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Material

Para proceder a analise nos baseamos na lista de reacoesdisponibilizada por Palsson para E. Coli bem como nacompilacao de ORFs essenciais disponıvel na Internet.Parte substancial do trabalho consiste em se certificar queestas informacoes estao corretas. Para tanto sempre quepossıvel as informacoes foram checadas com varias fontes,entre elas Kegg, Ergo e Ecocyc.

Page 48: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Dano

Page 49: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

As enzimas mais importantes

Nome d C1. Ribose-phosphate pyrophosphokinase 22 E2. 3-dehydroquinate dehydratase 21 N3. Phosphoglucosamine mutase 20 E4. Shikimate 5-dehydrogenase 20 N5. UDP-N-acetylglucosamine pyrophosphorylase 19 E6. 3-phosphoshikimate 1-carboxyvinyltransferase 18 N

Page 50: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Metabolicas

Desafios

Existe correlacao mas ...Muitos genes que causam dano substancial nao saoessenciais.Genes que nao causam dano nenhum mas saoessenciais.Mais ingredientes devem ser adcionados.

Page 51: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Integradas

Redes Biologicas Integradas

Metabolicas (Kegg Database)Protein-protein interactionRegulatorias

Page 52: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Integradas

Redes Integradas

Page 53: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Integradas

E.coli Integrated Network

Page 54: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Integradas

P(k)

Page 55: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Integradas

C(k)

Page 56: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Redes Integradas

Essencialidade - Weka

Page 57: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Aplicacoes em Humanos

Morbidade em Genes Humanos

Determinar quais genes humanos estao ligados amorbidade.Poucos exemplos ... Desafios computacionais.Usar dados de outros organismos.Integrar dados de SNPsDesafio da Regulacao

Page 58: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Aplicacoes em Humanos

Alvos para Drogas

Determinar quais genes humanos sao bons alvos paradrogas.Atraves de uma analise em rede poderiamos proportratamentos que envolvam mais de uma droga.Utilizar bancos de dados para modelos experimentaiscomo ratos.Usar dados sobre interacao entre drogas.

Page 59: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Outline

1 Introducao

2 Bioinformatica

3 Biologia Sistemica

4 Grafos

5 Redes BiologicasRedes MetabolicasRedes IntegradasAplicacoes em Humanos

6 Conclusao

Page 60: Apresentação BGA 2008

Introducao Bioinformatica Biologia Sistemica Grafos Redes Biologicas Conclusao

Conclusao

Abordagens sistemicas podem ser “cientıficas”Abordagem baseada em grafos permite propor hipotesescientıficas que podem ser testadas.Existe crescente demanda por aplicacoes em saudehumana.