23
Allan Lima [email protected]

Bancos de Dados Biológicos Integração Através de Ontologias

  • Upload
    irving

  • View
    89

  • Download
    0

Embed Size (px)

DESCRIPTION

Bancos de Dados Biológicos Integração Através de Ontologias. Allan Lima [email protected]. Roteiro. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos Aplicação de Ontologias The Gene Ontology Desafios para a próxima geração de BDs Biológicos. - PowerPoint PPT Presentation

Citation preview

Page 1: Bancos de Dados Biológicos Integração Através  de Ontologias

Allan [email protected]

Page 2: Bancos de Dados Biológicos Integração Através  de Ontologias

Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos

◦ Aplicação de Ontologias The Gene Ontology

Desafios para a próxima geração de BDs Biológicos

Page 3: Bancos de Dados Biológicos Integração Através  de Ontologias

◦ Permitem a previsão de indivíduos com tendência a doenças Imunoterapia Evitar condições ambientais que possam

estimular uma doença Substituição de genes problemáticos (“curativo

genético”) Novas oportunidades de negócios na

◦ Medicina ◦ Agronomia◦ Zootecnia◦ Etc...

Porém, para que isto seja possível

temos que armazenar as informações

genéticas em bases de dados

Page 4: Bancos de Dados Biológicos Integração Através  de Ontologias

Então surge o conceito Bancos de Dados Biológicos◦ Guardam seqüências de ácidos nucléicos e

aminoácidos e suas respectivas anotações◦ Fornecem algoritmos para recuperação e análise

destes dados

Page 5: Bancos de Dados Biológicos Integração Através  de Ontologias

Laboratório de Genética Aplicada na UFRPE◦ Mapeamento de DNA Mitocondrial

litopenaeus vannamei já publicado no NCBI http://www.ncbi.nlm.nih.gov/

Taxonomy/Browser/wwwtax.cgi?id=6689

Hyporhamphus (unifasciatus e roberti) e Hemirhamphus (brasiliensis e balao) Auxiliar no estudo de ecologia,

conservação ou distribuição geográfica Em processo de mapeamento

Page 6: Bancos de Dados Biológicos Integração Através  de Ontologias

The Gene Ontology

Page 7: Bancos de Dados Biológicos Integração Através  de Ontologias

Problema: Bancos de dados de biologia

molecular possuem um grande e variado montante de tipos de

dados

Mas por que?Ainda não há um padrão que as implementações

pretendem seguir

Page 8: Bancos de Dados Biológicos Integração Através  de Ontologias

Arquivos com uma dada estrutura própria◦ GenBank, ACeDB

Bancos de dados implementados via SGBD◦ Relacional, OO, OR.

Arquivos com dados em formato apropriado para execução de determinadas aplicações◦ FASTA e BLAST

Como padronizar e integrar os projetos?

Page 9: Bancos de Dados Biológicos Integração Através  de Ontologias

É um esforço colaborativo para endereçar a necessidade de

descrições dos genes em diferentes bases de dados

Page 10: Bancos de Dados Biológicos Integração Através  de Ontologias

BD RelacionalXML Flat

Files

The Gene Ontology

Search Engine

The Gene Ontology

Search Engine

Page 11: Bancos de Dados Biológicos Integração Através  de Ontologias

Iniciado em 1998 com apenas 3 projetos◦ FlyBase (Drosophila)◦ Saccharomyces Genome Database (SGD) ◦ Mouse Genome Database (MGD)

Estado atual◦ Conjunto de ontologias que diversos projetos já

utilizam Representação dos dados biológicos e dos seus

significados (anotações) Ferramentas de busca e análise

◦ Ferramenta de edição de ontologias

Page 12: Bancos de Dados Biológicos Integração Através  de Ontologias

Padroniza◦ Processos biológicos

Estruturas anatômicas Retículo Endoplasmático Rugoso

Produtos de um gene Ribossomo

◦ Componentes celulares Série de eventos efetuados por um conjunto de

funções moleculares Transporte de glicose

Page 13: Bancos de Dados Biológicos Integração Através  de Ontologias

Padroniza (Continuação) Funções Moleculares

Atividade que ocorrem no nível molecular Catálise

Relacionamentos is_a

Simples relacionamento entre subclasses Cromossomo Nuclear is_a Cromossomo

part_of Núcleo part_of Célula O Núcleo sempre é parte de uma célula, mas nem toda

célula possui um núcleo

Page 14: Bancos de Dados Biológicos Integração Através  de Ontologias
Page 15: Bancos de Dados Biológicos Integração Através  de Ontologias

Os aquivos de definem as ontologias são distribuídos livremente◦ Modelos SQL (MySQL)◦ Definição para o formato dos FlatFiles◦ Esquemas DTD para validar aquivos XML

Há ainda um conjunto de arquivos de mapeamento para algumas bases

Go Downloads

Page 16: Bancos de Dados Biológicos Integração Através  de Ontologias
Page 17: Bancos de Dados Biológicos Integração Através  de Ontologias

termdb◦ ontologias, definições e mapeamentos para outros

bancos assocdb

◦ adiciona suporte para os produtos dos genes seqdb

◦ adiciona suporte para seqüências de proteínas seqdblite

◦ versão simplificada do bd

Page 18: Bancos de Dados Biológicos Integração Através  de Ontologias

Busca um termo da ontologia e mostra todos os produtos de gene anotados para este

Procura por produto de gene e mostra suas associações

Realiza indentificações de seqüências com o algoritmo BLAST

Page 19: Bancos de Dados Biológicos Integração Através  de Ontologias

Pontos negativos◦ Padrões podem inibir a criatividade◦ Nem sempre a adaptação é perfeita◦ Ferramenta de modelagem de ontologia bugada!?◦ Modelo obsoleto das ontologias (DTD)

Pontos positivos◦ TGO ataca o problema de padronização no

armazenamento em diversos sentidos◦ Possui uma vasta documentação

Exemplos, Definições, Tutoriais, Wiki, etc.◦ Conta com várias bases de dados◦ Comunidade de pesquisadores◦ Links para Ferramentas

Page 20: Bancos de Dados Biológicos Integração Através  de Ontologias

Compactação dos dados◦ Genoma humano ~ 3 gigabytes

Ontologias de integração Metadados para as anotações Inferência do significado das cadeias de

DNA Verssionamento

Page 21: Bancos de Dados Biológicos Integração Através  de Ontologias
Page 22: Bancos de Dados Biológicos Integração Através  de Ontologias

Seibel, L. F. B.; Lemos, M.; Lifschitz, S. Bancos de Dados de Genoma. Departamento de Informática. Pontifícia Universidade Católica do Rio de Janeiro

Laboratório de Genética e Expressão. Disponível em: http://www.lge.ibi.unicamp.br/. Último acesso: 25.07.2007

PIR: Protein Information Resource. Disponível em: http://www-nbrf.georgetown.edu/. Último acesso: 25.07.2007

GO: Gene Ontology. Disponível em: http://www.geneontology.org/. Último acesso: 25.07.2007

NCBI: National Center for Biotechnology Information. Disponível em: http://www.ncbi.nlm.nih.gov/. Último acesso: 25.07.2007

GenBank Overview. Disponível em: http://www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.html. Último acesso: 25.07.2007

IF694 - Bancos de Dados Distribuídos e Móveis. Disponível em: http://www.cin.ufpe.br/~if694/. Último acesso: 25.07.2007

The Gene Ontology Project. Disponível em: http://www.cin.ufpe.br/~if694/. Último acesso: 25.07.2007

Page 23: Bancos de Dados Biológicos Integração Através  de Ontologias

Allan [email protected]