Cavalcanti & Santos Silva 2009 Free Delta

Embed Size (px)

Citation preview

  • 8/17/2019 Cavalcanti & Santos Silva 2009 Free Delta

    1/8

    Capítulo 7 Diversidade Biológica

    Free Delta: um sistema de software livre

    para o processamento de descriçõestaxonômicas

    Mauro José CAVALCANTIEcoinformatics Studio. Caixa Postal 46521 CEP 20551-970 – Rio de Janeiro – RJ – Brasil.

    E-mail: [email protected]

    Edinaldo Nelson dos SANTOS-SILVACoordenação de Pesquisas em Biologia Aquática/INPA. Av. André Araújo 2936, AleixoCEP 69060-001 – Manaus – AM – Brasil. E-mail: [email protected] 

    RESUMO - O sistema DELTA ( Description Language for Taxonomy  ) consiste de um formato flexívelpara a codificação de descrições taxonômicas e um conjunto de programas para o manejo eorganização da informação taxonômica, como construção de chaves dicotômicas, produção dedescrições em linguagem natural e identificação interativa. Todavia, o sistema DELTA originalfoi baseado em um modelo de software proprietário, que coloca limites à utilização e expansãodo sistema. O Projeto Free DELTA é uma alternativa de software livre e código aberto para umsistema genérico de processamento de descrições taxonômicas, oferecendo uma ferramenta desuporte acessível para inventários sistemáticos de biodiversidade.

    PALAVRAS-CHAVE: identificação biológica, chaves taxonômicas, bioinformática, inventários debiodiversidade, DELTA.

    Biotupé: Meio Físico,Diversidade Biológica e Sociocultural do Baixo Rio Negro, Amazônia Central volume 2

    Edinaldo Nelson SANTOS-SILVA, Veridiana Vizoni SCUDELLER (Orgs.),UEA Edições, Manaus, 2009

  • 8/17/2019 Cavalcanti & Santos Silva 2009 Free Delta

    2/8

    90

    Cavalcanti & Santos-Silva

    INTRODUÇÃOA identificação de organismos representa um

    dos passos mais importantes em qualquer estudo

    no âmbito das Ciências Biológicas. Áreas de grandeinteresse prático, como o combate às pragas agrí-colas, dependem fortemente da identificação cor-reta dos organismos envolvidos (insetos, fungos,etc.), a fim de que medidas eficazes de controlepossam ser adotadas. A identificação precisa de or-ganismos também é necessária para que seja pos-sível utilizar-se a classificação taxonômica comoum sistema eficiente de armazenamento e recupe-

    ração de informações (Pankhurst 1991; Edwards &Morse 1995).

    Via de regra, a identificação de espécimes bio-lógicos é feita por profissionais sediados em mu-seus, herbários e universidades, os quais lançammão de conhecimento sistemático para obter umaidentificação correta, a partir do exame detalhadodos organismos e comparações destes com exem-plares de coleção, ilustrações e descrições. Talprocesso baseia-se muitas vezes na heurística dopesquisador, podendo um espécime ser reconhe-cido de imediato pelo especialista, sem nenhumprocedimento mental explícito − o que requer, noentanto, uma quantidade razoável de experiênciaacumulada e perícia (Waldrop 1984).

    Especialistas com tal nível de capacitação, usu-almente existem em pequeno número (Gaston &

    May 1992) e, portanto, são frequentemente muitodemandados. Em problemas práticos, como a iden-tificação de uma praga agrícola, onde a precisãoe a rapidez são vitais, a necessidade do envio deespécimes ao pesquisador em um grande centropode acarretar sérios prejuízos à lavoura, devidoao tempo requerido para o envio e devolução domaterial identificado.

    A identificação de organismos tornou-se mais

    fácil, rápida e acessível ao não especialista a partirda introdução das chaves taxonômicas, certamenteo método de identificação biológica mais conheci-do e utilizado desde o Século XVIII (Metcalf 1954;Papavero & Martins 1983). Uma chave taxonômicaé um artifício usado para selecionar caracteres de

    um determinado grupo de organismos de modoque, por uma série de escolhas alternativas, sejapossível chegar à identificação de um espécimedesconhecido. Chaves taxonômicas são frequente-mente dicotômicas: para identificar um espécime,o usuário da chave escolhe, do primeiro par de op-ções contrapostas, aquela que for verdadeira parao organismo em questão. A opção escolhida podeser seguida por um nome que identifica o organis-mo, ou por um número, que dirige o usuário a ou-tro par de opções, continuando o processo até queuma identificação seja obtida.

    Todavia, chaves taxonômicas são tradicional-mente elaboradas por taxonomistas humanos, queempregam procedimentos subjetivos na construçãode uma chave para um determinado grupo de orga-nismos e, com frequência, muito diferentes de umespecialista para outro. Assim, ainda que as cha-ves taxonômicas tenham tornado possível ao não-especialista identificar organismos com relativafacilidade e rapidez, permaneceram incapazes de

    garantir flexibilidade e precisão nas identificaçõesobtidas, sobretudo quando os caracteres necessá-rios para uma identificação correta são difíceis dever ou de reconhecer pelo usuário inexperiente.

    A subjetividade envolvida no processo de cons-trução de uma chave conduziu às primeiras tentati-vas de desenvolvimento dos sistemas de identifica-ção por computador, capazes de construir chaves(ou identificar organismos interativamente) segun-

    do procedimentos bem definidos, a partir dos da-dos fornecidos pelo taxonomista. Além de possi-bilitar, via de regra, uma identificação mais rápidapelo fato de serem otimizadas, as chaves produzi-das por computador mostram-se muito mais flexí-veis, permitindo a inclusão de novos caracteres outáxons e revisões do grupo; ademais, tornam pos-sível a construção, a partir da mesma base de da-

    dos, de diferentes tipos de chaves, adequadas aouso em laboratório ou em campo, específicas paraa fauna ou a flora de certas localidades ou deter-minados estágios do ciclo de vida dos organismos(Pankhurst 1991; Edwards & Morse 1995).

  • 8/17/2019 Cavalcanti & Santos Silva 2009 Free Delta

    3/8

    91

    Free Delta: um sistema de software livre para oprocessamento de descrições taxonômicas

    O SISTEMA DELTAUma das maiores contribuições no sentido de

    padronizar o processo de aquisição e processa-

    mento da informação taxonômica por computadorfoi a introdução do sistema DELTA ( DEscriptionLanguage for TAxonomy  ) por Dallwitz (1980). Estesistema consiste de um formato flexível para a codi-ficação da informação taxonômica descritiva e umconjunto de programas para o processamento dedados taxonômicos (Dallwitz 1974, 1980). O desen-volvimento do sistema DELTA começou em meadosdos anos 70 na CSIRO Division of Entomology, Aus-

    trália, inicialmente para computadores de grandeporte e depois adaptado para microcomputadoresda linha IBM-PC. Este sistema oferece uma sériede facilidades para o manejo e a organização dainformação taxonômica. Especialmente úteis são apossibilidade de construção de chaves de identifi-cação de diversos tipos, a produção de descriçõesem linguagem natural e a preparação de matrizesde dados para análises fenéticas e cladísticas,além da identificação interativa e recuperação deinformações. O sistema DELTA representou o augedo desenvolvimento dos sistemas de identificaçãopor computador, oferecendo não apenas algorit-mos de identificação mais eficientes, mas tambémum formato prático e padronizado para a codifica-ção de descrições taxonômicas (Askevold & O’Brien1994).

    O formato DELTA aceita todos os tipos de caracte-res, tanto qualitativos (duplo-estado e multiestado,ordenados ou não-ordenados) quanto quantitati-vos (contínuos e descontínuos) e inclui instruções(diretivas) para controlar o processamento dosdados pelos diversos programas componentes dosistema. Uma vez codificados no formato DELTA, osmesmos dados podem ser utilizados para produzirdescrições e chaves de identificação com próposi-

    tos gerais ou específicos, omitindo parte dos carac-teres, ou dando ênfase a alguns deles, o que permi-te a construção, a partir da mesma base de dados,de diferentes tipos de chaves, adequadas ao usoem laboratório ou em campo, específicas para afauna ou a flora de certas localidades ou determi-

    nados estágios do ciclo de vida dos organismos.Isto faz do sistema DELTA uma valiosa ferramentapara inventários sistemáticos de biodiversidade(Allkin et al. 1992; Sharkey 2001) e levantamentosecológicos de campo para estudos de impacto am-biental (Ellis 1988).

    Allkin et al. (1992) demonstraram a utilidade dosistema DELTA para o manejo de dados e a produ-ção de chaves e descrições taxonômicas no de-correr do inventário florístico de Veracruz, México.Sharkey (2001) aplicou o sistema DELTA no inven-tário exaustivo da biodiversidade do Parque Nacio-

    nal das Montanhas Great Smoky, Estados Unidos.Ellis (1988) considerou o sistema DELTA essencialpara implementar o “controle de qualidade” dasidentificações taxonômicas efetuadas no âmbitode levantamentos ecológicos para avaliações deimpacto ambiental.

    O programa INTKEY (Dallwitz 1993; Dallwitz etal. 1998), para identificação interativa e recupera-ção de informações, que faz parte do sistema DEL-

    TA, permite ao usuário acessar o conteúdo de umbanco de dados taxonômico a partir de qualquercaráter e na ordem ou combinação em que dese-jar, iniciando tantas vezes quantas necessáriasaté a determinação de um táxon ser confirmada. OINTKEY permite também o armazenamento de ilus-trações digitalizadas associadas às descrições doscaracteres para guiar o usuário ao longo da chave.Várias bases de dados taxonômicos têm sido cria-

    das com o sistema DELTA, compreendendo desdegêneros de gramíneas e leguminosas até espéciesde corais, formigas e besouros. Muitas destas ba-ses de dados incluem imagens digitalizadas dosorganismos e caracteres e estão disponíveis na In-ternet (http://www.delta-intkey.com).

    Outros programas para o processamento dedados taxonômicos codificados em formato DEL-TA foram desenvolvidos na Inglaterra por RichardPankhurst (PANKEY: Pankhurst 1986), na Holandapor Eric Gouda (TAXASOFT: Gouda 1996), na Ale-manha por Gregor Hagedorn (DELTA Access: Ha-gedorn & Rambold 2000), na Austrália por JasonNunn (MONTANUS) e Mike Choo (DELIA: Chapman& Choo 1996) e na Espanha por Antonio Garcia-

  • 8/17/2019 Cavalcanti & Santos Silva 2009 Free Delta

    4/8

    92

    Cavalcanti & Santos-Silva

    Valdecasas (EDEL: Bello et al.  1996). Ambientesinterativos para a utilização integrada dos váriosprogramas que compõem o sistema DELTA originalforam desenvolvidos na Austrália por Nicholas Lan-der (DELTA Menu System: Lander 1993) e, no Brasil,pelo autor senior (DIANA: Cavalcanti 1996).

    Todavia, a despeito de sua flexibilidade e efici-ência na codificação de descrições taxonômicas, amaior parte dos programas desenvolvidos para oprocessamento de dados no formato DELTA apre-sentam algumas desvantagens, a saber: (1) nãodisponibilizam o código-fonte para inspeção e mo-

    dificação, de acordo com as necessidades de cadausuário ou comunidade de usuários; (2) são limita-dos a um sistema operacional proprietário (Micro-soft Windows).

    O PROJETO FREE DELTAO projeto Free DELTA (http://freedelta.sourcefor-

    ge.net) foi iniciado em abril de 2000, com o obje-tivo de criar um sistema completo, de código livre

    e aberto, compatível com o sistema operacionalLinux, para o processamento de descrições taxonô-micas codificadas no formato DELTA, em seguida àdecisão da CSIRO Division of Entomology de inter-romper o suporte ao desenvolvimento dos progra-mas do sistema DELTA original.

    Em maio de 2005, o projeto Free DELTA foi regis-trado no SourceForge, o maior repositório mundialde desenvolvimento de software de código aberto

    disponível na Internet, onde o site do Free DELTAestá agora hospedado em bases permanentes.

    Em julho de 2008, a iniciativa Free DELTA NG(“New Generation”) foi lançada, para promover odesenvolvimento e intercâmbio de ferramentas desoftware livre e de código aberto para DELTA, intei-ramente baseadas em tecnologias da Internet, por-tanto acessíveis de qualquer lugar, de acordo com

    o princípio da “computação em nuvem”. A iniciati-va Free DELTA NG também define as condições queuma dada ferramenta de software deve atender afim de ser considerada como um programa FreeDELTA program (ver abaixo).

    Em sua versão inicial, o Free DELTA consistiaapenas de uma biblioteca de classes em linguagem

    C++ para a leitura de arquivos no formato DELTA,escrita por Denis Ziegler, com contribuições adicio-nais de Guillaume Rousse e Bastiaan Wakkie.

    A partir da versão “NG”, o sistema Free DELTApassou a ser composto por outros módulos e cor-respondentes funções:

    PyDELTA (http://freedelta.sourceforge.net/pydelta): biblioteca de classes em linguagemPython para a manipulação de arquivos de dadosno formato DELTA, desenvolvida por Mauro J. Caval-canti & Thomas Kluyver.

    WebDelta (http://freedelta.sourceforge.net/

    webdelta): ferramenta em linguagem Perl para edi-ção de dados em formato DELTA através de um na-vegador Web, escrito por Claudio Rivetti e RiccardoPercudani.

    NaviKey (http://www.navikey.net): mini-aplicati-vo ( applet  ) Java para identificação interativa a partirde dados taxonômicos codificados no formato DEL-TA, desenvolvido por Michael Bartley, Noel Cross,Dieter Neubacher e Gerhard Rambold.

    A biblioteca de programação do Free DELTA for-nece um conjunto padronizado, versátil e exten-sível de rotinas para a manipulação de dados noformato DELTA. A partir da versão “NG” do FreeDELTA, esta biblioteca  passou a ser desenvolvidaem Python (http://www.python.org), uma lingua-gem de programação interpretada, orientada a ob-jetos, com uma sintaxe clara e concisa, adequadaao desenvolvimento de aplicações para acesso a

    bancos de dados, Internet e computação científica(Beazley 2000; Bassi 2007; Oliphant 2007). Esteconjunto de rotinas foi projetado para fornecer osuporte básico para todos os programas do FreeDELTA; além disso, as rotinas podem ser pronta-mente incorporadas em programas aplicativos indi-viduais ou sistemas de bancos de dados que sejamcriados por diferentes desenvolvedores. Estas roti-nas são distribuídas como pacotes de código-fontelivre e aberto. Assim, um usuário que necessite deum programa para manejo de dados taxonômicosdiferente dos utilitários do Free DELTA, está apto adesenvolvê-lo por si mesmo, ou contratar um de-senvolvedor individual ou empresa de desenvolvi-mento para desenvolvê-lo, ao mesmo tempo man-

  • 8/17/2019 Cavalcanti & Santos Silva 2009 Free Delta

    5/8

    93

    Free Delta: um sistema de software livre para oprocessamento de descrições taxonômicas

    tendo os benefícios do formato padronizado para acodificação de dados taxonômicos oferecidos peloDELTA. A disponibilidade do código-fonte completotambém permite ao usuários do Free DELTA adaptarestas rotinas de acordo com suas necessidades es-pecíficas. Espera-se que isto contribua para expan-dir a comunidade de usuários do DELTA, bem comofortalecer o papel do DELTA como um sistema pa-dronizado de codificação e intercâmbio de dadostaxonômicos.

    O Free DELTA é capaz de processar dados codi-ficados em DELTA, mas não é idêntico ao sistema

    DELTA original. Estão sendo feitos vários aperfei-çoamentos, com base na experiência com outrossistemas de computação taxonômica, em particu-lar um melhor tratamento de dados quantitativos,mais procedimentos analíticos e de conversão deformatos e uma interface gráfica de usuário maissimples e flexível.

    O Free DELTA tem como características básicas:1) a disponibilidade do código-fonte completo,

    assegurando a cada usuário ou comunidade deusuários a liberdade para modificar os programas eadaptá-los às suas necessidades específicas;

    2) a possibilidade de produzir análises quanti-tativas de dados descritivos e apresentá-las sob aforma de tabelas e gráficos;

    3) a capacidade de exportação de quaisquersubconjuntos de dados em vários formatos padro-nizados de intercâmbio de dados biológicos descri-

    tivos, para utilização em outros programas.Desenvolvedores de software e biólogos taxo-

    nomistas são sempre bem-vindos ao projeto FreeDELTA. Programadores individuais podem contri-buir escrevendo um substituto compatível paraqualquer programa do sistema DELTA original, do-ando-o ao projeto Free DELTA com o código-fontecompleto e documentação, nos termos da mesmalicença de uso e distribuição adotada pelo projetoFree DELTA.

    Para ser incluída no Free DELTA, espera-se queuma ferramenta de software atenda às seguintescondições:

    Deve ser livre, em ambos os sentidos em queesta palavra é usada no mundo da computação(isto é, “de código aberto” e “gratuita”).

    Deve ser multi-platforma (isto é, não restrita asistemas operacionais específicos, especialmentesistemas proprietários)

    Deve ser totalmente compatível com o formatoDELTA original (isto é, não pretendendo substituirou fornecer extensões ad hoc  para este formato).

    Os programas do Free DELTA devem rodar compouca (ou nenhuma) modificação em vários siste-mas operacionais. O código-fonte completo é distri-

    buído nos termos da Licença Pública GNU (http://www.gnu.org). Módulos executáveis pré-compila-dos dos programas do Free DELTA (conversão deformatos, construção de chaves de identificação,identificação interativa e edição de dados taxonô-micos descritivos) também são disponibilizados,para computadores pessoais com GNU/Linux, MS-Windows e Mac OS X. O sistema também inclui do-cumentação técnica e de usuário (na forma de ma-

    nuais e tutoriais), que fornecem toda a informaçãonecessária para usar e modificar os programas.No âmbito do Projeto Biotupé, o sistema Free

    DELTA será usado para produzir guias de identifica-ção (tanto em formato eletrônico quanto na formade manuais impressos) a partir de descrições dasespécies coletadas pelos diversos projetos envol-vidos no inventário da biodiversidade da RDS doTupé. Assim, o Projeto Biotupé espera contribuir

    para a implementação de uma metodologia eficien-te e acessível para a elaboração automatizada deguias de biodiversidade, que permitam a usuáriostecnicamente habilitados, mas não necessariamen-te especializados em botânica ou zoologia, identifi-carem as espécies de plantas e animais da área.

    Como se trata de produto inédito em sua atua-lidade e funcionalidade, o Free DELTA ampliará aautonomia tecnológica e científica nacional na áreade bioinformática e permitirá que grupos de pes-quisa ou pesquisadores individuais envolvidos emestudos de biodiversidade tenham pleno o acessoàs modernas tecnologias de manejo de dados ta-xonômicos, contribuindo para uma aplicação maiseficiente e efetiva do conhecimento biológico em

  • 8/17/2019 Cavalcanti & Santos Silva 2009 Free Delta

    6/8

    94

    Cavalcanti & Santos-Silva

    esforços de conservação e utilização sustentáveldas espécies vivas, especialmente no contexto dosistema megadiverso da Amazônia, com benefíciospara toda a sociedade brasileira.

    AGRADECIMENTOSAos Drs. Mike Dallwitz (CSIRO Division of Ento-

    mology, Canberra) e Richard Pankhurst (Royal Bota-nic Gardens, Edinburgh) pelo envio de publicações;aos Drs. Tatiana Paleo Konno (Universidade Federaldo Rio de Janeiro) e Jeffrey Jon Shaw (ICB, Universi-dade de São Paulo) pela leitura crítica do manuscri-

    to e valiosas sugestões.BIBLIOGRAFIA CITADAAllkin, R., Moreno, N. P., Gama Campillo, L. & Mejia,

    T. 1992. Multiple uses for computer-storedtaxonomic descriptions: keys for Veracruz.Taxon, 41: 413-435.

    Askevold, I. S. & O’Brien, C. W. 1994. DELTA, aninvaluable computer program for generation

    of taxonomic monographs. Annals of theEntomological of America, 87: 1-16.

    Bassi, S. 2007. A primer on Python for life scienceresearchers. PloS Computational Biology, 3:2052-2057.

    Beazley, D. M. 2000. Scientific computing withPython. In: Manset, N., Veillet, C. & Crabtree, D.(eds.) Astronomical Data Analysis Software andSystems IX. ASP Conference Series, Vol. 216, p.

    49-58.Bello, E., Valdecasas, A. G.- & Elvira, J. R. 1996. A

    Spanish and English DELTA Editor: EDEL 95.DELTA Newsletter, 12: 24-26.

    Cavalcanti, M .J. 1996. Designing a graphical userinterface for DELTA: some considerations. DELTANewsletter, 12: 2-4.

    Cavalcanti, M. J. 1998. Aplicações de Sistemas

    Gerenciadores de Bancos de Dados em Ecologiae Sistemática. Acta Biologica Leopoldensia, 20:5-20.

    Chapman, A. R. & Choo, M. 1996. Institutional DEL-TA databases: a case study. DELTA Newsletter,12: 14-15.

    Dallwitz, M. J. 1974. A flexible computer programfor generating identification keys. SystematicZoology, 23: 50-57.

    Dallwitz, M. J. 1980. A general system for coding

    taxonomic descriptions. Taxon, 29: 41-46.Dallwitz, M. J. 1993. DELTA and INTKEY. In: For-

    tuner, R. (Ed.). Advances in Computer Methodsfor Systematic Biology: Artificial Intelligence,Databases, Computer Vision. The Johns HopkinsUniversity Press, Baltimore, Maryland, p. 287-296.

    Dallwitz, M. J., Paine, T. A. & Zurcher, E. J. 1998.

    Interactive keys. In: Bridge, P., Jeffries, P.,Morse, D. R. & Scott, P. R. (Eds.). InformationTechnology, Plant Pathology and Biodiversity.CAB International, Wallingford, p. 201–212.

    Edwards, M. & Morse, D. R. 1995. The potential forcomputer-aided identification in biodiversityresearch. Trends in Ecology and Evolution, 10:153-158.

    Ellis, D. V. 1988. Quality control of biological

    surveys. Marine Pollution Bulletin, 19: 506–512.Gaston, K. J. & May, R. M. 1992. Taxonomy of

    taxonomists. Nature, 356: 281-282.Gouda, E. J. 1996. TAXASOFT DELTA Editor. DELTA

    Newsletter, 12: 12-14Hagedorn, G. & Rambold, G. 2000. A method to

    establish and revise descriptive data sets overthe Internet. Taxon, 49: 517-528.

    Lander, N. S. 1993. DELTA Menu System for

    Windows. DELTA Newsletter, 8: 10-11.Metcalf, Z. P. 1954. The construction of keys.

    Systematic Zoology, 3: 38-45.Oliphant, T. E. 2007. Python in scientific computing.

    Computing in Science & Engineering 9: 10-20.Pankhurst, R. J. 1986. A package of computer

    programs for handling taxonomic databases.Computer Applications in the Biosciences, 2: 33-39.

    Pankhurst, R. J. 1991. Practical TaxonomicComputing. Cambridge University Press, Cam-bridge. 202p.

    Papavero, N. & Martins, U. R. 1983. Itens dapublicação taxonômica. In: Papavero, N. (Ed.).Fundamentos Práticos de Taxonomia Zoológica:

  • 8/17/2019 Cavalcanti & Santos Silva 2009 Free Delta

    7/8

    95

    Free Delta: um sistema de software livre para oprocessamento de descrições taxonômicas

    Coleções, Bibliografia, Nomenclatura. MuseuParaense Emílio Goeldi/Sociedade Brasileira deZoologia, Belém, p. 73-112.

    Sharkey, M. J. 2001. The All Taxa Biological Inventory

    of the Great Smoky Mountains National Park.Florida Entomologist, 84: 556-564.

    Waldrop, M. M. 1984. The necessity of knowledge.Science, 223: 1279-1282.

  • 8/17/2019 Cavalcanti & Santos Silva 2009 Free Delta

    8/8