A Promessa de código de barras de DNA para Taxonomia
DNA código de barras é um sistema novo projetado para fornecer identificações de espécies rápidas, precisas e automatizáveis, usando regiões genéticas curtas e padronizadas como tags de espécies internas. Como consequência, tornará o sistema taxonômico Linnaean mais acessível, com benefícios para ecologistas, conservacionistas e a diversidade de agências encarregadas do controle de pragas, espécies invasoras e segurança alimentar. Mais amplamente, o código de barras de DNA permite visualizar um dia em que toda mente curiosa, desde biólogos profissionais até estudantes, terá fácil acesso aos nomes e atributos biológicos de qualquer espécie do planeta. Além de atribuir exemplares a espécies conhecidas, o código de barras de DNA acelerará o ritmo da descoberta de espécies, permitindo que os taxonomistas classifiquem rapidamente os espécimes e destacando taxas divergentes que podem representar novas espécies. Ao aumentar suas capacidades desta forma, a codificação de DNA oferece aos taxonomistas a oportunidade de expandir muito, e eventualmente completar, um inventário global da diversidade da vida.
Embora os benefícios potenciais da codificação de DNA, tanto para os profissionais quanto para os usuários da taxonomia, ela tem sido controversa em alguns círculos científicos (Wheeler, 2004; Will e Rubinoff, 2004; Ebach e Holdredge, 2005; Will et al., 2005). Alguns têm até caracterizado o código de barras do DNA como sendo “anti-taxonomia”, argumentando que sua implementação sinalizará a morte de um sistema há 250 anos em construção. Sentimos que esta oposição decorre de conceitos errados sobre o esforço de codificação de barras do ADN. Como tal, acolhemos com agrado esta oportunidade de esclarecer tanto a lógica como os impactos potenciais dos códigos de barras do ADN. Ao responder a esse conjunto de perguntas, enfatizamos os múltiplos impactos positivos dessa abordagem para a taxonomia e a ciência da biodiversidade.
Perguntas
Dado dois bilhões de dólares americanos (estima-se que o custo de um programa abrangente de código de barras de DNA seja de 2 bilhões de dólares americanos), como você gastaria esse dinheiro para beneficiar a pesquisa taxonômica e de biodiversidade, e qual seria o legado desses dados?
Esta pergunta ignora uma realidade inescapável; não há perspectiva de uma única infusão de apoio de 2 bilhões de dólares para qualquer programa de pesquisa em biodiversidade. Tal nível de investimento pode, em última análise, ser alcançado – mas, se assim for, reflectirá um processo encenado e geograficamente disperso de decisões de financiamento positivas que dependerão fortemente tanto do progresso científico como da procura social de identificações ao nível das espécies. A pequena quantidade de financiamento até agora direccionada para o código de barras do ADN produziu uma rica colheita de conhecimentos científicos. Esse fato levou novas organizações a fornecer o apoio necessário para explorar a escalabilidade desses resultados em todo o reino animal. Os primeiros e positivos resultados desta segunda onda de investigações motivaram agora grupos de pesquisa maiores a se unirem. Na verdade, as primeiras alianças com alcance global foram reunidas para liderar o desenvolvimento de bibliotecas de sequências de códigos de barras para todas as aves e peixes. Segmentos de grupos muito mais ricos em espécies, como plantas e lepidópteros, estão nas fases iniciais deste processo (www.barcoding.si.edu). Estes grupos de pesquisa podem, a longo prazo, formar as unidades nucleares necessárias para que a iniciativa do código de barras passe para o domínio da “grande ciência”, onde o sucesso depende do acoplamento de uma agenda de pesquisa claramente enunciada e socialmente significativa com fortes alianças internacionais de pesquisa.
É também importante notar que a busca de apoio em larga escala para o código de barras de DNA não está sendo realizada às custas do financiamento taxonômico. De fato, é claro que qualquer campanha bem-sucedida para gerar esse apoio resultará em uma infusão substancial de financiamento para instituições e indivíduos engajados em pesquisa taxonômica. Em geral, os custos associados ao sequenciamento de ADN representarão um pequeno componente dos esforços de codificação de barras de ADN; a maior parte do financiamento será empregue para os esforços globais de recolha, para a cura dos espécimes resultantes e para o desenvolvimento de bases de dados online contendo informações detalhadas sobre os mesmos. Além disso, é preciso salientar que o financiamento já adquirido veio de grandes fundações e agências e programas governamentais sem tradição de apoio à pesquisa taxonômica, e que em alguns casos as propostas de código de barras de DNA competiram diretamente com projetos médicos e de genômica comparativa, ao invés de qualquer projeto relacionado à pesquisa taxonômica. Vista dessa perspectiva, qualquer esforço de codificação de DNA em larga escala representará um benefício substancial, tanto financeiro quanto científico, para a biodiversidade e a pesquisa taxonômica. Certamente deixará um legado duradouro na forma de um sistema abrangente e amplamente acessível para a identificação de espécies.
Globalmente, a pesquisa taxonômica alfa (a descoberta e descrição de novas espécies) está em crise. Será o código de barras do DNA uma solução expedita para este problema ou irá acelerar o seu declínio?
Na nossa opinião, o declínio da taxonomia alfa não é uma consequência do uso crescente de métodos moleculares, como por vezes tem sido sugerido (Wheeler, 2004). Na verdade, esperamos que o código de barras do DNA ajude no ressurgimento da taxonomia. Os programas de codificação de barras de DNA certamente irão direcionar novos financiamentos para a coleta e catalogação de espécimes. Eles também ajudarão as investigações taxonômicas, ajudando a revelar espécies crípticas (Hebert et al., 2004a, 2004b), conectando sexos e estágios da vida (Beskansky et al., 2003), e esclarecendo problemas de sinonímia que agora consomem muito esforço taxonômico (Alroy, 2002). A novidade e a promessa científica do código de barras de DNA atrairá adicionalmente o interesse público para questões taxonômicas e de biodiversidade, encorajando jovens pesquisadores a entrar na disciplina e tanto departamentos acadêmicos quanto agências de biomanagement a contratá-los.
Estamos confiantes de que o código de barras de DNA desempenhará um papel cada vez mais importante como ferramenta de triagem taxonômica, devido à sua capacidade de revelar rapidamente as descontinuidades genéticas que normalmente separam espécies distintas (por exemplo, Janzen et al., 2005; Smith et al., 2005). Sua aplicação desta forma permitirá uma inversão das abordagens taxonômicas padrão que operam a priori, buscando as descontinuidades morfológicas que sinalizam o isolamento reprodutivo entre conjuntos de organismos não selecionados. Em contraste, o código de barras de DNA permite uma abordagem a posteriori mais eficiente onde grupos pré-definidos e geneticamente divergentes são examinados para variação de traços. Neste sentido, a codificação de barras de DNA será claramente um poderoso facilitador da taxonomia alfa.
A variação de caracteres em excesso entre e dentro das espécies está bem documentada para muitos sistemas de caracteres. Por que isso é mais ou menos um problema para a codificação de barras de DNA?
Overlap na variação de caracteres únicos não é problemático para qualquer sistema taxonômico, seja morfológico ou molecular, desde que múltiplos caracteres sejam empregados para o diagnóstico de taxon. Um equívoco comum da codificação de barras de DNA é que ela é baseada em um único caractere, ou seja, “uma sequência de DNA”. Na verdade, a região do gene 648-bp citocromo c oxidase subunidade I (cox1 ou COI) usada como padrão de código de barras de DNA para membros do reino animal representa um caráter composto complexo envolvendo centenas de componentes que variam independentemente. Alguns desses caracteres componentes são invariantes e, portanto, nem todos os 648 bp são informativos dentro de uma determinada assemblagem taxonômica, mas a maioria é variável. Por exemplo, encontramos variações em 512 dos 648 sítios num grande conjunto de códigos de barras lepidópteros (9715 sequências de 2215 espécies e 1047 gêneros). Isto significa que mesmo dentro de uma única ordem de insetos, os códigos de barras de DNA integram a padronização de semelhanças e diferenças entre centenas de caracteres. Em um certo sentido, é como se o padrão gerado pelas escalas em uma escala de asa de traça – cada escala é quase sem significado, mas o caráter composto do padrão de coloração da asa é altamente informativo.
DNA código de barras usando uma única região de gene não assegura uma resolução taxonômica completa, mas promete proximidade. Com base em resultados passados para grupos animais variados, o código de barras de DNA irá proporcionar resolução a nível de espécie em 95% a 97% dos casos (Hebert et al., 2004b; Janzen et al., 2005; Ward et al., 2005). Quando falhar, irá limitar as opções a um pequeno número de taxa congéneres (que, em muitos casos, poderiam ser totalmente resolvidas com dados genéticos adicionais ou outros dados). Este desempenho impressionante reflecte duas observações importantes, e talvez inesperadas: a raridade da partilha de sequência mitocondrial entre espécies e a escassez de divergências profundas de códigos de barras dentro das espécies. A variação intra-específica limitada em diversos grupos de animais é um achado chave do esforço do código de barras de DNA; um achado que merece uma investigação científica mais profunda. Certamente, cox1 mostra muito menos variação dentro das espécies do que alguns críticos iniciais haviam projetado (por exemplo, Mallet e Willmott, 2003), e isto pode refletir o impacto de varreduras seletivas relacionadas à coevolução dos genomas nuclear e mitocondrial. Importante, para o uso de códigos de barras como identificadores a nível de espécie, as diferenças de códigos de barras parecem acumular-se rapidamente, tornando possível distinguir todas as espécies irmãs, excepto as mais jovens.
Reconhecemos tanto a utilidade geral dos dados genéticos nos estudos taxonómicos como a forte concordância em sinais taxonómicos de diferentes genes. No entanto, enfatizamos que não existe tal coisa como “código de barras de DNA informal”. Um código de barras de DNA não é qualquer sequência de DNA – é uma sequência rigorosamente padronizada de comprimento e qualidade mínimos de um gene acordado, depositado numa base de dados de sequências principais, e anexado a uma amostra de voucher cujas origens e estado actual são registadas. De facto, já foi estabelecido que apenas as sequências cox1 que cumpram estes rigorosos critérios serão designadas como códigos de barras de ADN pelo GenBank do National Center for Biotechnology Information (NCBI, GenBank; www.ncbi.nlm.nih.gov/Genbank), o Laboratório Europeu de Biologia Molecular (EMBL; www.embl.org), e o Banco de Dados de DNA do Japão (DDBJ; www.ddbj.nig.ac.jp).
Há uma distinção importante entre espécies “descrevendo” e “delimitando”, mas uma conflação dos dois criou desconforto sobre o uso de códigos de barras de DNA como base de futuras descrições taxonômicas. Enfatizamos que o código de barras de DNA procura apenas auxiliar na delimitação de espécies – para destacar grupos geneticamente distintos que exibem níveis de divergência de seqüência sugestivos de status de espécie. Em contraste, os códigos de barras de DNA – por si só – nunca são suficientes para descrever novas espécies. Em algum estágio, códigos de barras de DNA claramente divergentes, em combinação com outras informações, serão usados como base para fornecer um novo nome Linnaean (Smith et al., 2005) e, como em qualquer hipótese taxonômica, isto estaria sujeito a uma reavaliação contínua. Por exemplo, em um recente levantamento das aves norte-americanas, o limiar para delinear prováveis novas espécies foi arbitrariamente fixado em 10 × a variação média dentro da espécie de todo o conjunto de dados do código de barras. Isto levou à revelação de quatro presumíveis novas espécies (Hebert et al., 2004b), mas as decisões relativas ao reconhecimento formal destes taxa são deixadas, apropriadamente, para a comunidade ornitológica (notavelmente, a informação morfológica e comportamental existente suporta estas novas hipóteses). A sinergia entre os códigos de barras de DNA e os estudos de diversidade morfológica/ecológica é ainda ilustrada pelo caso da borboleta skipper, Astraptes fulgerator, no qual uma abordagem combinada de morfologia, história natural e códigos de barras revelou um complexo de 10 espécies em uma pequena área da Costa Rica. Importante, várias destas espécies mostraram uma divergência relativamente pequena de códigos de barras, mas um acoplamento desta informação com registos sobre plantas hospedeiras larvares e morfologia iluminou toda a diversidade do complexo (Hebert et al., 2004a).
Os genes de códigos de barras propostos podem não conseguir recuperar árvores de espécies precisas. Isto é importante para a codificação de barras do DNA?
Ressaltamos que os códigos de barras do DNA não visam recuperar relações filogenéticas; eles buscam, ao invés disso, identificar espécies conhecidas e ajudar na descoberta de novas espécies. Apesar deste facto, alguns oponentes têm afirmado que a codificação de barras do ADN falha como uma abordagem taxonómica porque nem sempre recupera árvores de espécies precisas (por exemplo, Will e Rubinoff, 2004). É importante a este respeito enfatizar que as actuais colocações taxonómicas precisam de ser vistas como hipóteses e não como factos. Considere um exemplo primário oferecido por Will e Rubinoff (2004) na sua crítica ao código de barras de DNA: nomeadamente que os códigos de barras de DNA sugerem uma afinidade muito próxima entre a traça Simyra henrici e certas espécies de Acronicta (Hebert et al., 2003). Will e Rubinoff (2004:48) argumentam que esta colocação torna “impossível recuperar qualquer informação taxonômica abaixo do nível supragenérico, nem mesmo a filiação ao gênero”. Entretanto, ao invés de refletir uma falha no código de barras do DNA, acreditamos que este caso ilustra o poder da abordagem para iluminar atribuições taxonômicas que precisam de escrutínio. A colocação tradicional de S. henrici num género distinto reflecte o facto de os seus adultos terem asas anteriores amarelas pálidas, mostrando uma divergência marcante das asas anteriores cinzentas/pretas da espécie Acronicta. No entanto a morfologia larvar, os padrões de forewing dos adultos, o nicho ecológico e a anatomia genital sugerem que S. henrici tem afinidades próximas com Acronicta oblinata (D. Wagner, comunicação pessoal), uma conclusão reforçada pelos códigos de barras de ADN (Fig. 1). A sua coloração característica reflecte provavelmente o facto de as larvas de S. henrici se alimentarem de gramíneas, em oposição aos hábitos de alimentação das árvores das espécies típicas da Acronicta. Uma mudança rápida na cor das asas foi provavelmente impulsionada pela selecção natural para ajudar a correspondência do substrato durante a vida adulta. Assim, este exemplo particular revela não só a capacidade do código de barras do ADN para refinar as hipóteses taxonómicas existentes, mas também para fornecer novos conhecimentos sobre as trajectórias evolutivas (ver Janzen et al.., 2005, para outros exemplos envolvendo lepidópteros tropicais).
Uma árvore de identificação de táxon gerada através da análise conjunta de distâncias K2P mostrando padrões de divergência de sequência de cox1 para 31 espécies de Acronicta e 1 espécie de Simyra. Espécimes de diferentes províncias (Canadá) ou estados (EUA) são mostrados em cores diferentes.
Uma árvore de identificação de táxon gerada através da análise conjunta de distâncias K2P mostrando padrões de divergência de sequência de cox1 para 31 espécies de Acronicta e 1 espécie de Simyra. Espécimes de diferentes províncias (Canadá) ou estados (EUA) são mostrados em cores diferentes.
Algumas espécies não são mitocondrialmente monofiléticas, compartilhando polimorfismos com taxas não relacionadas. Como isso afetará as identificações usando uma abordagem de código de barras?
Embora a troca horizontal de mitocôndrias entre organismos taxonomicamente divergentes possa teoricamente ocorrer, evidências para isso não foram encontradas entre os milhares de espécies animais que agora foram codificadas com código de barras. Seqüências mitocondriais compartilhadas (e portanto códigos de barras) têm sido observadas, mas apenas entre espécies intimamente relacionadas e presumivelmente como resultado da hibridação em curso. Os impactos taxonómicos dessa partilha estão longe de ser catastróficos – restringem a identificação a um pequeno complexo de congéneres. Os códigos de barras compartilhados não representam um problema taxonômico substancial porque são incomuns e seus impactos são paroquiais.
Vale ressaltar que testes críticos de compartilhamento de seqüências mitocondriais entre espécies são difíceis de executar. Muitos estudos presumem que as discrepâncias entre identificações feitas usando traços morfológicos e códigos de barras de DNA sinalizam falhas nos dados dos códigos de barras. Antes de aceitar criticamente tais conclusões, é necessária uma validação mais forte das atribuições baseadas na morfologia. Por exemplo, Wahlberg et al. (2003) relataram conflitos entre a morfologia e as divergências de DNA mitocondrial num complexo de borboletas fortemente aliado, mas esta conclusão teria sido muito mais forte se as atribuições morfológicas tivessem sido confirmadas independentemente por vários taxonomistas (embora estas ainda possam reflectir uma hipótese taxonómica errada). É de notar que testes cegos de código de barras de DNA foram realizados em várias ocasiões. De facto, os códigos de barras de ADN passaram por testes duplo-cegos, nos quais o taxonomista que forneceu os espécimes não se apercebeu da diversidade total das espécies presentes numa amostra (isto é, até que um exame mais aprofundado inspirado pelos resultados dos códigos de barras revelou diferenças biológicas fundamentais entre eles; por exemplo, Hebert et al., 2004a, 2004b). A apresentação de demonstrações empíricas de que os códigos de barras de DNA são capazes de identificações consistentes, precisas e inequívocas é um aspecto chave da pesquisa de códigos de barras, e o mesmo deve ser esperado de abordagens alternativas.
Se a conclusão de um programa de código de barras de DNA alguma vez ocorrer, isto marcaria o início ou o fim da investigação taxonómica e da biodiversidade, e qual será o papel dos sistemáticos num mundo onde a maioria das identificações são feitas por “código de barras”?
DNA código de barras aumentará a escala e o sucesso da ciência da biodiversidade ao aumentar grandemente o acesso às identificações das espécies. Um sistema automatizado baseado em DNA irá libertar os taxonomistas das identificações de rotina, permitindo-lhes direccionar os seus esforços para novas colecções, descrições e avaliações das relações taxonómicas. Alguns oponentes de códigos de barras de DNA argumentaram que as identificações de rotina são apenas uma pequena parte do trabalho de um taxonomista (Lipscomb et al., 2003; Wheeler, 2004; Will e Rubinoff, 2004), enquanto outros elogiaram a utilidade potencial dos sistemas de identificação automatizada, mas apenas se baseada na morfologia (Gaston e O’Neill, 2004; Wheeler, 2004). Acreditamos que a identificação de espécies é um passo limitante para muitas investigações ecológicas e de biodiversidade, assim como para pesquisas taxonômicas, e que o código de barras de DNA, portanto, tanto aliviará uma carga sobre os taxonomistas quanto preencherá uma necessidade atual com benefícios importantes tanto para a taxonomia quanto para a ciência da biodiversidade.
Num mundo com código de barras, os taxonomistas manterão seu papel de liderança na associação, integração e interpretação do conhecimento sobre a variação do estado de caráter que delineia as espécies e o que isso implica para uma taxonomia de nível superior. Como já mencionado anteriormente, seu trabalho em novas coleções de vida pode muitas vezes ser agilizado usando resultados de códigos de barras para permitir uma abordagem a posteriori para o reconhecimento de espécies. Os taxonomistas também continuarão, naturalmente, a explorar outras abordagens moleculares e morfológicas para explorar relações taxonômicas mais profundas.
A inevitável expansão dos esforços de seqüenciamento que viria com um programa de código de barras de DNA seria concomitante com um declínio na qualidade da pesquisa taxonômica?
Foi sugerido que o seqüenciamento é muito caro, difícil, ou demorado para os taxonomistas realizarem (por exemplo Dunn, 2003; Mallet e Willmott, 2003; Seberg et al., 2003). No entanto, os taxonomistas individuais não são mais obrigados a realizar a sua própria sequenciação do que os fotógrafos individuais precisam de revelar as suas próprias fotografias. A codificação de barras já passou para o estágio de “fotomata”, com dezenas de milhares de espécimes sendo analisados a baixo custo em instalações de alto volume de codificação de barras (por exemplo, na Universidade de Guelph, Canadá, e no Smithsonian Institution, EUA). A “carga” direta sobre os colaboradores taxonômicos envolve alimentar o trem analítico fornecendo pequenas amostras de tecidos de espécimes identificados e comprovados para serem codificados com código de barras. medida que as tecnologias microfluídicas amadurecem na próxima década, pode-se esperar o desenvolvimento de dispositivos compactos, acessíveis e de fácil utilização – se não portáteis – que integram todos os estágios da extração de DNA através da análise da seqüência de códigos de barras para obter uma identificação (um movimento para o estágio “Polaroid” na analogia com a fotografia). Embora possamos esperar que tais instrumentos se tornem equipamento padrão tanto para pesquisas taxonômicas quanto para a comunidade mais ampla de organizações e indivíduos que necessitam de acesso rápido à identificação de espécies, isto certamente não implica que os códigos de barras transformarão taxonomistas em biólogos moleculares.
Acreditamos que as ferramentas fornecidas pelos códigos de barras de DNA adicionarão rigor à geração e teste de hipóteses taxonômicas. A taxonomia tem sido geralmente executada usando descontinuidades em características análogas (isto é, morfológicas graduadas) para inferir limites de espécies, uma abordagem que tem gerado um total de 1,7 milhões de hipóteses taxonômicas ao longo de 250 anos. A codificação de barras de DNA permite que estas hipóteses sejam testadas usando um fluxo de dados digital independente (ou seja, baseado em nucleotídeos de DNA). Embora tenha havido uma boa correspondência entre espécies reconhecidas através de abordagens morfológicas com designações baseadas em códigos de barras, existem discordâncias. Estes casos devem ser bem acolhidos, pois reforçarão tanto as hipóteses taxonómicas como os métodos de análise das diferenças entre códigos de barras, podendo levar a novas descobertas em matéria de evolução e ecologia. Todos esses benefícios foram evidenciados nos esforços iniciais de codificação de barras.
Assumindo que os problemas técnicos da codificação de barras do DNA podem ser superados, é agora, ou será sempre rentável em relação aos métodos tradicionais usar códigos de barras de DNA para fins bioinventários?
Um dos principais benefícios e fundamentos da codificação de barras do DNA reside no seu custo-eficácia para a identificação de espécies, especialmente em programas ambiciosos de bioinvenção e biomonitoramento (Smith et al., 2005). Na sua forma actual, os sistemas de linha de produção para identificar mesmo um pequeno grupo de espécies bem conhecidas através de abordagens morfológicas custam cerca de 2 dólares por espécime (por exemplo, programas de monitorização de mosquitos que lidam com menos de 60 espécies; F. C. Hunter, comunicação pessoal). Quando uma equipe de especialistas em taxonomia visa um conjunto maior de espécies em uma área geográfica específica, os custos aumentam substancialmente e a identificação de um único espécime pode custar de US$ 50 a US$ 100 se todos os custos forem internalizados. Atualmente, um código de barras de DNA pode ser gerado por cerca de US$ 5 por espécime, incluindo mão-de-obra e seqüenciamento – e espera-se que esse custo caia a pique. Com o tempo, os programas de código de barras de DNA têm o potencial de se tornarem auto-suficientes, cobrando uma pequena taxa por identificações e mantendo o acesso aberto para pesquisadores acadêmicos.
Custo é apenas um critério para avaliar a utilidade de um sistema de suporte taxonômico para pesquisa em biodiversidade. Velocidade, confiabilidade e acessibilidade são igualmente importantes, e acreditamos que o código de barras do DNA se sobressai nessas áreas. Em contraste, programas de biomonitoramento em menor escala, baseados na morfologia, enfrentam atualmente um grande desafio na entrega de resultados de forma rápida e econômica. Isto pode ter consequências económicas dramáticas, como a actual dificuldade em identificar as espécies invasivas suficientemente cedo para suprimir um surto. No entanto, os benefícios econômicos de excluir mesmo um único invasor nocivo, como o mexilhão-zebra da América do Norte, teriam sido suficientes após uma década para codificar o código de barras da maioria das espécies animais na Terra.
Concordamos que a ciência orientada por hipóteses domina as competições de financiamento em pequena escala e que a taxonomia é pouco lucrativa devido à sua natureza orientada por descobertas. Por outro lado, toda iniciativa da “grande ciência” – da física subatômica ao genoma humano e à exploração espacial – tem sido impulsionada pela descoberta, e esta será a arena de financiamento na qual o programa global de código de barras do DNA operará se estiver à altura do desafio. Como na maioria dos outros grandes projetos científicos, o código de barras do DNA tem sido afirmado como “não ciência”, e que ameaça a capacidade de laboratórios menores de realizar pesquisas orientadas por hipóteses. Em casos passados, tais afirmações sempre se revelaram de vistas curtas. A observação repetida é que a ciência da descoberta em grande escala gira as hipóteses a um ritmo frenético e revela caminhos de investigação que nunca poderiam ter sido antecipados. Neste sentido, muitas das críticas feitas ao código de barras do DNA são notavelmente semelhantes às feitas há uma década atrás em relação ao projeto genoma humano.
O código de barras do DNA já foi bem sucedido em atrair financiamento substancial de diversas agências e organizações que não têm sido financiadoras tradicionais da taxonomia, mas isso não foi conseguido com a venda da “taxonomia” por si só. Ao invés disso, a iniciativa do DNA código de barras promove a visão de um inventário amplamente acessível da diversidade da vida. É apenas enfatizando os benefícios para a sociedade e despertando o interesse do público contribuinte que será gerado o apoio a uma iniciativa global de biodiversidade. Naturalmente, isso não significa que a taxonomia se torne uma “indústria de serviços de alta tecnologia” para outros biólogos, como alguns têm sugerido (por exemplo, Lipscomb et al., 2003; Wheeler, 2004; Will e Rubinoff, 2004). Um dos principais objetivos do código de barras de DNA é permitir que a maioria dos biólogos não taxonomistas – e de fato, qualquer um – tenha acesso direto a informações taxonômicas, enquanto permite que os taxonomistas profissionais se concentrem em gerar mais conhecimento.
Declaração de Posição
Efforts to inventory eukaryotic diversity through morphological analyses have enjoyed much success. A geração de quase dois milhões de hipóteses taxonômicas nos últimos 250 anos é um feito impressionante que proporcionou uma compreensão fundacional da diversidade biológica, mas muitos detalhes aguardam esclarecimento. O código de barras de DNA está posicionado para auxiliar no inventário da vida, acelerando a descoberta de espécies, testando hipóteses taxonômicas atuais e tornando mais fácil a identificação das espécies. Estas contribuições não serão feitas à custa dos valores taxonómicos centrais ou do financiamento. O código de barras do DNA não procura abandonar “estudos morfológicos em favor de um sistema de identificação estreito e totalmente molecular” (Will e Rubinoff, 2004: 47). Ao contrário, ele se esforça para construir alianças entre taxonomistas moleculares e morfológicos (Hebert e Barrett, 2005). Procura, também, preservar os princípios linhinos pelos quais as espécies são nomeadas e classificadas. O código de barras do DNA requer nomes de espécies existentes, morfologicamente derivados para calibração, e são esses nomes que são recuperados quando o código de barras é usado para identificação.
É geralmente aceite que o estudo da biodiversidade é seriamente sub-financiado (Godfray, 2002). Não é fácil atribuir isto ao tema da investigação, pois a ciência da biodiversidade é importante e atrai muito interesse público. No entanto, esta área de investigação sofre de uma cultura de conflito. Em vez de montar grandes colaborações, a comunidade da biodiversidade tem uma tradição de polarização e de luta interna. O código de barras de DNA não é estranho aos invasores – ele tem sido marcado como “tecnologia teoricamente vazia” e como um “truque de salão” (Wheler, 2004; Will et al., 2005). O acoplamento de tais comentários com ataques ad hominem aos proponentes dos códigos de barras de DNA traz pouco crédito à disciplina.
Alguns críticos acusam que a abordagem dos códigos de barras de DNA é fundamentalmente falha, mas os dados disponíveis contam uma história muito diferente: o sucesso dos códigos de barras de DNA tem sido até agora assustadoramente impressionante. Como observa Smith (2005), o código de barras teve um bom desempenho em um teste executado na conferência PEET. Mais importante ainda, uma série de estudos tem agora investigado a eficácia do código de barras de DNA em assemblages de espécies de diversos cenários geográficos, e de numerosos grupos taxonômicos com história de vida e atributos evolutivos divergentes. Como consequência desses testes de sensibilidade, registros de código de barras estão agora disponíveis para mais de 13.000 espécies animais (e se acumulam rapidamente) e revelam uma resolução que não é ilusória (www.barcodinglife.org). Em grupo após grupo, o sucesso na identificação das espécies excede 95% e os poucos casos de resolução comprometida envolvem a incapacidade de discriminar um pequeno grupo de espécies estreitamente aliadas (Hebert et al., 2004a, 2004b; Hebert et al., inédito). Os resultados típicos assemelham-se aos da Figura 1, que mostra o padrão de divergências de código de barras de DNA para 31 espécies de Acronicta, um dos mais diversos gêneros de lepidópteros na América do Norte. Neste caso, não há evidências da partilha de sequência entre os taxa que seria de esperar se a hibridação estivesse a ocorrer ou se as espécies fossem demasiado jovens para serem discriminadas. Em vez disso, há uma separação limpa de espécies com coesão de códigos de barras para os conspecíficos, mesmo quando eles derivam de locais díspares no leste da América do Norte.
Não há nada de excepcional nos resultados dos códigos de barras para os estudos Acronicta em invertebrados do solo do Ártico e em lepidópteros dos trópicos mostram sucesso similar na resolução de espécies (Hogg e Hebert, 2004; Janzen et al., 2005). Este desempenho estende-se a cenários marinhos: um estudo de código de barras que examinou mais de 200 espécies de peixes australianos morfologicamente definidas gerou 100% de sucesso na sua discriminação (Ward et al., 2005). Testes de sensibilidade através de gradientes de 10 vezes em taxas de evolução mitocondrial revelaram elevado sucesso na identificação de espécies a partir de grupos de insectos com as mais baixas e mais altas taxas de evolução (Ball et al., 2005; Smith et al., 2005). Mudanças na composição dos nucleotídeos do genoma mitocondrial também não impactam a resolução do código de barras do DNA, como evidenciado pelo sucesso em grupos, como aves, com alta composição de G+C e outros, como aranhas, com viés A+T extremo (Hebert et al., 2004b; Barrett e Hebert, 2005).
Se estes estudos anteriores são reflexos do desempenho geral dos códigos de barras em todo o reino animal, um sistema abrangente baseado em cox1 irá proporcionar uma resolução taxonómica superior a 99,99% quando visto de uma perspectiva a nível do reino. Para entender isso, basta imaginar cada um dos 10.000 pits da Figura 2 como um repositório de dados de código de barras de uma única espécie. Presumindo que existem 10 milhões de espécies animais, a biblioteca de códigos de barras para este reino poderia ser representada por apenas 1000 destas páginas. A avifauna global, que consiste em cerca de 10.000 espécies de aves, ocupará apenas uma destas páginas. Os registos de códigos de barras para os peixes do mundo ocuparão três páginas, enquanto os escaravelhos ocuparão várias centenas de páginas. Uma vez preenchidos todos os 10 milhões de pits com dados de código de barras, a análise de qualquer nova seqüência de códigos de barras proporcionará transporte imediato para a página correta de 1000, entregando uma resolução de 99,9%. Na verdade, com base nos dados para as aves norte-americanas, a sequência de códigos de barras fornecerá uma resolução perfeita, levando a um buraco de espécie individual na única página da ave em 96% dos casos. Nos restantes casos, o código de barras recentemente recolhido irá corresponder a sequências em dois ou três fossos adjacentes. Em resumo, um código de barras curto irá colapsar a incerteza na identidade da espécie de qualquer uma das 10 milhões de espécies para uma única espécie na maioria dos casos, e para um pequeno subconjunto de espécies estreitamente aliadas em outros casos.
Uma representação gráfica de uma matriz que armazenaria dados de código de barras em 10.000 espécies (por exemplo, quase todas as espécies de aves conhecidas). Mil dessas páginas abrigariam registros de códigos de barras de 10 milhões de espécies. Além de fornecer um epíteto de espécie, tal sistema atuaria como um portal para todas as outras informações coletadas sobre uma determinada espécie, ligando-se a outras bases de dados biológicos abrangentes.
Uma representação gráfica de uma matriz que armazenaria dados de código de barras em 10.000 espécies (por exemplo, quase todas as espécies de aves conhecidas). Mil dessas páginas abrigariam registros de códigos de barras de 10 milhões de espécies. Além de fornecer um epíteto de espécie, tal sistema atuaria como um portal para todas as outras informações coletadas sobre uma determinada espécie, conectando-se a outros bancos de dados biológicos abrangentes.
Funding está agora em vigor para garantir que a biblioteca de códigos de barras de DNA para animais cresça em pelo menos 500.000 registros nos próximos 5 anos, fornecendo cobertura para cerca de 50.000 espécies. Embora isto esteja longe de ser um registo completo de espécies, permitirá que os códigos de barras de ADN funcionem como uma ferramenta de identificação eficaz para os grupos taxonómicos com registos de códigos de barras abrangentes. Por exemplo, como a cobertura de código de barras para peixes, aves e insetos de pragas se aproxima da conclusão, isso proporcionará acesso aberto à identificação dessas espécies, independentemente do estágio ou condição de vida. Como este núcleo de registros de espécies é unido por códigos de barras de outros animais, um sistema de identificação global para este reino da vida irá aumentar.
Embora acreditemos que a generalidade dos códigos de barras tenha agora sido demonstrada para o reino animal, ainda há uma necessidade de estabelecer e avaliar protocolos de códigos de barras para os outros reinos da vida. Os princípios centrais da análise dos códigos de barras (minimização e padronização dos alvos da seqüência) são certamente aplicáveis a esses organismos, mas a seleção das regiões gênicas e os testes de sua eficácia continuam em andamento, embora os resultados iniciais sobre plantas (Kress et al., 2005) e protists (G.W. Saunders, comunicação pessoal) sejam motivo de otimismo. Para além do seu sucesso na separação de espécies conhecidas, o código de barras de ADN será uma poderosa ajuda na resolução de outras questões taxonómicas. Espécies negligenciadas têm sido regularmente reveladas, mesmo em grupos bem estudados como aves norte-americanas (Hebert et al., 2004b), borboletas (Hebert et al., 2004a), e mariposas da seda (Janzen et al., 2005). Seu papel na associação de estágios da vida (Beskansky et al., 2003) e gêneros (Janzen et al., 2005), e no esclarecimento de sinônimos, também será útil em muitas outras investigações taxonômicas.
A ativação de qualquer programa científico importante exige não apenas uma forte fundamentação científica, mas uma demonstração de relevância social. Os códigos de barras de DNA exibem tal relevância ao proporcionar novo acesso a identificações em contextos variados. Os esforços para conservar a vida são actualmente limitados pela necessidade de um sistema de identificação, e acreditamos que esta necessidade só pode ser satisfeita através da codificação de barras do ADN (ver também Smith et al., 2005). A capacidade dos códigos de barras para identificar fragmentos de vida tem aplicações que vão desde a resolução de casos de substituição de espécies no mercado (Marko et al., 2004) até à protecção da segurança alimentar através, por exemplo, do rastreio de resíduos de ruminantes em alimentos para animais. Mais genericamente, a capacidade do código de barras de DNA para fornecer identificações de forma rápida e barata tem o potencial de revolucionar a relação da humanidade com a diversidade biológica (Janzen, 2004).
Se a codificação de barras de DNA prosseguir em grande escala, ela gerará subprodutos importantes para a comunidade científica. Todos os extratos de DNA produzidos durante a análise de código de barras de amostras comprovadas serão armazenados, permitindo esforços futuros para examinar padrões de diversidade de seqüências em outras regiões de genes, e os programas de coleta instigados pelo código de barras de DNA expandirão as amostras disponíveis para análise morfológica. A iniciativa do código de barras também criará um sistema baseado na Web, fornecendo não apenas identificações automatizadas, mas também um portal para informações biológicas de todas as espécies incluídas no registro. Embora o código de barras de DNA não crie a “enciclopédia da vida”, ele irá gerar o seu índice e índice.
Por causa dos resultados científicos positivos e dos seus reconhecidos benefícios para a sociedade, há um entusiasmo crescente por uma iniciativa de codificação de barras de DNA em larga escala. Duas reuniões em Cold Spring Harbor durante 2003 esclareceram planos de ação (Stoeckle, 2003), e mais reuniões se seguiram. A mais recente, que foi organizada pelo Museu de História Natural de Londres, atraiu mais de 230 pesquisadores (Marshall, 2005). O movimento do código de barras também tem uma força organizadora central: o Consortium for the Barcode of Life (CBOL), sediado pela Smithsonian Institution em Washington, que foi lançado em meados de 2004. Mais de 80 organizações de 25 nações, incluindo muitos museus proeminentes, já aderiram ao CBOL(www.barcoding.si.edu). As primeiras campanhas globais de código de barras foram ativadas sob seus auspícios; elas incluem planos para codificar todas as 10.000 espécies de aves e todos os 15.000 peixes marinhos até 2010. Claramente, o trabalho precisa de se expandir para além dos laboratórios individuais para enfrentar grandes projectos como estes, e as redes nacionais de códigos de barras estão a formar-se para estabelecer cadeias de fornecimento de espécimes e para supervisionar as principais instalações analíticas. O primeiro deles, a Canadian Barcode of Life Network, que foi ativada em maio de 2005 (www), pretende codificar pelo menos 10.000 espécies animais canadenses nos próximos 5 anos.
Vemos esses sinais de crescente sinergia entre os vários setores da comunidade da biodiversidade como extremamente promissores. Se desenvolvido ao seu pleno potencial, a história pode ver o empreendimento de código de barras do DNA como um empreendimento que não só melhorou o acesso à informação taxonômica, mas também fortaleceu alianças entre todos aqueles com interesses na documentação, compreensão e preservação da biodiversidade – uma perspectiva realmente emocionante.
Acknowledgements
Agradecemos Mark Stoeckle e Dan Janzen por valiosas sugestões de revisão de rascunhos anteriores deste artigo. Estamos também muito gratos à Fundação Gordon e Betty Moore, NSERC, CFI e OIT pelo seu apoio à pesquisa de códigos de barras de DNA na Universidade de Guelph.
.
,
,
, vol.
(pg.
–
)
>
,
>
,
>
,
.
,
,
, vol.
(pg.
–
)
>
>
>
,
>
.
,
,
, vol.
(pg.
–
)
>
>
>
>
,
>
,
.
,
,
, vol.
(pg.
–
)
>
>
.
,
,
, vol.
(pg.
–
)
>
>
>
,
>
.
,
,
, vol.
pg.
>
>
,
>
,
>
.
,
,
>
>
>
>
>
>
,
.
,
,
, vol.
(pg.
–
)
>
>
.
,
,
, vol.
(pg.
–
)
>
>
>
,
.
,
,
, vol.
(pg.
–
)
>
>
>
>
,
>
,
>
>
,
.
,
,
, vol.
(pg.
–
)
>
>
,
>
,
>
,
>
,
>
.
,
,
, vol.
(pg.
–
)
>
>
>
,
>
,
>
,
.
,
,
, vol.
(pg.
–
)
>
>
,
.
,
,
, vol.
(pg.
–
)
>
>
>
.
,
,
, vol.
(pg.
–
)
>
>
,
>
,
>
>
,
>
>
,
>
.
,
,
>
>
>
>
>
>
,
>
,
>
,
>
,
.
,
,
, vol.
(pg.
–
)
>
>
>
>
,
,
.
,
,
, vol.
(pg.
–
)
>
>
>
,
>
.
,
,
, vol.
(pg.
–
)
>
,
>
,
>
,
>
,
>
,
>
,
>
,
>
.
,
,
, vol.
(pg.
–
)
>
>
>
>
.
,
,
, vol.
pg.
>
>
>
,
>
>
,
>
,
>
,
>
>
,
>
>
,
>
.
,
,
, vol.
(pg.
–
)
>
>
.
,
,
>
>
>
>
>
.
,
,
, vol.
(pg.
–
)
>>
>
>
,
>
,
.
,
,
, vol.
(pg.
–
)
>
>
,
>
,
>
,
>
,
>
.
,
,
>
>
>
>
>
.
,
,
, vol.
(pg.
–
)
>
>
>
,
>
,
.
,
,
>
>
>
>
>
>
,
>
.
,
,
, vol.
(pg.
–
)
>
>
Leave a Reply