La promessa della codifica a barre del DNA per la tassonomia
La codifica a barre del DNA è un nuovo sistema progettato per fornire identificazioni rapide, accurate e automatizzabili delle specie utilizzando brevi regioni genetiche standardizzate come tag interni delle specie. Di conseguenza, renderà il sistema tassonomico di Linneo più accessibile, con benefici per gli ecologisti, i conservazionisti e le diverse agenzie incaricate del controllo dei parassiti, delle specie invasive e della sicurezza alimentare. Più in generale, la codifica a barre del DNA permette di immaginare un giorno in cui ogni mente curiosa, dai biologi professionisti agli scolari, avrà facile accesso ai nomi e agli attributi biologici di qualsiasi specie del pianeta. Oltre ad assegnare gli esemplari alle specie conosciute, la codifica a barre del DNA accelererà il ritmo della scoperta delle specie permettendo ai tassonomisti di ordinare rapidamente gli esemplari e mettendo in evidenza i taxa divergenti che possono rappresentare nuove specie. Aumentando le loro capacità in questi modi, la codifica a barre del DNA offre ai tassonomi l’opportunità di espandere notevolmente, ed eventualmente completare, un inventario globale della diversità della vita.
Nonostante i potenziali benefici della codifica a barre del DNA sia per i professionisti che per gli utenti della tassonomia, è stata controversa in alcuni ambienti scientifici (Wheeler, 2004; Will e Rubinoff, 2004; Ebach e Holdredge, 2005; Will et al., 2005). Alcuni hanno persino caratterizzato il DNA barcoding come “anti-tassonomia”, sostenendo che la sua implementazione segnerà la morte di un sistema che ha richiesto 250 anni di lavoro. Riteniamo che questa opposizione derivi da idee sbagliate sullo sforzo di DNA barcoding. Come tale, accogliamo con favore questa opportunità di chiarire sia la logica che i potenziali impatti della codifica a barre del DNA. Nel rispondere a questa serie di domande, sottolineiamo i molteplici impatti positivi di questo approccio per la tassonomia e la scienza della biodiversità.
Domande
Dotati di due miliardi di dollari USA (la somma che si stima costerà un programma completo di DNA barcoding), come spendereste questo denaro a beneficio della ricerca tassonomica e della biodiversità, e quale sarebbe l’eredità di questi dati?
Questa domanda ignora una realtà ineludibile; non c’è alcuna prospettiva di una singola infusione di 2 miliardi di dollari di sostegno per qualsiasi programma di ricerca sulla biodiversità. Un tale livello di investimento può essere raggiunto alla fine – ma, se così fosse, rifletterà un processo graduale e geograficamente disperso di decisioni di finanziamento positive che dipenderanno pesantemente sia dal progresso scientifico che dalla domanda sociale per le identificazioni a livello di specie. La piccola quantità di finanziamenti finora diretti alla codifica a barre del DNA ha prodotto un ricco raccolto di intuizioni scientifiche. Questo fatto ha portato nuove organizzazioni a fornire il supporto necessario per esplorare la scalabilità di questi risultati in tutto il regno animale. I primi e positivi risultati di questa seconda ondata di indagini hanno ora motivato gruppi di ricerca più grandi a coalizzarsi. Infatti, le prime alleanze con una portata globale sono state assemblate per guidare lo sviluppo di librerie di sequenze di codici a barre per tutti gli uccelli e i pesci. Segmenti di gruppi molto più ricchi di specie, come piante e lepidotteri, sono nelle prime fasi di questo processo (www.barcoding.si.edu). Questi gruppi di ricerca possono, a lungo termine, formare le unità nucleari necessarie affinché l’iniziativa dei codici a barre si muova nel campo della “grande scienza”, dove il successo dipende dall’accoppiamento di un’agenda di ricerca chiaramente enunciata e socialmente significativa con forti alleanze di ricerca internazionali.
È anche importante notare che la ricerca di un supporto su larga scala per la codifica del DNA non viene portata avanti a spese del finanziamento tassonomico. Infatti, è chiaro che qualsiasi campagna di successo per generare questo sostegno si tradurrà in una sostanziale infusione di fondi per le istituzioni e gli individui impegnati nella ricerca tassonomica. Nel complesso, i costi associati al sequenziamento del DNA rappresenteranno una piccola componente degli sforzi di codifica del DNA; la maggior parte dei finanziamenti sarà impiegata per gli sforzi di raccolta globale, per la cura degli esemplari risultanti, e per lo sviluppo di database online contenenti informazioni dettagliate su di essi. Inoltre, vale la pena sottolineare che i finanziamenti già acquisiti sono venuti da grandi fondazioni e agenzie governative e programmi che non hanno alcuna tradizione di sostegno alla ricerca tassonomica, e che in alcuni casi le proposte di DNA barcoding sono entrate in competizione diretta con progetti di genomica medica e comparativa piuttosto che con quelli relativi alla ricerca tassonomica. Visto da questa prospettiva, qualsiasi sforzo di barcodifica del DNA su larga scala rappresenterà una sostanziale manna, sia finanziariamente che scientificamente, per la biodiversità e la ricerca tassonomica. Lascerà certamente un’eredità duratura sotto forma di un sistema completo e ampiamente accessibile per l’identificazione delle specie.
A livello globale, la ricerca tassonomica alfa (la scoperta e la descrizione di nuove specie) è in crisi. La codifica a barre del DNA è una soluzione opportuna a questo problema o ne accelererà il declino?
A nostro avviso il declino della tassonomia alfa non è una conseguenza del crescente uso di metodi molecolari, come è stato talvolta suggerito (Wheeler, 2004). Infatti, ci aspettiamo che il DNA barcoding aiuti la rinascita della tassonomia. I programmi di codifica a barre del DNA indirizzeranno certamente nuovi finanziamenti verso la raccolta e la catalogazione degli esemplari. Aiuteranno anche le indagini tassonomiche aiutando a rivelare specie criptiche (Hebert et al., 2004a, 2004b), collegando i sessi e gli stadi di vita (Beskansky et al., 2003), e chiarendo i problemi di sinonimia che ora consumano molti sforzi tassonomici (Alroy, 2002). La novità e la promessa scientifica del DNA barcoding attirerà inoltre l’interesse del pubblico verso le questioni tassonomiche e di biodiversità, incoraggiando i giovani ricercatori ad entrare nella disciplina e sia i dipartimenti accademici che le agenzie di biomanagement ad assumerli.
Siamo sicuri che il DNA barcoding avrà un ruolo sempre più importante come strumento di screening tassonomico grazie alla sua capacità di rivelare rapidamente le discontinuità genetiche che normalmente separano specie distinte (ad esempio, Janzen et al., 2005; Smith et al., 2005). La sua applicazione in questo modo permetterà un’inversione degli approcci tassonomici standard che operano in modo a priori – cercando le discontinuità morfologiche che segnalano l’isolamento riproduttivo tra gruppi di organismi non classificati. Al contrario, la codifica a barre del DNA permette un approccio a posteriori più efficiente in cui gruppi predefiniti, geneticamente divergenti, vengono esaminati per la variazione dei tratti. In questo senso, la codifica a barre del DNA sarà chiaramente un potente abilitatore della tassonomia alfa.
La sovrapposizione della variazione dei caratteri tra e dentro le specie è ben documentata per molti sistemi di caratteri. Perché questo è più o meno un problema per il DNA barcoding?
La sovrapposizione nella variazione dei singoli caratteri non è problematica per nessun sistema tassonomico, sia esso morfologico o molecolare, finché più caratteri sono impiegati per la diagnosi del taxon. Un equivoco comune della codifica a barre del DNA è che si basa su un singolo carattere, cioè “una sequenza di DNA”. Infatti, la regione del gene della citocromo c ossidasi subunità I (cox1 o COI) di 648 bp usata come standard di codice a barre del DNA per i membri del regno animale rappresenta un carattere composito complesso che coinvolge centinaia di componenti che variano indipendentemente. Alcuni di questi caratteri componenti sono invarianti e quindi non tutti i 648 bp sono informativi all’interno di un dato assemblaggio tassonomico, ma la maggior parte sono variabili. Per esempio, abbiamo trovato variazioni in 512 dei 648 siti in un grande insieme di codici a barre di lepidotteri (9715 sequenze da 2215 specie e 1047 generi). Questo significa che anche all’interno di un singolo ordine di insetti, i codici a barre del DNA integrano lo schema di somiglianze e differenze tra centinaia di caratteri. In un certo senso, è come il patterning generato dalle scaglie sull’ala di una falena – ogni scaglia è quasi senza significato, ma il carattere composito del pattern di colorazione dell’ala è altamente informativo.
Il barcoding del DNA utilizzando una singola regione genica non assicura una risoluzione tassonomica completa, ma promette vicinanza. Sulla base dei risultati passati per vari gruppi animali, il DNA barcoding fornirà una risoluzione a livello di specie nel 95%-97% dei casi (Hebert et al., 2004b; Janzen et al., 2005; Ward et al., 2005). Quando fallisce, restringe le opzioni ad un piccolo numero di taxa congenerici (che, in molti casi, potrebbero essere risolti completamente con ulteriori dati genetici o di altro tipo). Questa impressionante performance riflette due importanti, e forse inaspettate, osservazioni: la rarità della condivisione della sequenza mitocondriale tra le specie e la scarsità di profonde divergenze di codici a barre all’interno delle specie. La variazione intraspecifica limitata in diversi gruppi animali è una delle prime scoperte chiave del lavoro sui codici a barre del DNA, che merita un’indagine scientifica più approfondita. Certamente, il cox1 mostra molte meno variazioni all’interno delle specie di quanto alcuni critici iniziali avevano previsto (ad esempio, Mallet e Willmott, 2003), e questo potrebbe riflettere l’impatto delle spazzate selettive legate alla coevoluzione dei genomi nucleare e mitocondriale. È importante notare che per l’uso dei codici a barre come identificatori a livello di specie, le differenze dei codici a barre sembrano accumularsi rapidamente, rendendo possibile distinguere tutte le specie sorelle, tranne le più giovani.
Riconosciamo sia l’utilità generale dei dati genetici negli studi tassonomici che la forte concordanza nei segnali tassonomici da diversi geni. Tuttavia, sottolineiamo che non esiste una cosa come il “barcoding informale del DNA”. Un codice a barre del DNA non è una sequenza di DNA qualsiasi: è una sequenza rigorosamente standardizzata di lunghezza e qualità minime di un gene concordato, depositata in un importante database di sequenze e allegata a un esemplare voucher di cui si registrano le origini e lo stato attuale. Infatti, è già stato stabilito che solo quelle sequenze cox1 che soddisfano questi rigorosi criteri saranno designate come codici a barre del DNA dal National Center for Biotechnology Information’s GenBank (NCBI, GenBank; www.ncbi.nlm.nih.gov/Genbank), l’European Molecular Biology Laboratory (EMBL; www.embl.org), e la DNA Data Bank of Japan (DDBJ; www.ddbj.nig.ac.jp).
C’è un’importante distinzione tra “descrivere” e “delimitare” le specie, ma una confusione dei due ha creato disagio sull’uso dei codici a barre del DNA come base delle future descrizioni tassonomiche. Sottolineiamo che la codifica a barre del DNA cerca semplicemente di aiutare a delimitare le specie – evidenziando gruppi geneticamente distinti che mostrano livelli di divergenza di sequenza suggestivi dello status di specie. Al contrario, i codici a barre del DNA da soli non sono mai sufficienti per descrivere nuove specie. Ad un certo punto, i codici a barre del DNA chiaramente divergenti, in combinazione con altre informazioni, saranno usati come base per fornire un nuovo nome linnaiano (Smith et al., 2005) e, come per ogni ipotesi tassonomica, questo sarà soggetto ad una continua rivalutazione. Per esempio, in una recente indagine sugli uccelli del Nord America, la soglia per delineare probabili nuove specie è stata arbitrariamente fissata a 10 volte la variazione media all’interno della specie dell’intero set di dati del codice a barre. Questo ha portato alla rivelazione di quattro presunte nuove specie (Hebert et al., 2004b), ma le decisioni riguardanti il riconoscimento formale di questi taxa sono state lasciate, opportunamente, alla comunità ornitologica (in particolare, le informazioni morfologiche e comportamentali esistenti supportano queste nuove ipotesi). La sinergia tra il DNA barcoding e gli studi sulla diversità morfologica/ecologica è ulteriormente illustrata dal caso della farfalla skipper, Astraptes fulgerator, in cui un approccio combinato di morfologia, storia naturale e barcoding ha rivelato un complesso di 10 specie in una piccola area del Costa Rica. È importante notare che molte di queste specie hanno mostrato una divergenza di codici a barre relativamente piccola, ma l’accoppiamento di queste informazioni con le registrazioni sulle piante ospiti larvali e la morfologia ha illuminato l’intera diversità del complesso (Hebert et al., 2004a).
I geni di codici a barre proposti possono fallire nel recuperare alberi di specie accurati. Questo è importante per il DNA barcoding?
Sottolineiamo che i codici a barre del DNA non mirano a recuperare relazioni filogenetiche; cercano invece di identificare le specie conosciute e di aiutare la scoperta di nuove specie. Nonostante questo fatto, alcuni oppositori hanno sostenuto che il DNA barcoding fallisce come approccio tassonomico perché non sempre recupera alberi di specie accurati (per esempio, Will e Rubinoff, 2004). È importante a questo proposito sottolineare che le attuali collocazioni tassonomiche devono essere viste come ipotesi e non come fatti. Consideriamo un esempio primario offerto da Will e Rubinoff (2004) nella loro critica alla codifica a barre del DNA: cioè che i codici a barre del DNA suggeriscono un’affinità molto stretta tra la falena Simyra henrici e certe specie di Acronicta (Hebert et al., 2003). Will e Rubinoff (2004:48) sostengono che questo posizionamento rende “impossibile recuperare qualsiasi informazione tassonomica al di sotto del livello sopragenerico, nemmeno l’appartenenza al genere”. Tuttavia, piuttosto che riflettere un fallimento del DNA barcoding, crediamo che questo caso illustri il potere dell’approccio per illuminare le assegnazioni tassonomiche che hanno bisogno di essere esaminate. La collocazione tradizionale di S. henrici in un genere distinto riflette il fatto che i suoi adulti hanno ali anteriori giallo pallido, mostrando una notevole divergenza dalle ali anteriori grigio-nere delle specie Acronicta. Eppure la morfologia larvale, i modelli delle ali anteriori degli adulti, la nicchia ecologica e l’anatomia genitale suggeriscono tutti che S. henrici ha strette affinità con Acronicta oblinata (D. Wagner, comunicazione personale), una conclusione rafforzata dai codici a barre del DNA (Fig. 1). La sua caratteristica colorazione delle ali anteriori riflette probabilmente il fatto che le larve di S. henrici si nutrono di erbe, in contrasto con le abitudini di alimentazione degli alberi delle tipiche specie Acronicta. Un rapido cambiamento nel colore delle ali è stato presumibilmente guidato dalla selezione naturale per aiutare l’abbinamento del substrato durante la vita adulta. Così, questo particolare esempio rivela non solo la capacità del DNA barcoding di perfezionare le ipotesi tassonomiche esistenti, ma anche di fornire nuove conoscenze sulle traiettorie evolutive (vedi Janzen et al, 2005, per altri esempi che coinvolgono i lepidotteri tropicali).
Un albero di identificazione del taxon generato attraverso l’analisi di prossimità delle distanze K2P che mostra i modelli di divergenza della sequenza cox1 per 31 specie di Acronicta e 1 specie di Simyra. Gli esemplari provenienti da diverse province (Canada) o stati (USA) sono mostrati in colori diversi.
Un albero di identificazione dei taxon generato attraverso l’analisi di prossimità delle distanze K2P che mostra i modelli di divergenza della sequenza cox1 per 31 specie di Acronicta e 1 specie di Simyra. Gli esemplari provenienti da diverse province (Canada) o stati (USA) sono mostrati in colori diversi.
Alcune specie non sono mitochondrialmente monofiletiche, condividendo polimorfismi con taxa non correlati. Come influenzerà le identificazioni utilizzando un approccio di codici a barre?
Anche se lo scambio orizzontale di mitocondri tra organismi tassonomicamente divergenti potrebbe teoricamente verificarsi, l’evidenza di ciò non è stata trovata tra le migliaia di specie animali che sono state ora codificate a barre. Sono state osservate sequenze mitocondriali condivise (e quindi codici a barre), ma solo tra specie strettamente correlate e presumibilmente come risultato di un’ibridazione in corso. Gli impatti tassonomici di tale condivisione sono tutt’altro che catastrofici: limitano le identificazioni a un piccolo complesso di congeneri. I codici a barre condivisi non rappresentano un problema tassonomico sostanziale perché sono poco comuni e il loro impatto è parrocchiale.
Vale la pena sottolineare che i test critici della condivisione della sequenza mitocondriale tra le specie sono difficili da eseguire. Molti studi presumono che le discrepanze tra le identificazioni fatte usando i tratti morfologici e i codici a barre del DNA segnalino difetti nei dati dei codici a barre. Prima di accettare criticamente tali conclusioni, è necessaria una maggiore convalida delle assegnazioni basate sulla morfologia. Per esempio, Wahlberg et al. (2003) hanno riportato conflitti tra la morfologia e le divergenze del DNA mitocondriale in un complesso di specie di farfalle strettamente alleate, ma questa conclusione sarebbe stata molto più forte se le assegnazioni morfologiche fossero state confermate indipendentemente da diversi tassonomisti (sebbene queste potrebbero ancora riflettere un’ipotesi tassonomica errata). Vale la pena notare che i test alla cieca della codifica a barre del DNA sono stati eseguiti in diverse occasioni. In effetti, la codifica a barre del DNA ha superato test in doppio cieco, in cui il tassonomista che forniva gli esemplari non si rendeva conto dell’intera diversità delle specie presenti in un campione (cioè, fino a quando un ulteriore esame ispirato dai risultati della codifica a barre ha rivelato differenze biologiche chiave tra loro; ad esempio, Hebert et al., 2004a, 2004b). Fornire dimostrazioni empiriche che i codici a barre del DNA sono capaci di identificazioni coerenti, accurate e non ambigue è un aspetto chiave della ricerca sui codici a barre, e lo stesso ci si dovrebbe aspettare da approcci alternativi.
Se il completamento di un programma di DNA barcoding dovesse mai avvenire, questo segnerebbe l’inizio o la fine della ricerca tassonomica e della biodiversità, e quale sarà il ruolo dei sistematici in un mondo in cui la maggior parte delle identificazioni sono fatte tramite “codice a barre”?
Il DNA barcoding aumenterà la scala e il successo della scienza della biodiversità aumentando notevolmente l’accesso alle identificazioni delle specie. Un sistema automatizzato basato sul DNA libererà i tassonomisti dalle identificazioni di routine, permettendo loro di dirigere i loro sforzi verso nuove collezioni, descrizioni e valutazioni delle relazioni tassonomiche. Alcuni oppositori della codifica a barre del DNA hanno sostenuto che le identificazioni di routine sono solo una parte minore del lavoro di un tassonomista (Lipscomb et al., 2003; Wheeler, 2004; Will e Rubinoff, 2004), mentre altri hanno lodato la potenziale utilità dei sistemi di identificazione automatica, ma solo se basati sulla morfologia (Gaston e O’Neill, 2004; Wheeler, 2004). Noi crediamo che le identificazioni delle specie siano un passo fondamentale per molte indagini ecologiche e sulla biodiversità, così come per la ricerca tassonomica, e che la codifica a barre del DNA allevierà un peso per i tassonomi e riempirà un bisogno attuale con importanti benefici sia per la tassonomia che per la scienza della biodiversità.
In un mondo con codici a barre, i tassonomi manterranno il loro ruolo di leader nell’associazione, integrazione e interpretazione delle conoscenze sulla variazione dello stato dei caratteri che delinea le specie e ciò che questo implica per la tassonomia di livello superiore. Come notato in precedenza, il loro lavoro su nuovi assemblaggi di vita può spesso essere accelerato dall’uso dei risultati dei codici a barre per consentire un approccio a posteriori al riconoscimento delle specie. I tassonomisti, naturalmente, continueranno anche a sfruttare altri approcci molecolari e morfologici per esplorare relazioni tassonomiche più profonde.
L’inevitabile espansione degli sforzi di sequenziamento che verrebbe con un programma di codici a barre del DNA sarebbe concomitante con un declino della qualità della ricerca tassonomica?
È stato suggerito che il sequenziamento è troppo costoso, difficile o richiede tempo per i tassonomi (es, Dunn, 2003; Mallet e Willmott, 2003; Seberg et al., 2003). Tuttavia, ai singoli tassonomisti non è richiesto di eseguire il proprio sequenziamento più di quanto i singoli fotografi abbiano bisogno di sviluppare le proprie fotografie. La codifica a barre è già passata allo stadio di “photomat”, con decine di migliaia di esemplari analizzati a basso costo in strutture ad alto volume di codifica a barre (ad esempio, presso l’Università di Guelph, Canada, e la Smithsonian Institution, USA). L'”onere” diretto per i collaboratori tassonomici consiste nell’alimentare il treno analitico fornendo piccoli campioni di tessuto da esemplari identificati e certificati da sottoporre a codice a barre. Con la maturazione delle tecnologie microfluidiche nel prossimo decennio, ci si può aspettare lo sviluppo di dispositivi convenienti, facili da usare, compatti – se non palmari – che integrino tutte le fasi dall’estrazione del DNA all’analisi della sequenza del codice a barre per ottenere un’identificazione (un movimento verso la fase “Polaroid” nell’analogia con la fotografia). Sebbene ci si possa aspettare che tali strumenti diventino un equipaggiamento standard sia per la ricerca tassonomica che per la più ampia comunità di organizzazioni e individui che hanno bisogno di un rapido accesso alle identificazioni delle specie, questo certamente non implica che la codifica a barre trasformerà i tassonomisti in biologi molecolari.
Crediamo che gli strumenti forniti dalla codifica a barre del DNA aggiungeranno rigore alla generazione e alla verifica delle ipotesi tassonomiche. La tassonomia è stata generalmente eseguita utilizzando discontinuità nei tratti analogici (cioè, morfologici graduali) per dedurre i confini delle specie, un approccio che ha generato un totale di 1,7 milioni di ipotesi tassonomiche in 250 anni. La codifica a barre del DNA permette di testare queste ipotesi utilizzando un flusso di dati digitali indipendenti (cioè basati sul DNA nucleotidico). Anche se c’è stata una buona corrispondenza tra le specie riconosciute attraverso approcci morfologici con le designazioni basate sui codici a barre, ci sono discordanze. Questi casi dovrebbero essere accolti con favore in quanto rafforzeranno sia le ipotesi tassonomiche che i metodi di analisi delle differenze dei codici a barre, e possono portare a nuove scoperte riguardanti l’evoluzione e l’ecologia. Tutti questi benefici sono stati evidenziati nei primi sforzi di codifica a barre.
Assumendo che i problemi tecnici della codifica a barre del DNA possano essere superati, è ora o sarà mai conveniente rispetto ai metodi tradizionali usare i codici a barre del DNA per scopi di bioinventario?
Un grande vantaggio e la logica della codifica a barre del DNA risiede nel suo rapporto costo-efficacia per l’identificazione delle specie, specialmente in ambiziosi programmi di bioinventario e biomonitoraggio (Smith et al., 2005). Allo stato attuale, i sistemi di produzione in linea per identificare anche un piccolo gruppo di specie accuratamente conosciute attraverso approcci morfologici costano circa 2 dollari per esemplare (ad esempio, programmi di monitoraggio delle zanzare che trattano meno di 60 specie; F. C. Hunter, comunicazione personale). Quando un team di specialisti tassonomici si rivolge a un gruppo più grande di specie in una specifica area geografica, i costi aumentano sostanzialmente e l’identificazione di singoli esemplari può costare da 50 a 100 dollari se tutti i costi vengono internalizzati. Oggi, un codice a barre del DNA può essere generato per circa 5 dollari per esemplare, inclusa la manodopera e il sequenziamento, e questo costo dovrebbe crollare. Col tempo, i programmi di codifica a barre del DNA hanno il potenziale per diventare autosufficienti facendo pagare una piccola tassa per le identificazioni, pur mantenendo l’accesso aperto per i ricercatori accademici.
Il costo è solo un criterio per valutare l’utilità di un sistema di supporto tassonomico per la ricerca sulla biodiversità. La velocità, l’affidabilità e l’accessibilità sono altrettanto importanti, e noi crediamo che il DNA barcoding eccelle in queste aree. Al contrario, anche i programmi di biomonitoraggio su piccola scala basati sulla morfologia attualmente affrontano una grande sfida nel fornire risultati in modo rapido e conveniente. Questo può avere conseguenze economiche drammatiche, come nel caso dell’attuale difficoltà di identificare le specie invasive abbastanza presto da sopprimere un’epidemia. Eppure, i benefici economici derivanti dall’esclusione anche di un solo invasore nocivo, come la cozza zebra dal Nord America, sarebbero stati sufficienti dopo un decennio per applicare il codice a barre alla maggior parte delle specie animali sulla Terra.
Siamo d’accordo che la scienza guidata dall’ipotesi domina le competizioni di finanziamento su piccola scala e che la tassonomia se la cava male a causa della sua natura guidata dalla scoperta. D’altra parte, ogni iniziativa di “grande scienza” – dalla fisica subatomica al genoma umano all’esplorazione dello spazio – è stata guidata dalla scoperta, e questa sarà l’arena di finanziamento in cui il programma globale di barcoding del DNA opererà se sarà all’altezza della sfida. Come con la maggior parte degli altri grandi progetti scientifici, la codifica del DNA ha sperimentato affermazioni che “non è scienza” e che minaccia la capacità dei laboratori più piccoli di portare avanti una ricerca basata su ipotesi. Nei casi passati, tali affermazioni si sono sempre dimostrate miopi. L’osservazione ripetuta è che la scienza di scoperta su larga scala fa scaturire ipotesi ad un ritmo frenetico e rivela vie di indagine che non avrebbero mai potuto essere previste. In questo senso, molte delle critiche mosse al DNA barcoding sono notevolmente simili a quelle mosse un decennio fa riguardo al progetto del genoma umano.
Il DNA barcoding ha già avuto successo nell’attrarre finanziamenti sostanziali da varie agenzie e organizzazioni che non sono state finanziatrici tradizionali della tassonomia, ma questo non è stato ottenuto vendendo “tassonomia” in sé. Invece, l’iniziativa del DNA barcoding promuove la visione di un inventario ampiamente accessibile della diversità della vita. È solo enfatizzando i benefici per la società e suscitando l’interesse del pubblico contribuente che si genererà il sostegno per un’iniziativa globale sulla biodiversità. Naturalmente, questo non significa che la tassonomia sia destinata a diventare una “industria di servizi ad alta tecnologia” per altri biologi, come alcuni hanno suggerito (ad esempio, Lipscomb et al., 2003; Wheeler, 2004; Will e Rubinoff, 2004). Uno dei principali obiettivi della codifica a barre del DNA è quello di permettere alla maggioranza dei biologi non tassonomi – e in effetti, a chiunque – di accedere direttamente alle informazioni tassonomiche, consentendo ai tassonomi professionisti di concentrarsi sulla generazione di ulteriori conoscenze.
Dichiarazione di posizione
Gli sforzi per inventariare la diversità eucariotica attraverso analisi morfologiche hanno avuto molto successo. La generazione di quasi due milioni di ipotesi tassonomiche negli ultimi 250 anni è un’impresa impressionante che ha fornito una comprensione fondamentale della diversità biologica, ma molti dettagli attendono di essere chiariti. Il DNA barcoding è posizionato per aiutare l’inventario della vita accelerando la scoperta delle specie, testando le attuali ipotesi tassonomiche e rendendo le identificazioni delle specie più facilmente disponibili. Questi contributi non saranno fatti a spese dei valori tassonomici fondamentali o dei finanziamenti. La codifica a barre del DNA non cerca di abbandonare “gli studi morfologici in favore di un sistema di identificazione stretto e interamente molecolare” (Will e Rubinoff, 2004: 47). Piuttosto, si sforza di costruire alleanze tra tassonomisti molecolari e morfologici (Hebert e Barrett, 2005). Cerca, inoltre, di preservare i principi di Linneo con cui le specie sono nominate e classificate. La codifica a barre del DNA richiede nomi di specie esistenti e morfologicamente derivati per la calibrazione, e sono questi nomi che vengono recuperati quando la codifica a barre viene usata per l’identificazione.
È generalmente accettato che lo studio della biodiversità è seriamente sottofinanziato (Godfray, 2002). Non è facile attribuire questo al tema di indagine, poiché la scienza della biodiversità è importante e attrae molto interesse pubblico. Tuttavia, quest’area di ricerca soffre di una cultura del conflitto. Piuttosto che montare grandi collaborazioni, la comunità della biodiversità ha una tradizione di polarizzazione e lotte intestine. Il DNA barcoding non è estraneo alle invettive – è stato etichettato come “tecnologia teoricamente vacua” e come “trucco da salotto” (Wheler, 2004; Will et al., 2005). L’accoppiamento di tali commenti con attacchi ad hominem contro i sostenitori del DNA barcoding porta poco credito alla disciplina.
Alcuni critici accusano l’approccio del DNA barcoding di essere fondamentalmente difettoso, ma i dati disponibili raccontano una storia molto diversa: il successo del DNA barcoding è stato finora sorprendente. Come nota Smith (2005), la codifica a barre è andata bene in un test eseguito alla conferenza PEET. Ancora più importante, una serie di studi ha ora indagato l’efficacia della codifica a barre del DNA in assemblaggi di specie provenienti da diversi contesti geografici e da numerosi gruppi tassonomici con storia della vita e caratteristiche evolutive divergenti. Come conseguenza di questi test di sensibilità, i record dei codici a barre sono ora disponibili per più di 13.000 specie animali (e si accumulano rapidamente) e rivelano una risoluzione che non è un’illusione (www.barcodinglife.org). Gruppo dopo gruppo, il successo nell’identificazione delle specie supera il 95% e i pochi casi di risoluzione compromessa riguardano l’incapacità di discriminare un piccolo gruppo di specie strettamente alleate (Hebert et al., 2004a, 2004b; Hebert et al., non pubblicato). I risultati tipici assomigliano a quelli della Figura 1, che mostra la struttura delle divergenze dei codici a barre del DNA per 31 specie di Acronicta, uno dei generi di lepidotteri più diversi del Nord America. In questo caso, non c’è evidenza della condivisione di sequenza tra i taxa che ci si aspetterebbe se si verificasse l’ibridazione o se le specie fossero troppo giovani per essere discriminate. Invece, c’è una netta separazione delle specie con coesione del codice a barre per i conspecifici anche quando derivano da siti disparati nel Nord America orientale.
Non c’è nulla di eccezionale nei risultati del codice a barre per Acronicta – studi su invertebrati del suolo dall’Artico e su lepidotteri dai tropici mostrano un successo simile nella risoluzione delle specie (Hogg e Hebert, 2004; Janzen et al., 2005). Questa performance si estende in ambienti marini: uno studio sui codici a barre che ha esaminato più di 200 specie morfologicamente definite di pesci australiani ha generato un successo del 100% nella loro discriminazione (Ward et al., 2005). I test di sensibilità attraverso gradienti di 10 volte nei tassi di evoluzione mitocondriale hanno rivelato un alto successo nell’identificazione delle specie da gruppi di insetti con entrambi i tassi di evoluzione più bassi e più alti (Ball et al., 2005; Smith et al., 2005). Gli spostamenti nella composizione nucleotidica del genoma mitocondriale non hanno un impatto simile sulla risoluzione della codifica a barre del DNA, come evidenziato dal successo in gruppi, come gli uccelli, con alta composizione G+C e altri, come i ragni, con estrema polarizzazione A+T (Hebert et al., 2004b; Barrett e Hebert, 2005).
Se questi studi passati riflettono le prestazioni generali dei codici a barre in tutto il regno animale, un sistema completo basato sulla cox1 fornirà una risoluzione tassonomica superiore al 99,99% se visto da una prospettiva a livello di regno. Per capire questo, basta immaginare ciascuna delle 10.000 fosse della Figura 2 come un deposito di dati di codici a barre di una singola specie. Supponendo che ci siano 10 milioni di specie animali, la libreria di codici a barre per questo regno potrebbe essere rappresentata da appena 1000 di queste pagine. L’avifauna globale, che consiste di circa 10.000 specie di uccelli, occuperà solo una di queste pagine. I record dei codici a barre per i pesci del mondo occuperanno tre pagine, mentre i coleotteri riempiranno diverse centinaia di pagine. Una volta che tutti i 10 milioni di pozzetti sono stati riempiti di dati di codici a barre, l’analisi di ogni nuova sequenza di codici a barre fornirà un trasporto immediato alla pagina corretta su 1000, fornendo una risoluzione del 99,9%. Infatti, sulla base dei dati per gli uccelli del Nord America, la sequenza di codici a barre fornirà una risoluzione perfetta portando a una singola fossa di specie sulla singola pagina di uccelli nel 96% dei casi. Nei casi rimanenti, il codice a barre appena raccolto corrisponderà a sequenze in due o tre fosse adiacenti. In sintesi, un breve codice a barre farà crollare l’incertezza nell’identità della specie da una qualsiasi delle 10 milioni di specie fino a una singola specie nella maggior parte dei casi, e a un piccolo sottoinsieme di specie strettamente alleate in altri casi.
Una rappresentazione grafica di una matrice che memorizzerebbe i dati del codice a barre su 10.000 specie (ad esempio, quasi tutte le specie di uccelli conosciute). Un migliaio di pagine di questo tipo ospiterebbe record di codici a barre per 10 milioni di specie. Oltre a fornire un epiteto di specie, un tale sistema fungerebbe da portale per tutte le altre informazioni raccolte su una data specie, collegandosi ad altre banche dati biologiche complete.
Una rappresentazione grafica di una matrice che memorizzerebbe i dati del codice a barre su 10.000 specie (ad esempio, quasi tutte le specie di uccelli conosciute). Un migliaio di pagine di questo tipo ospiterebbe record di codici a barre per 10 milioni di specie. Oltre a fornire un epiteto di specie, un tale sistema fungerebbe da portale per tutte le altre informazioni raccolte su una data specie, collegandosi ad altri database biologici completi.
Il finanziamento è ora in atto per garantire che la biblioteca dei codici a barre del DNA per gli animali cresca di almeno 500.000 record nei prossimi 5 anni, fornendo la copertura di circa 50.000 specie. Anche se questo sarà lontano da un registro completo delle specie, permetterà ai codici a barre del DNA di funzionare come un efficace strumento di identificazione per quei gruppi tassonomici con record completi di codici a barre. Per esempio, man mano che la copertura dei codici a barre per i pesci, gli uccelli e gli insetti nocivi si avvicina al completamento, ciò fornirà un accesso aperto all’identificazione di queste specie indipendentemente dallo stadio di vita o dalla condizione. Man mano che questo nucleo di registrazioni di specie si unirà ai codici a barre di altri animali, sorgerà un sistema di identificazione globale per questo regno della vita.
Anche se crediamo che la generalità dei codici a barre sia stata ormai dimostrata per il regno animale, rimane la necessità di stabilire e valutare protocolli di codici a barre per gli altri regni della vita. I principi fondamentali dell’analisi dei codici a barre (minimizzazione e standardizzazione dei target di sequenza) sono sicuramente applicabili a questi organismi, ma la selezione delle regioni geniche e le prove della loro efficacia sono ancora in corso, anche se i primi risultati sulle piante (Kress et al., 2005) e sui protisti (G.W. Saunders, comunicazione personale) sono motivo di ottimismo. A parte il suo successo nel separare le specie conosciute, il DNA barcoding sarà un potente aiuto per risolvere altri problemi tassonomici. Specie trascurate sono state regolarmente rivelate, anche in gruppi ben studiati come gli uccelli nordamericani (Hebert et al., 2004b), le farfalle (Hebert et al., 2004a) e le falene della seta (Janzen et al., 2005). Il suo ruolo nell’associare gli stadi di vita (Beskansky et al., 2003) e i generi (Janzen et al., 2005), e nel chiarire le sinonimie, sarà anche di aiuto in molte altre indagini tassonomiche.
L’attivazione di qualsiasi grande programma scientifico richiede non solo una forte motivazione scientifica, ma una dimostrazione di rilevanza sociale. Il DNA barcoding mostra tale rilevanza fornendo un nuovo accesso alle identificazioni in vari contesti. Gli sforzi per conservare la vita sono attualmente limitati dal bisogno di un sistema di identificazione, e noi crediamo che questo bisogno possa essere soddisfatto solo dal DNA barcoding (vedi anche Smith et al., 2005). La capacità dei codici a barre di identificare frammenti di vita ha applicazioni che vanno dalla risoluzione di casi di sostituzione di specie nel mercato (Marko et al., 2004) alla protezione della sicurezza alimentare attraverso, per esempio, lo screening dei mangimi animali per i rifiuti dei ruminanti. Più in generale, la capacità del DNA barcoding di fornire identificazioni in modo rapido ed economico ha il potenziale per rivoluzionare il rapporto dell’umanità con la diversità biologica (Janzen, 2004).
Se il DNA barcoding procede su larga scala, genererà importanti sottoprodotti per la comunità scientifica. Tutti gli estratti di DNA prodotti durante l’analisi dei codici a barre degli esemplari certificati saranno conservati, permettendo sforzi futuri per esaminare i modelli di diversità di sequenza in altre regioni genetiche, e i programmi di raccolta avviati dalla codifica a barre del DNA amplieranno gli esemplari disponibili per le analisi morfologiche. L’iniziativa del codice a barre creerà anche un sistema basato sul web che fornirà non solo identificazioni automatiche, ma anche un portale di informazioni biologiche per tutte le specie incluse nel registro. Anche se la codifica a barre del DNA non creerà l'”enciclopedia della vita”, ne genererà l’indice e l’indice dei contenuti.
A causa dei risultati scientifici positivi e dei riconosciuti benefici sociali, c’è un crescente entusiasmo per un’iniziativa di codifica a barre del DNA su larga scala. Due incontri a Cold Spring Harbor durante il 2003 hanno chiarito i piani di azione (Stoeckle, 2003), e altri incontri sono seguiti. Il più recente, ospitato dal Museo di Storia Naturale di Londra, ha attirato più di 230 ricercatori (Marshall, 2005). Il movimento dei codici a barre ha anche una forza organizzativa centrale: il Consortium for the Barcode of Life (CBOL), ospitato dalla Smithsonian Institution di Washington, che è stato lanciato a metà 2004. Più di 80 organizzazioni di 25 nazioni, tra cui molti importanti musei, hanno già aderito al CBOL(www.barcoding.si.edu). Le prime campagne globali di codici a barre sono state attivate sotto i suoi auspici; esse includono piani per codificare tutte le 10.000 specie di uccelli e tutti i 15.000 pesci marini entro il 2010. Chiaramente, il lavoro deve espandersi oltre i singoli laboratori per affrontare grandi progetti come questi, e si stanno formando reti nazionali di codici a barre per stabilire catene di fornitura di campioni e per supervisionare le strutture analitiche di base. Il primo di questi, il Canadian Barcode of Life Network, che ha visto l’attivazione nel maggio 2005 (www), intende codificare a barre almeno 10.000 specie animali canadesi nei prossimi 5 anni.
Vediamo questi segni di crescente sinergia tra i vari settori della comunità della biodiversità come estremamente promettenti. Se sviluppati al loro pieno potenziale, la storia potrebbe vedere l’impresa del DNA barcoding come una che non solo ha migliorato l’accesso alle informazioni tassonomiche, ma ha anche rafforzato le alleanze tra tutti coloro che hanno interessi nella documentazione, comprensione e conservazione della biodiversità – una prospettiva davvero eccitante.
Riconoscimenti
Ringraziamo Mark Stoeckle e Dan Janzen per i preziosi suggerimenti di revisione delle bozze precedenti di questo articolo. Siamo anche molto grati alla Gordon and Betty Moore Foundation, NSERC, CFI, e OIT per il loro sostegno alla ricerca sul DNA barcoding all’Università di Guelph.
.
,
,
, vol.
(pag.
–
)
,
,
,
.
,
,
, vol.
(pag.
–
)
,
.
,
,
, vol.
(pg.
–
)
,
,
.
,
,
, vol.
(pag.
–
)
.
,
,
, vol.
(pg.
–
)
,
.
,
,
, vol.
pag.
,
,
.
,
,
,
.
,
,
, vol.
(pg.
–
)
.
,
,
, vol.
(pag.
–
)
,
.
,
,
, vol.
(pag.
–
)
,
,
,
.
,
,
, vol.
(pg.
–
)
,
,
,
,
.
,
,
, vol.
(pag.
–
)
,
,
,
.
,
,
, vol.
(pag.
–
)
,
.
,
,
, vol.
(pg.
–
)
.
,
,
, vol.
(pag.
–
)
,
,
,
,
.
,
,
,
,
,
,
.
,
,
, vol.
(pg.
–
)
,
,
.
,
,
, vol.
(pg.
–
)
,
.
,
,
, vol.
(pg.
–
)
,
,
,
,
,
,
,
.
,
,
, vol.
(pg.
–
)
.
,
,
, vol.
pag.
,
,
,
,
,
,
.
,
,
, vol.
(pag.
–
)
.
,
,
.
,
,
, vol.
(pg.
–
)
,
,
.
,
,
, vol.
(pg.
–
)
,
,
,
,
.
,
,
.
,
,
, vol.
(pg.
–
)
,
,
.
,
,
,
.
,
,
, vol.
(pag.
–
)
Leave a Reply