Il 26 giugno del 2000 l'allora presidente statunitense Bill Clinton e il primo ministro inglese Tony Blair annunciavano congiuntamente che la prima “bozza” di genoma umano era stata generata. Il genoma umano era stato interamente mappato per la prima volta nella storia. Il risultato era di quelli epocali: si sarebbero spalancate le porte a nuovi studi per comprendere la nostra fisiologia, la nostra evoluzione, per curare malattie con una forte componente genetica. Nature nel febbraio 2001 pubblicò i dati prodotti dal consorzio internazionale Human genome project (Hgp), lanciato nel 1990 e finanziato per oltre 3 miliardi di dollari principalmente dal Nih (National institute of health) e dal dipartimento dell'energia del governo statunitense. Science invece pubblicò i risultati di un'azienda privata che nel 1998 aveva lanciato un progetto analogo e parallelo: era la Celera Genomics di Craig Venter. Il sequenziamento del genoma umano fu poi completato dallo Human Genome Project il 14 aprile 2003 e pubblicato nell'ottobre 2004, mentre nel maggio 2006 Nature pubblicava la sequenza dell'ultimo cromosoma, il cromosoma 1, il più lungo delle 23 coppie di cromosomi presenti nei nuclei delle nostre cellule: contiene infatti circa 249 milioni di nucleotidi, l'8% del nostro DNA totale.
I nucleotidi (G=guanina, A=adenina, C=citosina, T=timina; l'Rna contiene U=uracile al posto di T) sono le “lettere” che formano le istruzioni per far funzionare il nostro organismo e si danno in coppia: G sta C e A sta con T (o con U). Il nostro DNA conta più di 3 miliardi di coppie di basi nucleotidiche.
“ L'intero genoma di una cipolla conta circa 16 miliardi di paia di basi, più di 5 volte la misura del genoma umano
Alcune sequenze di lettere vengono chiamate geni. Ciò che caratterizza un gene è “avere una funzione”. Si dice infatti che i geni “codificano per una proteina”, ovvero esprimono le istruzioni per costruire i mattoncini fondamentali del nostro corpo, le proteine appunto, le unità funzionali del nostro organismo che svolgono i più svariati compiti, dalle funzioni metaboliche al trasporto di molecole da un luogo all'altro.
Oggi si stima che solo il cromosoma 1 contenga circa 2000 geni funzionali (codificanti per proteine). Il cromosoma 21 invece è circa 6 volte più piccolo e ne contiene circa 250. Nel 1990, al lancio dello Human Genome Project, ci si attendeva che il sequenziamento del genoma umano avrebbe rivelato all'incirca 100.000 geni. Siamo un organismo complesso, si diceva, dunque dovremmo avere tanti geni.
I primi risultati dello Hgp furono sorprendenti: le prime stime attestarono che gli umani hanno tra i 30.000 e i 40.000 geni funzionali. Il che equivaleva a dire che il genoma umano è solo due volte più grande di quello di un verme o di un moscerino. Le analisi successive abbassarono ancora la quota, fino a fissare un totale di circa 20.000 geni. Ma c'è di più. L'intero genoma (codificante e non) di una cipolla conta circa 16 miliardi di paia di basi, più di 5 volte la misura del genoma umano (3 miliardi di paia di basi). Cosa se ne fa una cipolla di tutto questo DNA?
Andiamo con ordine. Le stime che attendevano circa 100.000 sequenze codificanti (geni funzionali) erano supportate da una sorta di weltanschauung (visione del mondo) genetica secondo cui a un gene corrisponde una proteina. Uno vale uno.
A questa idea del livello microscopico, genetico, se ne associava una a livello macroscopico, evolutivo. I geni sono i portatori delle novità evolutive e la selezione naturale, il principale tra i processi evolutivi, agisce nel tempo sui singoli geni, eliminandoli dalla popolazione laddove deleteri, favorendone la diffusione laddove vantaggiosi. Gli esseri umani sono organismi complessi, si è detto, diversi ed evolutivamente “nuovi” rispetto ai loro cugini primati, e in quanto tali dovrebbero avere tanti geni che riflettano questa identikit evolutiva.
Com'è allora che vengono trovati “così pochi” geni funzionali nel sequenziamento del nostro DNA?
Anche grazie ai risultati dello Hgp, l'idea per cui la complessità di un organismo sia rappresentata dal numero di geni o dal numero di basi nucleotidiche del suo DNA ha lasciato spazio all'idea secondo cui non sia il numero assoluto che conti, bensì il modo in cui questi geni sono organizzati e come interagiscono tra loro. Già a partire dalla seconda metà del '900 la biologia evoluzionistica dello sviluppo (evo-devo) si è occupata di comprendere queste complesse interazioni nel corso dello sviluppo individuale di un organismo. Più di recente invece, l'epigenetica si sta occupando di studiare i sistemi di regolazione, lettura ed espressione del DNA. Il focus quindi si sposta dalla mappatura dei geni, al modo in cui si comportano questi geni.
Un recente studio, pubblicato online su bioarXiv, si è occupato di rifare la conta dei geni umani, fissando a 21.306 il numero di geni codificanti per proteine. Lo stesso studio trova anche che sono altrettante, 21.856, le sequenze di DNA che non codificano per proteine. La porzione di DNA non codificante è però enormemente più vasta, in termini di numero di paia di basi, rispetto a quella codificante: 98% il DNA non codificante, 2% quello codificante. Che ruolo svolge dunque questa larghissima porzione di DNA “non funzionale”?
In gergo viene chiamata junk DNA e tutti gli organismi del regno animale ce l'hanno. Il termine fu coniato dal genetista Susumu Ohno nel 1972 per indicatre quelle sequenze che non codificano per proteine e caratterizzate da segmenti di lettere che si ripetono casualmente nel genoma. Molti di questi segmenti si sono generati per opera dei trasposoni, tratti di DNA che, nel corso della trascrizione, saltano da un posto all'altro del genoma, operando un copia e incolla genetico. A lungo questo DNA “spazzatura” ha goduto di pessima fama ed è stato ignorato dai ricercatori, fino almeno agli anni '90. Oggi si sa che le regioni di DNA non codificante, junk DNA, rappresentano una preziosa risorsa per il genoma, una sorta di magazzino da cui andare ad attingere materiale che consente la ricombinazione genetica, una delle fonti principali di mutazioni genetiche e di novità evolutive.
Nel 2012 sono stati pubblicati i risultati di un'altra collaborazione internazionale di ricerca finanziata dalla National Human Genome Research Institute (Nhgri): il progetto ENCODE (Encyclopedia of DNA Elements). L'obiettivo era quello di generare una lista di tutti gli elementi funzionali del genoma. I ricercatori coinvolti trovarono che l'80% del genoma umano conteneva elementi definiti funzionali. Un simile risultato era in aperta contraddizione con quanto fino ad allora si sapeva. Molti scienziati esterni al progetto hanno criticato la definizione troppo inclusiva di “funzione” che il progetto Encode adottava: venivano considerate funzionali infatti anche quelle sequenze che pur non codificando per proteine svolgevano un ruolo nei meccanismi regolatori di espressione genica.
“ Il riciclo è uno dei meccanismi fondamentali della natura e questo principio vale anche per l'evoluzione
Ancora oggi non esiste un consenso unanime tra gli scienziati sulla definizione di funzione genetica e di conseguenza su quali siano gli elementi funzionali del genoma. Il genetista Dan Graur (ospite a Padova per una Special lecture on evolution nel gennaio 2017), in un articolo pubblicato nel 2015, parlando del DNA non codificante propone una distinzione fondamentale tra junk DNA e garbage DNA. In italiano tradurremmo entrambi i termini con “spazzatura”, ma l'inglese permette una sottile distinzione: mentre garbage indica proprio l'immondizia che gettiamo nei cassonetti, junk può essere inteso come l'oggetto che stipiamo in garage, in cantina o nel sottoscala, magari una vecchia lampada impolverata che andiamo a recuperare e collegare alla spina quando si fulmina la lampadina del comodino.
Ecco dunque il ruolo del DNA non codificante: oltre talvolta a interagire con quello codificante svolgendo compiti “regolatori” o “strutturali” nelle operazioni di trascrizione (funzioni epigenetiche), costituisce un'importante riserva di materiale genetico.
Il riciclo è uno dei meccanismi fondamentali della natura e questo principio vale anche per l'evoluzione. Un genoma è un'entità viva che cambia nel corso del tempo. Anche noi essere umani non siamo altro che variazioni sul tema di organismi che prima di noi hanno accumulato materiale genetico, che hanno usato queste sequenze di DNA per sopravvivere e vivere nella loro nicchia ecologica e che hanno sviluppato nuove mutazioni. Alcune di queste sono state selezionate positivamente, cioè impiegate nel gioco della vita; altre mutazioni sono state eliminate nel corso delle generazioni; e altre ancora, molte, semplicemente sono state messe in soffitta. Di spazio fortunatamente ce n'è e chi lo sa, un domani, come potranno tornare utili.