SCIENZA E RICERCA

AlphaFold3: accelerazione scientifica e questioni etiche

Lo scorso 8 maggio un fremito ha percorso la comunità di chi usa l’intelligenza artificiale (IA) per andare a caccia di nuove molecole. Quel giorno, infatti, la rivista Nature ha pubblicato un paper che riportava l’arrivo di una nuova versione di AlphaFold, un programma in grado di prevedere la struttura tridimensionale delle proteine. A svilupparlo è DeepMind, l’azienda inglese specializzata in deep learning che dal 2014 è controllata da Google.

AlphaFold, per la precisione AlphaFold1, aveva fatto molto parlare di sé nel 2018 quando si è piazzato al primo posto della Critical Assessment of Structure Prediction (CASP), una competizione tra gruppi che utilizzano l’intelligenza artificiale e il deep learning per individuare la struttura tridimensionale delle proteine. Due anni più tardi, AlphaFold2 sbaraglia nuovamente la concorrenza alla quattordicesima edizione di CASP con un punteggio di accuratezza pari al 92,4%. Un risultato che aveva fatto dire a John Moult, uno dei fondatori di CASP, che l’algoritmo vincitore aveva «risolto un problema vecchio di cinquant’anni, che non avrei mai pensato di vedere risolto durante la mia vita». 

In un contesto di continua accelerazione delle tecnologie digitali, il paper di Nature annuncia AlphaFold3, la nuova versione del programma, presentato come un “importante aggiornamento di AlphaFold che farà accelerare la scoperta di nuovi farmaci”. In effetti, la novità è importante, come ci spiega Alessandro Laio, docente alla Scuola Internazionale Superiore di Studi Avanzati (SISSA) di Trieste e da anni coinvolto nello sviluppo di algoritmi che sfruttano tecnologie simili a quelle usate da AlphaFold: “Oltre a offrire un miglioramento significativo della previsione, AlphaFold3 permette di studiare le proteine in azione assieme ad altri partner”. In pratica, non si può solamente studiare la singola proteina, ma il suo comportamento in relazione ad altri composti con i quali interagisce. “Si tratta”, sottolinea Laio, “di andare al cuore della biologia molecolare”.

Non avere a disposizione il codice sorgente è un po’ come aver a che fare con una scatola nera che non posso aprire Alessandro Laio

Open Access, ma non accessibile

La pubblicazione del paper su Nature ha generato molte reazioni all’interno della comunità di riferimento. Ovviamente ci sono coloro che sottolineano il passo avanti della tecnologia, ma c’è anche chi ha storto il naso perché il codice sorgente di AlphaFold3 non è disponibile. Mentre l’articolo che descrive in modo qualitativo il programma è pubblicato in open access, il codice non è stato messo a disposizione. Il risultato è che praticamente nessuno l’ha potuto vedere e testare. Si tratta di una situazione analoga a quella che si ritrova nel caso di altri programmi, che non mettono a disposizione il codice.

“Non avere a disposizione il codice sorgente”, spiega Laio, “è un po’ come aver a che fare con una scatola nera che non posso aprire”. Possiamo comunque dargli in pasto degli input e vedere che risultati si ottengono, ma non sappiamo in che modo vengono raggiunti. Per esempio, un gruppo di ricercatori e ricercatrici capitanate da Stephanie Wankowicz, una biologa computazionale dell’Università della California a San Francisco, ha pubblicato già l’11 maggio scorso una lettera aperta in cui sottolineavano che questa pratica “non è in linea con i principi del progresso scientifico, che si basano sulla capacità della comunità di valutare, utilizzare e sviluppare il lavoro esistente”. Rapidamente la lettera ha raccolto centinaia di firme tra la comunità scientifica.

 

Interessi economici

Dal punto di vista di DeepMind, rendere disponibile il codice sorgente di AlphaFold3 significa perdere il nocciolo del proprio business model, che si basa sul pagamento per accedere alla tecnologia. Questo approccio, però, sembra in contraddizione con l’idea che la scienza sia un’impresa basata sulla possibilità di costruire conoscenza a partire dal lavoro e dai risultati di tutta la comunità. In questo caso, almeno, sembra che si possa fare solo se si ha una certa disponibilità economica. 

Anche Nature è un attore privato e ha tutto l’interesse a pubblicare un articolo qualitativo su AlphaFold3 senza che sia disponibile il codice. Ma una fetta della comunità dell’IA internazionale, come ci conferma Laio, sostiene che il codice dovrebbe essere disponibile per motivi etici. In realtà, la rivista ha un interesse economico a pubblicare un paper controverso: il polverone che si è sollevato contribuisce ad aumentare le citazioni del paper stesso, oltre che del marchio Nature.

 

Se le Big Tech drenano i migliori talenti, chi forma i talenti del futuro? Alessandro Laio

Problemi a medio e lungo termine

Alessandro Laio, però, sottolinea un altro aspetto, meno evidente, del modello di business dei grandi colossi dell’IA come Google, Microsoft e OpenAI. Al momento stanno raccogliendo dalle università di tutto il mondo i migliori cervelli offrendo loro salari molto più alti di quelli che le istituzioni pubbliche possono offrire. “C’è proprio un ordine di grandezza di differenza”, spiega Laio, “per fare sostanzialmente lo stesso lavoro”. Questo modello di sviluppo aziendale, però, potrebbe conoscere un arresto piuttosto brusco nei prossimi anni. Se i migliori talenti escono dalle università per lavorare nel privato, “chi forma i talenti del futuro?”, si chiede Laio.

Negli ultimi anni, però, si è visto sempre più spesso l’intervento delle grandi aziende, non solo quelle tech, nel finanziare programmi di dottorato o ricerca nelle università. Magari con il vincolo di sfruttarne poi i risultati nell’azienda finanziatrice. Ma non è da escludere che in un prossimo futuro Google e compagnia si creino direttamente le proprie università, ovvero le proprie fucine di talenti. A quel punto però, in settori disciplinari come questo, esisterà ancora una forma di ricerca pubblica liberamente accessibile?

 

© 2018 Università di Padova
Tutti i diritti riservati P.I. 00742430283 C.F. 80006480281
Registrazione presso il Tribunale di Padova n. 2097/2012 del 18 giugno 2012