Database AlphaFold si amplia per capire meglio biologia umana e sviluppare nuove cure
Sistema di IA sviluppato da Google DeepMind fa luce su interazione tra proteine
Le strutture molecolari di milioni di complessi proteici sono state aggiunte al grande database pubblico di AlphaFold, il sistema di intelligenza artificiale sviluppato da Google DeepMind per prevedere la struttura delle proteine. Questo ampio aggiornamento, focalizzato sulle molecole più rilevanti per la biologia umana e le malattie (compresi i batteri considerati prioritari dall'Organizzazione mondiale della sanità), punta ad accelerare la ricerca scientifica contribuendo ad affrontare le grandi sfide sanitarie a livello globale. Il risultato è frutto di una collaborazione internazionale con l'Istituto europeo di bioinformatica del Laboratorio europeo di biologia molecolare (Embl-Ebi), Nvidia e l'Università nazionale di Seul in Corea del Sud. Questo è il primo passo di un ambizioso progetto che mira ad aggiungere un'ampia gamma di previsioni sulla struttura dei complessi proteici al database AlphaFold. La collaborazione ha già calcolato previsioni per 30 milioni di complessi. Di questi, 1,7 milioni di previsioni di omodimeri (ovvero complessi proteici formati da due proteine ;;identiche) ad alta affidabilità sono state aggiunte al database. Altri 18 milioni sono omodimeri a minore affidabilità, disponibili in un elenco e per il download in blocco. I restanti sono eterodimeri (ovvero complessi proteici formati da subunità diverse), attualmente in fase di analisi e valutazione. Nei prossimi mesi verranno calcolate ulteriori previsioni di complessi proteici e verranno aggiunte al database AlphaFold previsioni ad alta affidabilità. Il lavoro è descritto in modo più dettagliato in un articolo non ancora sottoposto a revisione fra pari (preprint). "Il genoma umano contiene poco più di 20.000 proteine ;;diverse", spiega Dame Janet Thornton, direttrice emerita dell'Embl-Ebi. "Nonostante questo genoma relativamente piccolo, gli esseri umani presentano vie biologiche, processi e meccanismi di regolazione incredibilmente complessi". L'aggiornamento del database AlphaFold "rappresenta un primo passo verso una descrizione completa dell'interattoma umano", cioè l'insieme di tutte le interazioni molecolari che avvengono nell'organismo, "la base su cui verrà descritta e compresa la biologia umana. Ciò - continua Dame Janet Thornton - ha rilevanza per la progettazione di nuove terapie, la comprensione delle interazioni ospite-patogeno e altro ancora. Rendere queste strutture accessibili a tutti permette a ogni ricercatore del mondo di basarsi su questi dati, facendo un passo avanti verso la previsione della biologia della vita".
A.M.Owen--TNT